Informacija

GUG pradžios kodonas E. coli: inicijuojančios tRNR tapatumas ir vertimo efektyvumas

GUG pradžios kodonas E. coli: inicijuojančios tRNR tapatumas ir vertimo efektyvumas


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Vertimas į E. coli paprastai inicijuojamas AUG kodonu, koduojančiu aminorūgštį metioniną. Tačiau kai kuriais atvejais pradžios kodonas yra GUG, kuris paprastai koduoja valiną. Jei GUG naudojamas kaip starto kodonas, ar naudojama metioninu įkrauta tRNR, ar įkrauta valinu, ir ar GUG kaip pradžios kodono naudojimas turi įtakos vertimo efektyvumui?


NCBI vertimo lentelėje visos alternatyvios pradžios vietos verčiamos kaip metioninai. Mano supratimu, visą vertimą inicijuoja fMet-tRNR. Nežinau, ar yra šios taisyklės išimčių.

Kalbant apie vertimo efektyvumą, PNAS radau tik 1985 m. straipsnį (Reddy ir kt., PNAS 82:5656-60), kuriame jie palygino paties adenilato ciklazės UUG starto ir GUG arba AUG vertimo efektyvumą ir gavo vertimo santykį 1:2. :6 UUG:GUG:AUG, o tai rodo, kad AUG yra efektyviausias, po to seka GUG. Be to, Romero ir Garcia, FEMS mikrobiologijos laiškai 84:325-330 (1991), palygino AUG ir AUC, AUA ir AUU efektyvumą, parodydami daug mažesnį šių kodonų efektyvumą, tačiau jie nepalygino jo su GUG.


Konkurencija tarp vertimo inicijavimo faktoriaus eIF5 ir jo imituojančio baltymo 5MP lemia ne AUG inicijavimo greitį genomo mastu

Leimingas Tangas, Jacobas Morrisas, Ji Wan, Chelsea Moore, Yoshihiko Fujita, Sarah Gillaspie, Ericas Aube, Jagpreet Nanda, Maud Marques, Maika Jangal, Abbey Anderson, Christian Cox, Hiroyuki Hiraishi, Leiming Dong, Hirohide Saito, S Chingakham Ranji Witcher, Ivan Topisirovic, Shu-Bing Qian, Katsura Asano, Konkurencija tarp vertimo inicijavimo faktoriaus eIF5 ir jį imituojančio baltymo 5MP lemia ne AUG inicijavimo greitį genomo mastu, Nukleino rūgščių tyrimai, 45 tomas, 20 leidimas, 2017 m. lapkričio 16 d., 11941–11953 puslapiai, https://doi.org/10.1093/nar/gkx808


2018 m. vasario 27 d., antradienis

Publikacijos – kaip gauti citatų duomenų rinkinį su viso teksto straipsniais PDF formatu?

Atlieku teksto gavybos tyrimus. Tam man reikia duomenų rinkinio, kuriame būtų tiriamųjų straipsnių pilno teksto PDF failai, o visi straipsniai turi būti susiję vienas su kitu citavimo požiūriu. Yra šaltinių tinklo duomenų rinkinių, kuriuose yra tik straipsnių metaduomenys, bet kartu noriu ir tų viso teksto straipsnių PDF formatu.

Ką turėčiau daryti, kad gaučiau tokį duomenų rinkinį?

Pažymiai – Kodėl priėmimo komisija turi peržiūrėti visą pažymą?

Priėmimo komitetai peržiūri visą studento nuorašą, kad suprastų jų akademinius gebėjimus. Kodėl neužtenka vertinti studento akademikų remiantis vien GPA?


Įvadas

Vertimo inicijavimas bakterijose ir eukariotuose vyksta pagal skirtingas taisykles. Bakterijų iniciacijos kodonus paprastai atpažįsta 30S ribosomų subvienetas, naudojant ribosomų surišimo motyvą, purinų turtingą Shine-Dalgarno (SD) seką, papildančią mažo ribosomų subvieneto RNR 3′ galūnę (15 ir nuorodos joje). . Eukariotuose mRNR neturi SD sekų, todėl manoma, kad iniciacijos kodonų atpažinimas atitinka „ribosomų skenavimo“ modelį (15 16), pagal kurį 40S subvienetai, padedami kelių baltymų faktorių, jungiasi prie dangteliu 5′ mRNR gale arba šalia jo ir vėliau seką „nuskaito“ link 3′ galo, kol bus aptiktas iniciacijos kodonas. Pastarasis paprastai yra pirmasis AUG bet kuriame galimame skaitymo rėmelyje. Be to, bakterijos ir eukariotai turi skirtingus vertimo inicijavimo faktorių rinkinius, iš kurių tik kai kurie yra bendri abiem sritims (17).

Labai mažai žinoma apie transliacijos iniciacijos būdą Archėjoje. Archealinės mRNR yra struktūriškai panašios į bakterines, dažnai pasitaiko policistroninių transkriptų, kurių iniciacijos kodonai dažnai (nors ne visada) yra prieš SD panašius motyvus (1 11 3). Tačiau ar SD motyvai tikrai reikalingi transliacijai inicijuoti, niekada nebuvo išbandyta eksperimentiškai. Be to, atrodo, kad kai kuriose Archėjose yra didelė dalis mRNR, kurioms visiškai trūksta 5′ netransliuojamo regiono (5′-UTR) (24), kurių vertimas akivaizdžiai negali priklausyti nuo SD sekos atpažinimo. Galiausiai, Archaea turi sudėtingesnį inicijavimo faktorių komplektą nei bakterijos, o pastarosios naudoja tik tris inicijavimo faktorius (IF1, IF2 ir IF3) ( 13 ), o Archaea, bent jau remiantis genomo analize, naudoja daugiau nei 10 ( 11 3), įskaitant eukariotų iniciacijos faktorių eIF5A, eIF4A ir eIF2 homologus, trimerinį baltymą, kuris, matyt, turi tą pačią funkciją kaip ir bakterinis IF2, bet visiškai nesusijęs su juo tiek seka, tiek struktūra. Dėl šių stebėjimų buvo spėjama, kad vertimo inicijavimas Archėjoje gali turėti unikalių bruožų ir kai kuriais aspektais netgi gali būti panašus į eukariotinį procesą (11 17, 18). Tačiau iki šiol eksperimentiniai tyrimai šia tema gerokai atsiliko nuo teorinių prielaidų ir evoliucinių spėlionių.

Šiame darbe mes išsamiai išanalizavome jo pobūdį cis- veikiantys signalai, kontroliuojantys vertimo inicijavimo vietų atpažinimą itin termofiliniame archeone Sulfolobus solfataricus. Šiuo tikslu mes ištyrėme bicistroninės mRNR vertimą sistemoje be ląstelių, kuri leidžia tiksliai dekoduoti Sulfolobusas natūralių mRNR, kurių temperatūra artima fiziologinei (23). Mes nustatėme, kad vertimas buvo inicijuotas S. solfataricus yra griežtai kontroliuojamas SD motyvų, kurių buvimas buvo būtinas abiejų cistronų ekspresijai tiriamoje mRNR. Kitų determinantų, tokių kaip iniciacijos kodonas, įtaka buvo kintama ir priklausė nuo geno ir jo padėties mRNR. Galiausiai SD sekų mutacijų sukeltas transliacijos blokas gali būti pašalintas visiškai ištrinant 5′-UTR. Tai rodo, kad iniciacija „be lyderio“ veikia naudojant unikalų mechanizmą, kuris skiriasi nuo „įprastos“ iniciacijos, kuris gali būti evoliuciškai senas ir bendras visoms trims pagrindinėms gyvenimo sferoms.


Padėkos

Dėkojame J. Que už R26-Sox2-IRES-eGFP pelėms, D. Xu ir Cornell Genomics Facility sekvenavimo palaikymui, Rockefeller Proteomics Facility baltymų/peptidų analizei, Fuchso laboratorijos nariai diskusijoms ir L. Polak ir M. Sribour už paramą auglių atsiradimo tyrimams. Dėkojame E. Heller už bioinformatikos palaikymą, L. Calviello už paramą su RiboTaper ir F. Garcia-Quiroz ir M. Jovanovic už kritišką rankraščio skaitymą. Rokfelerio universiteto proteomikos išteklių centras pripažįsta finansavimą iš Leona M. ir Harry B. Helmsley Charitable Trust ir Sohn Conferences Foundation masių spektrometro prietaisams. Čia paskelbti rezultatai iš dalies pagrįsti duomenimis, gautais TCGA tyrimų tinklo (//cancergenome.nih.gov/). A.S. buvo remiama Human Frontier Science Program Organization (HFSP, LT000639-2013), o šiuo metu remiama iš Europos Sąjungos Septintosios bendrosios programos 7BP programos Žmonės (Marie Curie veiksmai) pagal REA dotacijos sutartį Nr. 629861. S.N. yra Damon Runyon narys (DRG-2183-14). B.H. buvo paremta medicinos mokslininkų mokymo programos dotacija iš Nacionalinių sveikatos institutų Nacionalinio bendrųjų medicinos mokslų instituto, suteikimo numeriu T32GM007739 Weill Cornell / Rockefeller / Sloan-Kettering trijų institucijų MD-PhD programai. E.F. ir J.S.W. yra Howardo Hugheso medicinos instituto tyrėjai. Šis darbas buvo paremtas dotacijomis E.F. iš Nacionalinių sveikatos institutų (R37-AR27883) ir NYSTEM CO29559.


Autoriaus informacija

Dabartinis adresas: Cancer research UK London Research Institute, Clare Hall Laboratories, South Mimms, Hertfordshire, EN6 3LD, JK

Dabartinis adresas: JAV Žemės ūkio departamentas, Žemės ūkio tyrimų tarnyba, SEPRL, 934 College Station Road, Atėnai, Džordžija, 30605, JAV

Dabartinis adresas: Anestezijos skyrius, Kalifornijos universitetas, San Franciskas, Kalifornija, 94143, JAV

Dabartinis adresas: Berklio sintetinės biologijos centras, Kalifornijos universitetas, 717 Potter St., Berkeley, California, 94720-3224, JAV

Filialai

Molekulinės ir ląstelių biologijos ir chemijos katedros, Kalifornijos universitetas, Berklis, 94720, Kalifornija, JAV

Barbara S Schuwirth, Cathy W Hau, Jamie H Doudna Cate ir Antón Vila-Sanjurjo

Mikrobiologijos katedra, Majamio universitetas, Oksfordas, 45056, Ohajas, JAV

J Michael Day ir Gary R Janssenas

Brauno universiteto Molekulinės biologijos, ląstelių biologijos ir biochemijos katedra, Providence, 02912, Rodo sala, JAV

Physical Biosciences Division, Lawrence Berkeley National Laboratory, Berkeley, 94720, Kalifornija, JAV


1. Standartinis kodas (transl_table=1)

Pagal numatytuosius nustatymus visi „transl_table“ „GenBank“ failai yra lygūs 1 ID, ir tai yra ne parodyta. Kai transl_table nėra lygus id 1, jis rodomas kaip CDS funkcijos kvalifikatorius.

Iniciacijos kodonas:

Alternatyvūs iniciacijos kodonai:

Retais atvejais vertimas eukariotuose gali būti inicijuotas iš kitų kodonų nei AUG. Gerai dokumentuotas atvejis (įskaitant tiesioginį baltymų sekos nustatymą) yra grybelio ribosominio P baltymo GUG pradžia.

Kitų pavyzdžių galima rasti šiose nuorodose: Peabody 1989 Prats et al. 1989 Hann ir kt. 1992 Sugihara ir kt. 1990. Standartinis kodas šiuo metu leidžia inicijuoti ne tik AUG, bet ir UUG ir CUG.
Atgal į viršų


DISKUSIJA

HigBA TA sistema yra būtina kanamicinui atsparios Rts1 plazmidės plazmidės palaikymui (19). Pažymėtina, kad nors E. coli K12 chromosomoje yra tik a higA homologas, jo patogeniniai giminaičiai E. coli CFT073 ir E. coli Atrodo, kad O157:H7 turi vieną ar daugiau viso modulio kopijų (20). Tiesą sakant, daugelio patogeninių bakterijų chromosomose yra viena ar daugiau aukštasBA moduliai, tai taip pat galioja daugeliui bakterijų, kurių augimo greitis yra lėtas arba būdingas ilgas ramybės periodas (20). Siekdami geriau suprasti, kaip šis toksinas sukelia mRNR skaidymą, kartu blokuoja baltymų sintezę ir sustabdo augimą (21, 22), mes nustatėme, kad ribosomų-HigB kompleksas nukreipia aktyviai išverstą mRNR skilimui A turtingose ​​sekose. HigB supjausto 100 % kadre esančių ir už kadro nepriklausančių AAA sekų mRNR koduojančiose srityse (įskaitant pirmąsias tris AAA iš 4 ar daugiau As ruožų). HigB taip pat išpjauna AA sekas, bet daug mažesniu efektyvumu (20 %) ir tik retkarčiais supjausto vieną As.

Konjugacinė Rts1 plazmidė buvo gauta iš klinikinio izoliato Proteus vulgaris (33). Turimų kodono naudojimo duomenų analizė P. vulgaris (323 koduojančios sritys, kurių daugumą sudaro Rts1 plazmidės genai) atskleidė, kad HigB suskyla ties tiksline seka, kuri atitinka labiausiai paplitusią kodoną AAA (lizinas 41,0/1000 kodonų). Antrame dažniausiai pasitaikančiame kodone GAA (glutamo rūgšties 38,3/1000 kodonų) taip pat yra AA HigB skilimo vieta.

Tačiau Rts1 taip pat gali replikuotis Proteus mirabilis (34), kuris sukelia daugumą Proteusas šlapimo takų infekcijos. Viso genomo kodono naudojimo duomenų analizė P. mirabilis atskleidė, kad HigB suskaldo pagal tikslinę seką, kuri atitinka antrą pagal dažnumą kodoną AAA, koduojantį liziną (46,5/1000 kodonų). P. mirabilis genomo (leucinas yra dažniausiai naudojamas kodonas 48,6/1000 kodonų). Nors leucinas taip pat yra labiausiai paplitęs kodonas E. coli K12 (52,82/1000 kodonų), AAA yra mažesniu dažniu (33,62/1000 kodonų) nei P. mirabilis.

Nors visa genomo seka P. vulgaris nebuvo pranešta, jame yra daug AT (61 %) (35), kaip ir genome P. mirabilis (taip pat 61 % AT) (36). Palyginimui, E. coli K12 genome yra mažesnis AT kiekis (49%) (37). Įdomu, kad seka P. mirabilis padermė turi plazmidę, kuri skiriasi nuo Rts1, pažymėta pH4320. AAA lizinas yra ne tik labiausiai paplitęs kodonas šioje plazmidėje, bet ir beveik dvigubai didesnis nei jo šeimininko genomas (76,3/1000 kodonų). Galbūt Rts1 prisitaikė turėti atrankinį pranašumą, kai a Proteusas padermė turi ir Rts1, ir pHI4320 plazmidžių, kad bet koks laisvas HigB selektyviai skaidytų savo konkurentės plazmidės mRNR. Tiksliau, jei išgydomas tik Rts1, likęs stabilus HigB toksinas ne tik suardytų šeimininko mRNR, jis taip pat turėtų dar efektyviau skaidyti konkurentinę plazmidę, užtikrinant Rts1 išlaikymo pranašumą, palyginti su pHI4320. Apibendrinant, šie duomenys rodo, kad HigB skilimo vieta išnaudoja savo šeimininko Achilo kulną (t.y. A turtingos sekos tiek kadre, tiek už kadro), kad maksimaliai padidintų jo stiprumą, kai dėl sąlygų plazmidė netenka ir reikalauja žudymo po segregacijos.

Studijos in E. coli K12 taip pat susiejo AAA kodono buvimą +2 su dideliu vertimo inicijavimo efektyvumu (38, 39). AAA taip pat yra labiausiai paplitęs kodonas esant +2, atstovaujamas � % visų E. coli K12 mRNR, turinčios AUG arba GUG pradžios kodonus (39). Purino turinčios sekos, ypač turinčios daug adenino, koreliuoja su vienos grandinės sritimis 16S rRNR (40). Taigi didesnis transliacijos efektyvumas, kai A turtingos sekos randamos 3′ nuo transliacijos pradžios vietos, gali būti dėl to, kad nėra antrinės mRNR struktūros. Didelis AT kiekis P. vulgaris ir P. mirabilis genomai rodo, kad šiose padermėse mRNR pradžioje taip pat gali būti didesnis nei vidutinis AAA kodonų skaičius. Tiesą sakant, mes ištyrėme 100 atsitiktinių atvirų skaitymo kadrų iš P. mirabilis genomo ir nustatė dar didesnį AAA procentą (17%) esant +2 nei E. coli K12. Todėl HigB veikia keliuose jam būdingų AT turtingų šeimininkų ląstelių lygiuose. Pirma, jis nukreipiamas į vieną iš gausiausių savo ląstelės šeimininkės kodonų (AAA), kad būtų skilimas. Antra, jis taip pat suskaido visas AAA turinčias sekas nepriklausomai nuo kadro. Trečia, jis suskaido specifinius AA (�% viso) ir retkarčiais skaido konkrečius atskirus AA. Ketvirta, nukreipimas į labai išreikštas mRNR, turinčias AAA esant +2, gali padidinti HigB stiprumą. Kartu šis daugiapakopis mechanizmas užtikrina greitą ir veiksmingą šeimininkų, kurie praranda Rts1 plazmidę, žudymą po segregacijos.

HigB molekulinio mechanizmo analizė užbaigia visų keturių reprezentatyvių RelE šeimos narių apibūdinimą taip: RelE, YafQ ir YoeB iš E. coli K12 ir HigB iš Rts1 plazmidės. Visi keturi šeimos nariai veikia per ryšį su 50 S ribosomų 70 S ribosomos subvienetu. Tačiau kiekvienas iš jų sukelia toksiškumą per skirtingus mechanizmus. YafQ turi ribonukleazės aktyvumą in vitro ir in vivo bet įgyja nuo rėmo priklausomą, sekos specifinį aktyvumą tik susijungus su ribosoma in vivo (14). HigB įgyja ribonukleazės aktyvumą tik susijungęs su ribosoma ir suskaido jos atpažinimo sekas, kai verčiamos mRNR tiek rėmelyje, tiek už jos ribų. Priešingai, nei vien RelE, nei YoeB nerodo endoribonukleazės aktyvumo in vitro (13, 15), o mRNR skilimas yra tik antrinis YoeB sukeltam transliacijos inicijavimo slopinimui. in vivo (15). The in vivo mRNR skilimo aktyvumas, susijęs su RelE, buvo susijęs su ribosomos endonukleolitiniu aktyvumu (32).

Siūlome tokį HigB tarpininkaujamo posegregacinio žudymo modelį (7 pav.). Kadangi dokumentavome HigB sukeltą skilimą per visą mRNR ilgį (žr. 4 pav. H), atrodo, kad HigB yra susijęs su aktyviu 70 S ribosomų perkėlimu per 50 S ribosomų subvienetą. HigB taip pat gali susieti su 50 S ribosomų subvienetu, nes jis surenkamas į 70 S monosomą, remiantis toliau pateikta informacija. 1) Jis gali suskaldyti mRNR labai anksti, antrajame kodone lpp (4 pav G) ir 2) taip pat buvo aptikta 50 S frakcijoje 10 m m Mg 2+ profiliuose (3 pav. C). Atrodo, kad HigB sąveika su ribosomomis sukelia alosterinį HigB pokytį, kuris suaktyvina jo vietai būdingą endoribonukleazės aktyvumą. Tada HigB keliauja su verčiančia ribosoma ir suskaido mRNR, kai pasiekia pirmąją pagrindinę ar mažesnę A turtingą konsensuso seką, tačiau mūsų duomenys neleidžia atskirti, ar HigB suskyla pirmoje pasiektoje konsensuso vietoje, ar vėlesnėse. Šis platus skilimas lemia greitą mRNR skaidymą ir transliacijos pailgėjimo slopinimą. Dėl to tmRNR sistema, skirta gelbėti sustingusias ribosomas, yra perpildyta, todėl ribosomų perdirbimas vyksta lėčiau, o tai rodo atkuriamai didesnė 70 S smailė (mes siūlome, kad sustingusios ribosomos), taip pat HigB buvimas disome frakcijoje 3 pav. C (nes ribosomos be surišto HigB negalės toliau transliuoti už sustingusios ribosomos HigB pjūvio vietoje). Didelis AT kiekis Proteusas šeimininko genomai nepaprastai papildo bendrą HigB veikimo mechanizmą ir gali rodyti panašų prisitaikymą prie chromosomų HigB analogų.

Funkcijos HigB-HigA ypatybės E. coli. Toksino ir antitoksino mRNR sintetinami iš autoreguliuojamo operono, o atviras toksino skaitymo rėmas sutampa su antitoksino genu 1 bp (19). HigBA skiriasi nuo kitų TA sistemų, nes toksino genas yra prieš antitoksiną. Tiek HigB / HigA, tiek HigA automatiškai reguliuoja operoną, susijungdami su operatoriumi, sudarytu iš dviejų posvečių (pirmoji posvetainė apima palindromą 5′-TATTGCACATCGTGTAATA-3′, o antroje - palindromą 5�-GTATTA203 (18). HigA/HigB sukeltos represijos yra 4 kartus didesnės nei vien HigB (18). HigB yra susijęs su aktyviu 70 S ribosomų vertimu per 50 S ribosomų subvienetą. Atrodo, kad HigB sąveika su ribosomomis sukelia alosterinį HigB pokytį, kuris suaktyvina jo vietai būdingą endoribonukleazės aktyvumą (pasireiškia HigB formos pasikeitimu). Tada HigB keliauja su verčiančia ribosoma ir suskaido mRNR, kai pasiekia pirmąją didelę ar mažesnę A turtingą konsensuso seką. tmRNR sistema negali prisitaikyti prie didelio mRNR skilimo, todėl ribosomų perdirbimas yra lėtesnis (parodyta HigB disomomis). Šis nekontroliuojamas vertimo pailgėjimo blokavimas sukelia bakterijų ląstelių mirtį (t.y. posegregacinis ląstelių, praradusių Rts1 plazmidę, žudymas).


BIO-211 egzaminas Nr. 3

naudoja atvirkštinę RNR transkripciją į DNR, po kurios atliekama PGR
- DNR, atvirkštinė transkribuota iš RNR, vadinama komplementaria DNR (cDNR)
-leidžia RNR seką išsaugoti kaip DNR, kuri yra stabilesnė

- sergant vėžiu, naviką slopinantys genai (tie, kurie koduoja baltymus, turinčius priešvėžinių funkcijų) dažnai yra inaktyvuojami
---> pavyzdžiai yra Rb, P53, PTEN, jų dėmės būtų žalios ant mikromatricos

kaip suprasti tiek daug duomenų?
-sugrupuoti duomenų rinkinį --> prašoma kompiuterinės programos surasti pavyzdžius, kurių genų ekspresijos profiliai yra panašūs, ir genus, kurie eksperimentuose elgiasi panašiai

vaistų patikra – šios ląstelės gali būti išbandytos su vaistais, skirtais tam tikrai būklei gydyti, siekiant nustatyti jų poveikį atitinkamiems ląstelių tipams

organų sintezė --> iPSC mišiniai gali būti sumaišyti, kad susidarytų ląstelių tipų mišiniai
- tyrėjai padarė "kepenų pumpurus" naudodami iPSC, prijungtus prie kraujotakos sistemos ir atliko normalias kepenų funkcijas.

audinių atstatymas --> iPSC buvo naudojami tinklainės pažeidimams pelėms atkurti
- Neuroninės kamieninės ląstelės, gautos iš iPSC, buvo naudojamos pagerinti pelių, turinčių smegenų pažeidimą, motorinę funkciją.


Medžiagos ir metodai

Vertimo inicijavimo svetainės

Šiame tyrime naudojome QTI-seq duomenis, kad nustatytų TIS žmonėms ir pelėms. Skirtingai nuo ribo-seq, fiksuojančios visus ribosomų apsaugotus mRNR fragmentus, QTI-seq fiksuoja ir seka tik iRNR fragmentus, apsaugotus inicijuojančiomis ribosomomis QTI-seq pranoksta kitus metodus, identifikuojančius TIS (Gao etਊl. 2015).

Išanalizavome devynis QTI-seq mėginius, įskaitant penkis žmogaus mėginius ir keturis pelės mėginius (papildoma lentelė S1, papildoma medžiaga internete). QTI-seq skaitymai buvo atsisiųsti iš SRA duomenų bazės arba pateikti originalių autorių. Duomenų kokybei kontroliuoti naudojome „FastQC“ (https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ paskutinį kartą naudota 2020 m. kovo 13 d.) ir naudojome „Trimmomatic“ (Bolger etਊl. 2014), kad išfiltruotume žemą kokybiškai nuskaito, kai reikia. Filtruoti rodmenys, kurių ilgis nuo 25 iki 35 nukleotidų, buvo susieti su žmogaus genomu (hg19) arba pelės genomu (mm9) su Ensembl geno anotacijos leidimu 75, naudojant TopHat2 (Kim etਊl. 2013) su numatytaisiais parametrais. Neunikaliai pažymėti skaitymai buvo atmesti. Ribo-TISH, kuris pranoksta kelis nustatytus metodus tiek efektyvumu, tiek tikslumu (Zhang etਊl. 2017), buvo naudojamas identifikuoti TIS. Trumpai tariant, Ribo-TISH pirmiausia įvertina duomenų kokybę ir įvertina P-svetainės padėtį skaitymo metu, tada naudoja duomenimis pagrįstus metodus QTI-seq duomenų foniniam pasiskirstymui modeliuoti ir galiausiai nustato TIS pagal P arba K vertė (statistinė reikšmė prieš ir po daugelio testų kontrolės), apskaičiuota kiekvienai TIS pagal skirstymą (Zhang etਊl. 2017).

Vertimas gali prasidėti nuo AUG arba jam artimų kodonų, kurie nuo AUG skiriasi vienu nukleotidu (Peabody 1989 Kearse ir Wilusz 2017). Taigi tik AUG ir jo beveik giminingi kodonai laikomi tikrais transliacijos pradžios kodonais Ribo-TISH TIS prognozėje. 5′ didžiausio vertimo pradžios kodono nukleotido koordinatė buvo naudojama vaizduoti TIS. Iš viso bent viename mėginyje buvo nustatyta 114 655 ir 69 517 TIS, atitinkamai žmonėms ir pelėms.

Transliacinis geno kiekis

Geno QTI-seq skaitymų skaičius yra proporcingas transliacijos inicijavimo įvykių skaičiui per laiko vienetą. Kadangi inicijavimo įvykių skaičius turėtų būti proporcingas susintetintų baltymų molekulių skaičiui, darant prielaidą, kad visos genų baltymų sintezės tikimybės yra lygios, geno QTI-seq nuskaitymų skaičius yra proporcingas baltymų molekulių, susintetintų viename vienete, skaičiui. laikas (ty transliacijos kiekis) genui. Kad geno QTI-seq skaitymų skaičių būtų galima palyginti tarp mėginių, pranešame apie reads per milijonas viso pavyzdžio skaitymų (RPM).

Kadangi transliacijos inicijavimo įvykių skaičius per laiko vienetą genui lygus jo mRNR koncentracijai, padaugintai iš transliacijos inicijavimo greičio vienoje mRNR molekulėje, mRNR koncentracija yra stipriai teigiamai koreliuojama su vertimo inicijavimo įvykių skaičiumi per laiko vienetą. Mes naudojome RNA-seq, norėdami išmatuoti mRNR koncentracijas ir atsisiuntėme RNR-seq duomenis iš SRA (papildoma lentelė S1, papildoma medžiaga internete). Atlikus kokybės kontrolę, rodmenys buvo susieti su žmogaus (hg19) arba pelės (mm9) genomu, naudojant TopHat2 (Kim etਊl. 2013). Fskuduras per knuorašų ilobazė per milijonas geno kartografuotų skaitymų (FPKM) pirmiausia buvo apskaičiuotas naudojant rankogalių segtukus (Trapnell etਊl. 2012), o po to konvertuotas į TPM, naudojant formulę TPM = (FPKM × 10 6 )/(FPKM suma) (Li ir Dewey 2011).

Statistiniai metodai, skirti koreguoti nevienodus TIS tyrimus tarp genų

Dėl skirtingų genų transliacijos dydžių jų TIS QTI-seq netyrinėja tokiu pačiu gyliu. Norėdami pašalinti galimą šios nevienodos apklausos įtaką, naudojome du skirtingus metodus. Pirmasis yra supergeno metodas. Trumpai tariant, mes pirmiausia suskirstėme visus genus pagal jų transliacinį kiekį. Tada mes sugrupavome genus į 25 dėžes, atstovaujančias 25 supergenams, todėl reikia, kad bendras transliacijos kiekis vienoje dėžėje būtų vienodas visoms dėžėms. Dėžutėje kiekvieno geno dažniausiai naudojamo TIS skaitymai buvo sujungti, kad atspindėtų dažniausiai naudojamo supergeno TIS. Panašiai kiekvieno geno antrojo dažniausiai naudojamo TIS skaitymai buvo sujungti, kad būtų pateikti antrojo dažniausiai naudojamo supergeno TIS rodmenys ir pan. Supergeno metodas tam tikromis aplinkybėmis gali būti netinkamas (pvz., palyginant du paraloginius genus). Esant tokioms aplinkybėms, naudojome antrąjį metodą—mažinant atranką. Trumpai tariant, mes atsitiktinai atrinkome dešimt QTI-seq skaitymų vienam genui iš visų genų, kurių bent dešimt skaitymų, nebent būtų nurodyta kitaip, kad apskaičiuotume TIS įvairovę ir dalinį naudojimą. Pirmenybė teikiama supergeniniam metodui, o ne sumažinimui, kai galima naudoti abu, nes pirmasis naudoja visus duomenis, o antrasis naudoja tik dalį duomenų.

TIS įvairovės priemonės

Po mūsų neseniai atliktų alternatyvaus poliadenilinimo ir alternatyvios transkripcijos inicijavimo tyrimų (Xu ir Zhang 2018 Xu etਊl. 2019), mes panaudojome Simpsono indeksą (Simpson 1949) ir Shannon indeksą (Shannon 1948), norėdami kiekybiškai įvertinti kiekvieno mėginio geno TIS įvairovę. . Abu indeksai dažniausiai naudojami biologinės įvairovės tyrimuose ir linkę didėti didėjant TIS skaičiui bei santykiniam šių TIS naudojimui, tačiau Simpsono indeksas dažnai naudojamoms TIS suteikia daugiau svorio nei Šenono indeksas. Vienam genui Simpsono ir Šenono TIS įvairovės indeksai atitinkamai apibrėžiami 1 − ∑ i   =   1 S pi 2 ir − ∑ i ਀ =a   1 S pi   ln   pi , kur S yra TIS skaičius gene ir pi yra trupmeninis naudojimas iTIS. Kai aukščiau pateiktos formulės naudojamos supergeno TIS įvairovei apskaičiuoti, S yra didžiausias bet kurio supergenui priklausančio geno TIS skaičius, tuo tarpu pi yra nuskaitymų, susietų su # rango TIS, sumai kiekvieno supergenui priklausančio geno, padalijus iš bendro nuskaitymų, susietų su visų supergenui priklausančių genų TIS, skaičiaus.

Kompiuterinis modeliavimas

Norėdami patvirtinti, kad modeliai, pastebėti paveiksleꀚ–C nėra statistiniai artefaktai, kompiuterinį modeliavimą atlikome taip. Atsitiktinai sugeneravome kiekvieną geną, kurio transliacijos kiekis (matuojamas pagal bendrą skaitymų skaičių, susietą su visomis geno TIS) ir santykinis TIS naudojimas (matuojamas pagal skaitymų, susietų su įvairiomis geno TIS skaičiais), atitinkamai atitinka geno transliaciją. HEK293 duomenų kiekio pasiskirstymas ir santykinis TIS panaudojimo pasiskirstymas. Tiksliau, bendras modeliuojamo geno skaitymo skaičius buvo atsitiktinai paimtas iš visų pakeistų genų faktinių nuskaitytų skaičių rinkinio, o nuskaitymų skaičius, susietas su geno TIS, buvo daugianariai atsitiktiniai dydžiai, sudaryti pagal TIS naudojimą atsitiktinai parinktas tikras genas. Tada išanalizavome nuskaitytus duomenis iš modeliuojamų genų, tarsi jie būtų tikri duomenys.

TIS naudojimo atstumas tarp ląstelių linijų

Norėdami išmatuoti geno TIS naudojimo skirtumą tarp A ir B mėginių, naudojome grynąjį koreliacinį atstumą, apibrėžtą dAB − 0.5dA − 0.5dB. Čia dAB lygus 1 atėmus Pearson’s koreliacijos koeficientą tarp A ir B mėginių, kai visos geno TIS naudojamos daliai, dA yra toks pat kaip dAB išskyrus tai, kad naudojami du pavyzdžiai yra du QTI-seq įkrovos pavyzdžiai, gauti iš A pavyzdžio ir dB yra toks pat kaip dAB išskyrus tai, kad naudojami du pavyzdžiai yra du QTI-seq įkrovos pavyzdžiai, gauti iš B pavyzdžio (Xu ir Zhang 2018 Xu etਊl. 2019). A pavyzdyje nustatėme nulinį naudojimą tik B pavyzdyje rastoms TIS ir atvirkščiai. Čia naudojamos atstumo priemonės tinkamumas buvo patvirtintas anksčiau (Xu ir Zhang 2018).

Paralogai

Žmogaus paraloginiai genai buvo atsisiųsti iš Ensembl (2017 m. gegužės 89 d.). Gavome 3 678 žmogaus genų šeimas, įskaitant 51 657 poras žmogaus paraloginių baltymų koduojančių genų. Atsitiktinai iš kiekvienos genų šeimos atrinkome tik vieną paraloginę porą, kurios transliacijos dydis skiriasi 2 kartus ar daugiau, kad būtų užtikrinta pakankama statistinė galia.

Kozako jėga

Naudotos stipriosios Kozako pusės buvo iš tyrimų, kuriuose pranešama apie visų galimų Kozako sekų vertimo inicijavimo efektyvumą (Noderer etਊl. 2014 Diaz de Arce etਊl. 2018). Šiuose tyrimuose buvo derinamas fluorescencija aktyvuotas ląstelių rūšiavimas ir didelio našumo DNR sekos nustatymas, siekiant išmatuoti transliacijos inicijavimo efektyvumą, susijusį su kiekvienu starto kodonu (AUG ir devyniais jo kaimynais), kartu su visomis įmanomomis nukleotidų sekomis gretimoje nuo 𢄤 iki 𢄡 ir +3 pozicijos. Transliacijos inicijavimo efektyvumo vertė buvo palyginti su CACCAUGG, tada padauginta iš 100. Kiekvienai QTI-seq identifikuotai TIS buvo priskirta Kozako stiprumo vertė pagal aštuonių nukleotidų Kozak seką. Čia mes atsižvelgėme į aštuonis nukleotidus, o ne į tipišką dešimties nukleotidų Kozako regioną, nes aukščiau pateiktame tyrime buvo atsižvelgta tik nuo 𢄤 iki +3 pozicijų.

Apsaugos balas ir polimorfizmai

Norėdami įvertinti gryninimo atranką, veikiančią TIS ir Kozako regionus, atsisiuntėme iš UCSC (http://hgdownload.cse.ucsc.edu/goldenpath/hg19/phastCons46way/placentalMammals/, paskutinį kartą pasiekta 2020 m. kovo 13 d.) PhastCons balus (Siepel et� . . 2005), apskaičiuotas pagal 46 placentos žinduolių, įskaitant žmogų, genomo derinimą (hg19). Žmogaus polimorfizmo duomenys, įskaitant alelių dažnius, iš 1000 genomų projekto tarpinio 3 etapo (Sudmant etਊl. 2015), buvo atsisiųsti iš ftp://ftp.1000genomes.ebi.ac.ukVol03707ftp/release/2021 birželio 30 d. , 2018. Šis duomenų rinkinys apima 2504 asmenų genotipus iš 26 populiacijų ir iš viso apima 78 136 341 autosominį SNP. Į analizę buvo įtraukti tik SNP. Nukleotidas, pastebėtas SNP, buvo priskirtas protėvių kategorijai, jei jis yra toks pat kaip lauko �” nukleotidas polimorfizmo VCF faile. Kiti SNP nukleotidai yra gauti. DAF SNP yra išvestinio alelio dažnis SNP.