Informacija

Kas yra į lytį nukreiptas genas?

Kas yra į lytį nukreiptas genas?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Kaip apibrėžti vyrišką ir moterišką geną, kaip jie yra šio straipsnio santraukoje.


Susietame dokumente autoriai tai aptaria kaip lytimi pagrįstą genų ekspresiją, kuri išsivystė dėl lyties specifinės atrankos. Išraiška neapsiriboja viena lytimi (tai yra lytimi ribojami genai). Į lytį orientuotus genus išreiškia abi lytys, tačiau skirtingos lytys skirtingai.


Į lytį orientuotos genų ekspresijos evoliucinė ir vystymosi dinamika paprastose varlėse su proto-Y chromosomomis

Genų ekspresijos modeliai labai diferencijuotose lytinėse chromosomose labai skiriasi nuo autosomų dėl lyčiai būdingų atrankos ir paveldėjimo modelių. Dėl to X chromosomos dažnai yra praturtintos moteriškais genais (feminizacija), o Z chromosomos – vyriškos lyties genais (maskulinizacija). Tačiau nežinoma, kaip greitai išsivysto genų ekspresijos seksualizacija ir transkripcijos degeneracija po lytinių chromosomų susidarymo. Be to, mažai žinoma apie tai, kaip genų ekspresija dėl lyties skiriasi vystymosi metu.

Rezultatai

Atrenkame paprastųjų varlių populiaciją (Rana temporaria) su ribota lyties chromosomų diferenciacija (proto-lyties chromosoma), nesandariu genetinės lyties nustatymu, kurį liudija XX patinų atsiradimas, ir uždelstą lytinių liaukų vystymąsi, o tai reiškia, kad XY individams prieš pereinant prie sėklidžių gali išsivystyti kiaušidės. Naudodami didelio našumo RNR sekos nustatymą, tiriame genų ekspresijos dinamiką viso vystymosi metu, pradedant nuo ankstyvo embriono iki varlių stadijų. Mūsų rezultatai rodo, kad į lytį nukreipta ekspresija paveikia skirtingus genus skirtinguose vystymosi etapuose ir didėja vystymosi metu, pasiekdama aukščiausią lygį XX varlių patelėse. Be to, genų ekspresija, orientuota į lytį, priklauso nuo fenotipinės, o ne nuo genotipinės lyties, o XX ir XY patinų ekspresija panašiai koreliuoja su genų evoliucijos greičiu ir nėra lokalizuota proto lyties chromosomoje ar šalia kandidato lytį lemiančio geno. Dmrt1.

Išvados

Paprastųjų varlių proto-lyties chromosoma nerodo genų ekspresijos seksualizavimo ar greitesnio evoliucijos greičio įrodymų. Tai ginčija sampratą, kad seksualiai antagonistiniai genai atlieka pagrindinį vaidmenį pradinėse lyties chromosomų evoliucijos stadijose.


Seksualinė genų raiška

Transkripcijos profiliavimo metodai leido palyginti genų ekspresiją tarp moterų ir vyrų genomo mastu. Tokie tyrimai atskleidė, kad daugelio rūšių genų ekspresija yra lytiška, nors jos mastas gali labai skirtis įvairiuose audiniuose ar vystymosi stadijose. Rūšių, kurių lytis nustatoma genetiškai, lyties chromosomoms būdingi procesai, tokie kaip dozės kompensavimas, taip pat gali turėti įtakos genų ekspresijai, pagrįstoms lytimi. Į lytį orientuoti genai, ypač tie, kurių ekspresija yra nukreipta į vyrus, dažnai rodo padidėjusius baltymų sekos ir genų ekspresijos skirtumus tarp rūšių, o tai gali turėti daug priežasčių, įskaitant seksualinę atranką, seksualinį antagonizmą ir atpalaiduotą selektyvų suvaržymą. Čia apžvelgiame savo dabartines žinias apie lyties šališkumo genų ekspresiją tiek modeliuose, tiek nemodiniuose organizmuose, taip pat biologinius ir techninius veiksnius, į kuriuos reikėtų atsižvelgti analizuojant lyties tendenciją. Mes taip pat aptariame dabartinius metodus, kaip atskleisti evoliucines jėgas, kurios valdo lyties šališkumo genų evoliuciją.


2. Dispensuojamumas

Ne visi genai turi vienodą svarbą organizmo gebėjimui išgyventi ir daugintis. Nepakeičiamumo apibrėžimai skiriasi, tačiau genetiniai tyrimai, pradedant nuo mielių iki pelių, nustatė tuos genus, kurie yra būtini norint išgyventi ar vaisingumui užtikrinti (Hirsh & Fraser 2001 Giaever ir kt. 2002) ir tie, kurie yra kitame kontinuumo gale, kurie neturi akivaizdaus išmušimo fenotipo (barbariškas ir kt. 2007 Liao & Zhang 2007). Todėl kai kurie genai reikalingi, kiti atrodo pertekliniai, o dauguma yra tarpiniai tarp šių kraštutinumų. Šis svarbos laipsnis dažnai vadinamas nepakeičiamumu, ir nors sunku susieti vienaląsčių eukariotų ir metazoanų dispensiškumo matavimus, šį terminą čia vartojame laisvai, turėdami jį kaip geno fenotipinio poveikio matuoklį.

Kritiniai genai paprastai pasižymi mažesniu funkcinių baltymų kaitos greičiu, palyginti su nepakeičiamais genais (Hirsh & Fraser 2001 Jordan ir kt. 2002 Pal ir kt. 2003 Siena ir kt. 2005 m. Liao & Zhang 2006). Tai teoriškai atsiranda dėl siaurų kritinių genų tinkamumo optimalų, pasireiškiantį stipria valymo atranka prieš funkcines mutacijas, kurių didžioji dauguma yra žalingos. Genai, kurie yra mažiau svarbūs, yra veikiami mažesnio valymo slėgio ir greičiau vystosi tiesiog neutralių procesų metu.

Nepakeičiami genai turi pagrindines ekspresijos ypatybes su genais, nukreiptais į lytį, o tai rodo, kad patys genai, pagrįsti lytimi, gali būti nereikalingi. Iš tiesų, gali būti, kad genai, turintys didesnį nepatenkinamumo lygį, gali greičiau reaguoti į seksualiai antagonistinę atranką ir taip vystytis pagal lytį nukreiptą ekspresiją, nes skirtingi moteriškos ir vyriškos lyties transkripcijos lygiai būtų mažiau linkę turėti žalingą poveikį mažiau svarbiems genams.


Medžiagos ir metodai

Norėdami identifikuoti genus, turinčius ribotos ir neribotos lyties funkcijas, FlyBase (Tweedie ir kt., 2009) ieškojome mutacijų šiose fenotipinėse kategorijose: matomos, mirtinos, pusiau mirtinos, sterilios, vyriškos ir moteriškos sterilios (paieškos naudojo TermLink). skyrių http://flybase.org/static_pages/termlink/termlink.html). Mes apkarpėme duomenų rinkinį, kad apimtų alelius, susijusius su konkrečiais genais (nors daugelis alelių buvo susieti su konkrečiomis chromosomomis ir (arba) citologinėmis juostomis, šių atvejų kartografavimo skiriamoji geba paprastai buvo nepakankama, kad būtų įtraukta į galutinį duomenų rinkinį).

Atskiri genai duomenų rinkinyje gali turėti kelis alelius (nors dauguma Drosophila genai nebuvo susieti su jokiais aleliais). Todėl mes suskirstėme kiekvieną geną pagal jo mutantinių alelių fenotipų diapazoną, kuris yra nuo 𠇎ntriškai moteriškai būdingų” iki 𠇎ntriškai vyriškų.” Genai buvo klasifikuojami taip:

Genai, turintys ribotą kūno rengybos poveikį, yra tie, kuriuose yra moteriškos lyties sterilių alelių ir nėra jokio kito alelio tipo

Genai, kurių kūno rengybos poveikis yra nukreiptas į moteris, turi moteriškų sterilių alelių ir bet kokį matomų, mirtinų ir pusiau mirtinų alelių derinį

Genuose, turinčiuose ribotą fizinio pasirengimo poveikį vyrams, yra vyriškų sterilių alelių ir nėra jokio kito alelio tipo

Genuose, kurių kūno rengybos efektas yra nukreiptas į vyrus, yra vyriški sterilūs aleliai ir bet koks matomų, mirtinų ir pusiau mirtinų alelių derinys

Genai, neturintys lyties šališkumo, turi ir vyriškų, ir moteriškų sterilių alelių, matomų alelių, mirtinų alelių ir (arba) pusiau letinių alelių.

Genai, susiję su sterilumu, bet nenurodyta nė viena lytis (pagrindiniai aleliniai duomenys nepateikė informacijos apie lytį), buvo laikomi dviprasmiškais ir neįtraukti į analizę. Sterilių alelių pavyzdys, kuris buvo įtrauktas į analizę, gali būti nevienalytis, nes kai kuriuose tyrimuose tiriamas tik vienos lyties, o ne abiejų, vaisingumas. Nepaisant to, lytimi ribojamų ir neribotų sterilių medžiagų dalis mūsų duomenų rinkinyje atitinka nepriklausomus eksperimentinius rezultatus, kurie aiškiai tikrina vyrų ir moterų vaisingumą (aleliai, susiję su lytimi būdingu sterilumu, yra maždaug tris kartus dažnesni nei aleliai, susiję su sterilumu. abi lytys žr. Lindsley ir Lifschytz 1972 Ashburner ir kt. 2005). Tai rodo, kad dauguma genų ir alelių, klasifikuojamų kaip ribojamos lyties, iš tikrųjų yra susiję su lytimi ribojamu sterilumu.

Molekulinės išraiškos profiliai buvo gauti iš Sex Bias Database (SEBIDA versija 2.0: http://141.61.102.16:8080/sebida/index.php Gnad ir Parsch 2006). Atsisiuntėme vyrų ir moterų išraiškos santykius (M/F) iš 15 skirtingų mikrogardelių tyrimų (duomenys iš pradžių pateikti: Parisi ir kt., 2003 m., 2004 m. Ranz ir kt., 2003 m. Gibson ir kt., 2004 m. Stolc ir kt., 2004 m. McIntyre ir kt., 2006 m. Goldman ir Arbeitman, 2007, Ayroles 2009). ir M/F koeficientai iš kelių tyrimų metaanalizės (metaanalizės detalės aprašytos SEBIDA). M/F santykiai gali svyruoti nuo nulio iki begalybės, o transkripcija yra nukreipta į vyriškumą M/F > 1 ir moteriška transkripcija, skirta M/F < 1. Norėdami nustatyti simetriją pagal lytį nukreiptiems išraiškos lygiams, perskaičiavome duomenų skalę, naudodami lyties atžvilgiu pagrįstos išraiškos indeksą: x = M/(M + F). Šis kintamasis svyruoja nuo nulio iki vieneto, o transkripcija yra nukreipta į moteris x < 0.5 ir vyrų šališka transkripcija, skirta x > 0.5.

Galutinis duomenų rinkinys apėmė 2433 genus su M/F raiškos informaciją iš bent 1 iš 15 tyrimų. Galutiniame duomenų rinkinyje buvo 1 955 genai, turintys panašų mutacijos poveikį abiem lytims, 298 genai, kurių kūno rengybos efektas buvo nukreiptas į moteris, 43 genai, kuriuose yra tik moterų, 87 genai, kurių kūno rengybos efektas yra nukreiptas į vyrus, ir 50 genų, ribojamų vyrų atžvilgiu. papildomi 53 genai turėjo dviprasmiškus lyčiai būdingus sterilumo fenotipus). Papildomoje lentelėje S1 (papildoma medžiaga internete) pateikiamas duomenų rinkinio suskirstymas į fenotipines subkategorijas, įskaitant vidutinį ir vidutinį alelių skaičių vienam genui pagal fenotipinę kategoriją.

Statistinė analizė

Dviuodegis Mann–Whitney U testai (įdiegti R R Development Core Team 2005) buvo naudojami siekiant įvertinti, ar skiriasi lyties transkripcijos lygių pasiskirstymas tarp fenotipiškai apibrėžtų genų kategorijų. Norėdami ištirti, ar skirtingos pagal lytį nukreiptos transkripcijos kategorijos turi skirtingą fenotipų sudėtį, duomenų rinkinį suskirstėme į penkias išraiškos kategorijas, kurių kiekviena turi vienodą diapazoną: (1) 0 < x < 0.2 (2) 0.2 < x < 0,4 (3) 0,4 < x < 0,6 (4) 0,6 < x < 0.8 ir (5) 0.8 < x < 1.0. Tikslūs dvipusiai Fisher’ testai buvo naudojami siekiant ištirti, ar moteriškos lyties transkripcijos kategorijos (1, 2) buvo praturtintos genų, turinčių specifinius moteriškus fenotipus, ir ar vyriškos lyties transkripcijos kategorijos (4, 5) buvo praturtintos genų su vyriškomis savybėmis. - specifiniai fenotipai.

Toliau pateikiamuose rezultatuose naudojami metaanalizės ekspresijos profiliai (iš SEBIDA žr. aukščiau), kad būtų galima transkripciškai suskirstyti genus. Metaanalizės duomenų rinkinys yra kelių nepriklausomų mikromatricos tyrimų sudėtis, kuri sumažina kiekvieno geno klaidingos lyties transkripcijos klasifikavimo tikimybę (palyginti su klasifikacijomis, pagrįstomis atskirais tyrimais). Į metaanalizę taip pat įtraukiami duomenys apie didelę 2433 genų dalį (palyginti su atskirais tyrimais), o tai maksimaliai padidina statistinę galią. Nepaisant to, kiekviena analizė taip pat buvo atlikta naudojant atskirų mikrogardelių tyrimų transkripcijos klasifikacijas. Rezultatai yra nuoseklūs visuose tyrimuose, nors statistinė galia dažnai yra mažesnė dėl sumažėjusio genų atstovavimo. Kiekvienos platformos rezultatai pateikti papildomuose paveiksluose. S1 ir S2 (papildoma medžiaga internete).


Metodai

Pavyzdžiai

Viso kūno ir specifinių audinių mėginių individai buvo paimti iš lauko kaip paskutiniai jaunikliai atitinkamai 2013 m. ir 2014 m. pavasarį (visų mėginių paėmimo vietos nurodytos 8 papildomuose duomenyse). Visi individai buvo auginami įprastomis sodo sąlygomis (23 °C, 12 val.:12 val., 60% drėgnumas, šeriami Ceanothus auginiais) iki 8 dienų po galutinio vedėjimo. Prieš RNR ekstrahavimą asmenys 2 dienas buvo šeriami dirbtine terpe, kad būtų išvengta RNR užteršimo žarnyno turiniu, o po to užšaldomi –80 °C temperatūroje. Kojų mėginiams buvo naudojamos trys kiekvieno asmens kojos (viena priekinė, viena vidurinė ir viena užpakalinė koja). Dauginimosi takai buvo išpjaustyti, kad juos sudarytų patelių kiaušidės, kiaušintakiai ir spermateka, o vyrams – sėklidės ir papildomos liaukos. Atkreipkite dėmesį, kad tie patys asmenys buvo naudojami kojų ir reprodukcinio trakto mėginiams. Siekiant užtikrinti, kad mėginių ėmimo metu individai būtų reprodukciniai aktyvūs, visiems lytiniams asmenims buvo leista poruotis, o neseksualios ir seksualios patelės dėjo kiaušinėlius. Kai analizės buvo kartojamos naudojant nekaltas seksualias pateles, gavome kokybiškai panašius rezultatus (papildomas 13 pav.). Atkreipkite dėmesį, kad šiam palyginimui buvo prieinami tik viso kūno mėginiai. Šiam tyrimui nereikėjo gauti etinių patvirtinimų ar rinkimo leidimų.

RNR ekstrahavimas ir sekos nustatymas

Mes sukūrėme tris kiekvienos rūšies ir audinių tipo biologinius pakartojimus iš sujungtų individų (1–9 individai viename pakartojime, iš viso 516 individų, iš viso 150 pakartojimų (įskaitant nekaltas seksualines pateles), žr. 8 papildomus duomenis). Norint išgauti RNR, mėginiai buvo greitai užšaldyti skystame azotu, po to įpilama Trizol (Life Technologies), prieš homogenizuojant naudojant mechanines granules (Sigmund Lindner). Tada į mėginius buvo pridėta chloroformo ir etanolio, o vandeninis sluoksnis perkeltas į RNeasy MinElute kolonėles (Qiagen). Tada RNR ekstrahavimas buvo baigtas naudojant „RNeasy Mini Kit“ pagal gamintojo instrukcijas. RNR kiekis ir kokybė buvo matuojami naudojant NanoDrop (Thermo Scientific) ir Bioanalyzer (Agilent). Konkrečios sruogos bibliotekos paruošimas ir vieno galo sekvenavimas (100 bp, HiSeq2000) buvo atliktas Lozanos genominių technologijų centre.

150 bibliotekų iš viso pagamino šiek tiek mažiau nei 5 milijardus vieno galo skaitymų. Šešios viso kūno ir šešios specifinių audinių bibliotekos davė daug daugiau skaitymų nei kitų mėginių vidurkis. Siekiant sumažinti bet kokią to įtaką tolesnėms analizėms, šios bibliotekos buvo atrinktos iki apytiksliai vidutinio skaitymų skaičiaus atitinkamai viso kūno arba specifinių audinių bibliotekoms, naudojant seqtk (https://github.com/lh3/seqtk Versija: 1.2- r94).

Transkripto nuorodos

De novo etaloniniai kiekvienos rūšies transkripto rinkiniai buvo sukurti anksčiau 16 . Mūsų išraiškos analizė buvo atlikta naudojant du ortologų rinkinius. Pirma, mes nustatėme ortologus tarp seksualinių ir neseksualių seserų rūšių, naudodami abipusį sprogimą, kaip aprašyta Parker ir kt. 24 . Antra, naudojome 3010 „vienas su vienu“ ortologų, esančių visuose 10-yje Timema rūšys, kurias nustatė Bast ir kt. 16 . Skirtingose ​​rūšyse nustatytos ortologinės sekos buvo skirtingo ilgio. Kadangi ilgio kitimas gali turėti įtakos genų ekspresijos įvertinimams, sulygiavome ortologines sekas naudodami PRANK (v.100802, numatytosios parinktys) 25 ir apkarpėme jas naudodami alignment_trimer.py 26, kad pašalintume išsikišusius tarpus lygiavimo galuose. Jei išlygiavimo tarpas buvo didesnis nei trys bazės, seka prieš arba po lygiavimo tarpo (atsižvelgiant į tai, kuri buvo trumpiausia) buvo atmesta. Visos ortologinės sekos, kurių ilgis buvo <300 bp, taip pat buvo atmestos. Galiausiai, prieš sudarydami žemėlapius, iš apkarpytų transkripto nuorodų buvo pašalinti genai, turintys reikšmingų blastų smūgių į rRNR sekas.

Skaitykite apkarpymą ir žemėlapių sudarymą

Prieš sudarydami žemėlapius, adapterių sekos buvo apkarpytos iš neapdorotų skaitymų naudojant CutAdapt 27 . Tada skaitymai buvo kokybiškai apkarpyti naudojant Trimmomatic v 0.36 28 , iškirpant priekinius arba užpakalinius pagrindus su <10 nuo skaitymo, prieš naudojant slankiojantį langą nuo 5′ galo nuskaityti, jei 4 iš eilės einančių bazių vidutinis phred balas buvo <20. Visi skaitymai, kurių sekos ilgis yra <80 po apkarpymo, buvo atmesti. Tada kiekvienos libreto skaitymai buvo susieti su transkripto nuorodomis naudojant Kallisto (v. 0.43.1) 29 su šiomis parinktimis -l 210 -s 25-baas-rf-stranded viso kūno mėginiams ir -l 370 -s 25- poslinkis–rf-grandinis specifiniams audiniams mėginiams (-l parinktis skyrėsi viso kūno ir specifiniams audiniams mėginiams, nes šių bibliotekų fragmentų ilgis buvo skirtingas).

Diferencialinės išraiškos analizė

Ekspresijos analizė buvo atlikta naudojant Bioconductor paketą EdgeR (v. 3.18.1) 30 in R (v. 3.4.1) 31 . Pirma, norėdami nustatyti pagal lytį nukreiptus genus, palyginome vyrų ir moterų ekspresiją atskirai kiekvienam audinių tipui kiekvienoje seksualinėje rūšyje. Genai, kurių skaičius milijonui < lt0,5 2 ar daugiau bibliotekų vienai lyčiai, buvo neįtraukti į ekspresijos analizę. Kiekvienos bibliotekos normalizavimo koeficientai buvo apskaičiuoti naudojant TMM metodą. Norėdami įvertinti dispersiją, mes pritaikėme apibendrintą tiesinį modelį (GLM) su neigiamu binominiu pasiskirstymu su lytimi kaip aiškinamuoju kintamuoju ir panaudojome GLM tikimybės santykio testą, kad nustatytume lyties reikšmę kiekvieno geno geno ekspresijai. PTada vertės buvo pataisytos keliems bandymams naudojant Benjamini ir Hochberg algoritmą 32 . Tada genai, pagrįsti lytimi, buvo apibrėžti kaip genai, kurių vyrų ir moterų ekspresijos skirtumas buvo didesnis nei 2 kartus, o FDR < 0,05. Atkreipkite dėmesį, kad visi genai, nepriskiriami prie lyties šališkumo, buvo klasifikuojami kaip nešališki genai. Pasirinkome šią slenkstį, norėdami pasirinkti tvirtą lyties šališkumo genų rinkinį ir sumažinti lyties šališkumo alometrijos poveikį33. Atkreipkite dėmesį, kad analizė, naudojant tik FDR slenkstį, kad būtų galima nustatyti pagal lytį nukreiptus genus, arba naudojant nekaltas seksualines pateles, kad būtų galima nepriklausomai patikrinti lyties šališkus genus viso kūno mėginiuose, gauti kokybiškai panašūs rezultatai (18–19 papildomos lentelės, papildomas 14 pav.).

Išraiškos reikšmių grupavimas (log2 CPM) buvo atlikta naudojant Ward hierarchinę euklido atstumų klasterizaciją su R paketu pvclust (v. 2.0.0) 34 , su įkrovos pakartotiniu mėginiu (method.hclust = "ward.D2", method.dist = "euklido", nboot = 10000 ), ir vizualizuota naudojant R paketo pheatmap (v. 1.0.8) 35 .

Norėdami kiekybiškai įvertinti, kaip su lytimi susiję genai keičia ekspresiją neseksualiose patelėse, mes palyginome genų ekspresiją seksualinėse ir neseksualiose patelėse atskirai kiekvienai rūšių porai ir kiekvienam audinio tipui. Naudodami Wilcoxon testą, pakoreguotą pagal kelis testus, naudojant Benjamini ir Hochberg algoritmą, mes taip pat palyginome neseksualių patelių raiškos pokyčius, susijusius su vyriškos ir moteriškos lyties genais, su nešališkais genais. Norėdami nustatyti, ar genų ekspresijos pokyčiai nelytiškose patelėse yra didesni, kai genai yra nukrypę nuo lyties, kai yra mažiau rūšių, pritaikome apibendrintą linijinį mišrų modelį su rūšių skaičiumi, kuriame genas yra nukrypęs nuo lyties, kaip fiksuotą efektą ir geno ID kaip atsitiktinis efektas R. Terminų reikšmingumas buvo nustatytas naudojant Tikimybės santykio testą. Atskiras modelis buvo tinkamas vyrų ir moterų šališkiems genams kiekviename audinyje. P-vertės buvo pataisytos keliems testams naudojant Benjamini ir Hochberg algoritmą. Mes taip pat ištyrėme genų ekspresijos pokyčius T. cristinaeT. monikensis rūšių pora, kai buvo atmesti X susieti transkriptai. Šiose rūšyse X susieti transkriptai buvo nustatyti sprogdinant (blastN) transkriptus į T. cristinae etaloninis genomas, kuriam buvo priskirtos jungčių grupės36. Tada genų ekspresijos analizės buvo pakartotos tik tiems nuorašams, kurie turėjo didelį sprogimą (e-reikšmė < 1 × 10 -20, užklausos aprėptis > 60%) į pastolius autosominio ryšio grupėje.

Su lytimi susietų genų ir nelytinės kilmės amžiaus pokyčiai

Aseksualių rūšių amžius skiriasi, kaip buvo apskaičiuota anksčiau 2 . Kadangi aseksualumo amžius skiriasi, išbandėme, ar lyties atžvilgiu pakitusių genų ekspresijos pokyčiai pasikeitė atsižvelgiant į nelytinės rūšies amžių, naudodami permutaciją ANCOVA (permutacijų skaičius = 10 000) atskirai vyriškiems ir moteriškiems genams su tokiais terminais: nelytinės kilmės amžius, audinių tipas ir jų sąveika.

Ribotų lyties genų analizė

Riboto lyties genai buvo klasifikuojami kaip genai, turintys bent du fragmentus vienam kilobazės milijonui (FKPM) kiekviename vienos lyties replikate ir 0 FKPM kiekvienoje kitos lyties replikoje. FKPM reikšmės buvo apskaičiuotos naudojant EdgeR. Lytinių ir neseksualių pateles apribotų patelių genų ekspresijos lygiai ir seksualių patinų bei aseksualių pateles apribotų vyrų genų ekspresijos lygiai buvo lyginami naudojant Wilcoxon testą, pakoreguotą pagal kelis testus, naudojant Benjamini ir Hochberg algoritmą32.

Su lytimi susijusių genų sekos evoliucija

Norėdami patikrinti, ar genai, pagrįsti lytimi, turi didesnį aseksualų skirtumų laipsnį, ištyrėme, ar lyties šališkumo genai turi padidėjusį aseksualų dN / dS santykį. Norėdami tai padaryti, pirmiausia pritaikome binominį glmm (dN / dS vertės buvo transformuotos į dvi kategorijas: nulis arba ne nulis), su reprodukciniu režimu, lyties šališkumu ir jų sąveika kaip fiksuotu poveikiu, o genų tapatumu - kaip atsitiktiniu efektu. Antra, mes pirmiausia pritaikome glmm su gama pasiskirstymu prie dN / dS verčių, kurios buvo didesnės nei nulis, su tokiais pat fiksuotais ir atsitiktiniais efektais kaip ir binominis modelis. Visos glmms buvo tinkamos naudojant lme4 paketą (v. 1.1.14) 37 R, o terminų reikšmė buvo nustatyta naudojant log-tikimybės santykio testą. dN / dS vertės buvo apskaičiuotos kiekvienam ortologui „vienas su vienu“, naudojant PAML pakete 38 įdiegtą kodą, kad būtų sudarytos didžiausios tikimybės dN / dS kiekvienai galinei filogenijos šakai (naudojant „laisvąjį modelį“), kaip aprašyta. Bast ir kt. 16 .

GO terminų analizė

Genai buvo funkciškai anotuoti naudojant Blast2GO (4.1.9 versija) 39, kaip aprašyta Parker ir kt. 24 . Trumpai tariant, kiekvienos seksualinės rūšies sekos buvo palygintos su BlastX su NCBI nariuotakojų Nr. Drosophila melanogaster (drosoph) duomenų bazes, kad būtų sukurti du funkcinių anotacijų rinkiniai, vienas gautas iš visų nariuotakojų, o kitas – konkrečiai iš Drosophila melanogaster. The D. melanogaster GO termino anotacija sugeneravo maždaug keturis kartus daugiau komentarų vienoje sekoje nei NCBI nariuotakojų duomenų bazė. Todėl visas vėlesnes analizes atlikome naudodami GO terminus, gautus iš D. melanogaster, tačiau atkreipkite dėmesį, kad rezultatai naudojant anotacijas iš visų nariuotakojų buvo kokybiškai vienodi (žr. papildomą 15 pav.).

Norėdami nustatyti per daug atstovaujamus GO terminus, atlikome genų rinkinio praturtinimo analizę (GSEA), naudodami R paketą TopGO (v. 2.28.0) 40 , naudodami elim algoritmą, kad būtų atsižvelgta į GO topologiją. GO terminai buvo laikomi žymiai praturtėjusiais, kai p < 0,05.

Kadangi apibrėžėme su lytimi susijusius genus su FDR ir FC slenksčiais, GSEA įvertinome lyties šališkus genus, kad būtų atsižvelgta ir į FDR, ir į FC. Siekiant nustatyti per daug atstovaujamus GO terminus, susijusius su moteriškais genais, genai buvo suskirstyti pagal FDR į keturis pogrupius: moteriški, kai FC > 2, moteriški, kai FC < 2, vyriški - FC < 2, ir vyriški - FC. > 2. Moterims skirtų genų pogrupiai buvo suskirstyti taip, kad mažos FDR reikšmės būtų vertinamos aukštai, o vyriškos lyties genų pogrupiai buvo reitinguojami taip, kad mažos FDR reikšmės sąraše būtų žemesnės. Tada keturi sąrašai buvo sujungti aukščiau nurodyta tvarka ir jiems buvo suteiktas unikalus rangas. Šis reitinguotas sąrašas sudaro sąrašą, kuriame stipriai moteriški genai yra viršuje, po to - silpnai moteriški genai, tada silpnai vyriški genai ir galiausiai stipriai vyriški genai apačioje. Norint nustatyti per daug atstovaujamus GO terminus, susijusius su vyrų šališkumu, genų, nukreiptų į moteris, sąrašas buvo tiesiog apverstas. Galiausiai, norint ištirti GO terminus, per daug atstovaujamus lyties atžvilgiu pagrįstuose genuose, kurie pakeitė aseksualų ekspresiją, moterų ir vyrų šališki genai buvo suskirstyti pagal seksualinių ir neseksualių patelių pasikeitimą.

Norėdami nustatyti, ar į lytį orientuotų genų rinkinių arba GO terminų sutapimas buvo didesnis nei tikėtasi atsitiktinai, naudojome paketą SuperExactTest (v. 0.99.4 41 ), kuris apskaičiuoja kelių rinkinių susikirtimų tikimybę. P-vertės buvo daugkartinio testo pataisytos naudojant Benjamini ir Hochberg algoritmą, įdiegtą R.


Į lytį orientuotų genų, išreikštų svirplių smegenyse ir lytinėse liaukose, evoliucinė dinamika

Pagal lytį nukreipta genų ekspresija, ypač pagal lytį nukreipta ekspresija lytinėje liaukoje, buvo susijusi su baltymų sekos evoliucijos greičiu (nesinonimiška sinoniminiams pakaitalams, dN/dS) gyvūnams. Tačiau vabzdžių lyties išraiškos tyrimai tebėra sutelkti į keletą holometabolinių rūšių, be to, kiti pagrindiniai audinių tipai, tokie kaip smegenys, lieka nepakankamai ištirti. Čia mes ištyrėme su lytimi susijusią genų ekspresiją ir baltymų evoliuciją pusmetaboliniame vabzde, svirplyje. Gryllus bimaculatus. Sukūrėme naujus vyrų ir moterų RNR-seq duomenis apie du lytinių audinių tipus – lytinių liaukų ir somatinę reprodukcinę sistemą bei du pagrindinius nervų sistemos komponentus – smegenis ir ventralinį nervą. Iš viso genomo analizės pateikiame keletą pagrindinių išvadų. Pirma, sėklidės šališki genai paspartino evoliuciją, palyginti su kiaušidžių ir nešališkais genais, kurie buvo susiję su teigiamais atrankos įvykiais. Antra, nors į lytį orientuoti smegenų genai buvo daug rečiau paplitę nei lytinių liaukų, jie pasižymėjo ryškia spartaus baltymų evoliucijos tendencija, o šis poveikis buvo stipresnis moterų nei vyrų smegenims. Be to, kai kurie su lytimi susiję smegenų genai buvo susiję su seksualinėmis funkcijomis ir poravimosi elgesiu, o tai, mūsų nuomone, galėjo paspartinti jų evoliuciją per seksualinę atranką. Trečia, tendencija siaurinti kryžminio audinio ekspresijos plotį, o tai rodo mažą pleiotropiją, buvo pastebėta pagal lytį nukreiptiems smegenų genams, o tai rodo atsipalaidavusią valymo atranką, kuri, mūsų manymu, gali suteikti didesnę laisvę vystyti prisitaikančius baltymų funkcinius pokyčius. Aptariamos greitos sėklidžių genų ir vyrų bei moterų smegenų genų evoliucijos išvados, susijusios su pleiotropija, teigiama atranka ir šio svirplio poravimosi biologija.

Konkuruojančių interesų pareiškimas

Autoriai nepaskelbė jokių konkuruojančių interesų.


Medžiagos ir metodai

Kirminų padermės ir augimas

C. elegans (N2), C. brenneri (PB2801), C. briggsae (AF16), C. remanei (PB4641), ir P. pacificus (PS312) padermės buvo palaikomos 20° NGM agaro plokštelėse naudojant standartinį C. elegans augimo metodai.

DNRseq

Kiekvienai rūšiai buvo surinkta viena patelė ir du ar daugiau patinų pakartojimų (apibendrinti pagalbinėje informacijoje, S1 lentelėje). Mažiausiai 50 jaunų suaugusių kirminų buvo paimta rankomis iš kiekvienos kartos. Kirminai buvo nuplauti tris ar penkis kartus nusodinant 1 ml M9, badauti per naktį, kad būtų pašalintas žarnyno bakterinis užteršimas, ir pakartotinai suspenduoti 100 μl TE. Iš viso buvo pridėta 400 μl lizės buferio (0, 1 M Tris-HCl 0, 1 M NaCl 50 mM EDTA 1, 25 % SDS) ir kirminai buvo ultragarsu apdorojami 30 minučių naudojant Bioruptor aukštą nustatymą, 30 sekundžių įjungimas / išjungimas. Ultragarsu apdorota DNR buvo išskirta ir išvalyta naudojant Qiagen MinElute rinkinį. Iš išgrynintos DNR buvo paruoštos 250–500 bp Illumina DNR sekos nustatymo bibliotekos, naudojant Illumina TruSeq DNR rinkinį su šiomis modifikacijomis. Trumpai tariant, po galutinio taisymo ir A uodegos, adapteriai buvo susieti ir gauta DNR buvo išgryninta naudojant AmpureXP granules. Liguota DNR buvo amplifikuota PGR ir DNR biblioteka nuo 300 iki 500 bp buvo išgryninta geliu. Penkiasdešimt bazinių porų suporuotų arba vieno galo sekų (žr. S1 lentelę) buvo atlikta naudojant Illumina HiSeq-2000. Neapdorotus duomenis galima rasti Gene Expression Omnibus (GEO) serijos numeriu GSE53144. Suporuotų duomenų atveju atvirkštinio nuskaitymo kokybės balai buvo daug mažesni nei pirminio nuskaitymo. Taigi analizei buvo naudojami tik pirminiai skaitymai.

Kopijos skaičiaus metodas: X ir autosominių genų priskyrimas

Kiekvienos rūšies pirminiai rodmenys buvo suderinti su WS228 su Bowtie versija 0.12.7 (Langmead ir kt. 2009). Pateikėme parametrą (m = 4) nuslopinti visus suderinimus su daugiau nei keturiais genomo pataisymais. Gauti lygiavimo failai (BAM formatu, dvejetainis failo tipas, kuriame yra sekos lygiavimo duomenų) buvo konvertuoti į SAM formatą (tabuliuotais BAM failo teksto versija), naudojant SAMtools v. 0.1.18 (Li ir kt. 2009). SAM failai buvo surūšiuoti ir naudojami generuoti bedgraph failus (BEDTools v. 2.15.0) (Quinlan ir Hall 2010). Kiekvienos rūšies kontigai buvo suskirstyti į 5 kb langus, o bedgraph failas buvo naudojamas kiekvieno lango sekos aprėpčiai apskaičiuoti. Vyro ir moters aprėpties santykis buvo apskaičiuotas kiekvienam langui paėmus žurnalą2 vyrų aprėpties, padalytos iš moterų aprėpties. Pradinis lygis buvo nustatytas kaip vidutinis vyrų ir moterų aprėpties santykis. Langai, kurių žurnalas2 santykis sumažėjo vienu standartiniu nuokrypiu žemiau vidurkio, iš pradžių buvo priskirti X chromosomai. Jei dauguma 5 kb langų, esančių kontigoje, buvo priskirti X, tada tęsinys buvo priskirtas X. Jei nebuvo daugumos arba jei tęsinys buvo <15 kb, mes negalėjome priskirti tęsinio. Priskyrimams buvo suteikti pasitikėjimo balai, svyruojantys nuo 0 iki 2, atsižvelgiant į sekos trukmę ir priskyrimo susitarimą tarp pakartojimų. Vienas taškas buvo suteiktas tiems kontigams, kurių ilgis >gt50 kb. Antrasis taškas buvo suteiktas, jei galutinė tęstinio priskyrimas, gautas sujungus visus pakartojimus, atitiko priskyrimą, gautą, kai pakartojimai buvo analizuojami atskirai. Genų priskyrimas ir pasitikėjimo balai pateikti S2 lentelėje.

MRNR sek

C. elegans (N2) ir P. pacificus (PS312). Lervų kirminai buvo padengti ir auginami 20 metų°. Kiekvienam iš trijų biologinių pakartojimų rankomis buvo atrinkta mažiausiai 750 jaunų suaugusių kirminų. Kirminai buvo plaunami nuo trijų iki penkių kartų M9. Buvo pridėta dešimt tūrių Trizol (Invitrogen). Mėginiai buvo penkis kartus šaldomi krekingo būdu, o RNR gryninimas atliktas pagal gamintojo protokolą. Izoliuota RNR buvo išvalyta naudojant Qiagen RNeasy rinkinį. mRNR buvo išgryninta naudojant Sera-Mag oligo (dT) granules (ThermoScientific) iš mažiausiai 1 μg visos RNR. Sujungtos mRNR-seq bibliotekos buvo paruoštos remiantis dUTP įtraukimu cDNR sintezės metu, naudojant anksčiau aprašytą protokolą (Parkhomchuk ir kt. 2009). Vieno galo 50 bp sekvenavimas buvo atliktas naudojant Illumina HiSeq-2000. Duomenys, skirti C. elegans (rūkas-2), C. brenneri, C. briggsae (ji-1), ir C. remanei buvo parsisiųsti iš GEO (prijungimo Nr. GSE41367). Skaitymai buvo suderinti su genomo versija WS228 su tophat v. 2.0.0 (Trapnell ir kt. 2012). Pagal numatytuosius parametrus kiekvienam skaitymui leidžiama pasiekti iki 20 įvykių. Skaitymo skaičiai ir atvaizdavimo procentai (kurie nurodo unikalių nuskaitymų procentą su bent vienu lygiavimu) pateikiami S1 lentelėje. Genų ekspresija buvo įvertinta naudojant Cufflinks v. 2.0.2 su numatytais parametrais ir pateikiant WS228 genų anotacijas. Nustatyta vidutinė vyrų ir moterų išraiška (FPKM, fragmentai kilobazės vienam milijonui kartografuotų skaitymų) (S6 lentelė). Neapdorotus skaitymo duomenis ir vidutinius rankogalių FPKM duomenis galima gauti iš GEO prisijungimo Nr. GSE53144. Diferencinė raiškos analizė tarp vyrų ir moterų buvo atlikta naudojant R paketą DESeq (Anders ir Huber 2010 R Development Core Team 2012). Šie rezultatai pateikiami S6 lentelėje.

Genų ekspresijos apibrėžimas pagal lytį

Norėdami apibrėžti lyties šališkumą, pirmiausia nustatėme tuos genus, kurie buvo skirtingai išreikšti tarp dviejų lyčių (DESeq qvalue < 0, 05). Genai, kurių FPKM >1 bent vienoje lytyje, buvo laikomi „išreikštais“ ir naudojami tolesnėms analizėms. Mes suskirstėme į lytį nukreiptus genus kaip tuos, kurių vienoje lytyje yra FPKM >1, o kitoje – FPKM >0. Kiekvieno lyties šališkumo geno lyties šališkumo dydis buvo apskaičiuotas kaip žurnalas2 FPKM reikšmių santykis tarp dviejų lyčių. Tie genai, kurių vienos lyties FPKM >1, o kitoje FPKM = 0, buvo priskirti „lyčiai būdingų“ genų kategorijai. „Nešališkus“ genus priskyrėme prie tų genų, kurių DESeq nevadino reikšmingais (qvalue > 0,05), kurių abiejų lyčių FPKM >1 ir kurių ekspresijos skirtumas tarp lyčių yra mažesnis nei dvigubai. Remdamiesi žurnalu, suskirstėme į kategorijas genus, turinčius didelę ir mažą lyties tendenciją2 lyties raiškos santykio riba yra 3 (S3 lentelė). The cutoff was selected based on a breakpoint in the distribution of sex-biased expression ratios driven largely by the gonadal expression of highly sex-biased genes (discussed further in Rezultatai ir DISKUSIJA).


Diskusija

We have presented a comprehensive characterization of genetic variation in 234 NXH samples of age over 60, which is the first whole-genome sequencing study of this ethnic group. Considering the unique history of the Hui population in China, the whole-genome data generated in this study is of great significance for the genomic studies of East Asian populations and Muslim populations and serves as a useful control data set for genetic association studies of late-onset diseases.

With this unprecedented data, we comprehensively revealed the genetic origins, admixture history, and population structure of NXH. Our results showed that NXH was most closely related to East Asian populations compared with other global populations. Moreover, NXH shared the majority of genetic makeup with the Han Chinese population. Interestingly, although the Hui and Han Chinese peoples were very similar in appearance ( Zheng et al. 1997), they were genetically distinguishable from each other, which could attribute to the western ancestry in NXH. Remarkable differences in the genetic makeup between NXH and HAN were observed. Specifically, four major ancestral components were identified in the NXH, which potentially were derived from ancestral populations in East Asia, Siberia, West Eurasia, and South Asia. In contrast, two major ancestral components were identified in HAN. Modeling admixture history indicated that these four ancestral components were derived from two earlier admixed populations. The eastern ancestry consisted of East Asian and Siberian ancestral components. The western ancestry consisted of West Eurasian, South Asian, and Siberian ancestral components. The population movement and gene flow between Siberia and West Eurasia across the Eurasian steppe has been reported by several studies ( Pugach et al. 2016 Sikora et al. 2019), which suggested the possibility that the Siberian ancestral component through western ancestry. Moreover, our simplified modeling of isolation by distance showed that it is unlikely to explain the history of NXH ( supplementary fig. S32 , Supplementary Material online), thus supporting the admixture model we proposed for NXH ( supplementary fig. S12 , Supplementary Material online). Besides, the admixture between eastern and western ancestries was sex-biased, with more Eastern females and Western males. Merchants, emissaries, and soldiers migrated from Arab, Persia, and Central Asia into China and those people were mainly males. Moreover, the Hui people practice endogamy and the marriage occurred mainly within the Huis. Intermarriage generally involves a Han Chinese converting to Islam, especially, marriages between Hui male and Han female were more frequent ( Jia 2006).

The distribution of the Huis is a result of the genetic origin, migration, and admixture history of this group. We observed a south-to-north cline within NXH. Specifically, the samples in southern Ningxia regions had a higher western ancestry proportion, which can be attributed to a few factors. First, the old Silk Road went through the southern Ningxia, which was the main route of the gene flow between East Asian and West Eurasian ( Gladney 1997) ( fig. 4A), which might have resulted in differentiated admixture between southern and northern NXH. Second, the Hui account for a higher total population percentage in southern Ningxia than in northern Ningxia, resulting in relatively fewer intermarriages between the Huis and Han Chinese in the south compared with that in the north. Indeed, intermarriage between Huis and other ethnic groups is much less frequent in southern than in northern Ningxia ( Yang 2002).

Interestingly, among the Hui people in Northwestern China, the genetic differentiation between southern and northern NXH was even larger than that between NXH and XJH, though Ningxia and Xinjiang were further apart geographically. Moreover, the western ancestry contribution was lower in XJH (10%) than that in some regions southern NXH (12%), although slightly higher than that in northern NXH (<9%). These results seemly unexpected, because compared with Ningxia, Xinjiang was geographically closer to Central Asia and West Eurasia and was the gateway for western people from Central Asia to enter the interior. However, it would be reasonable if historical documents were referred to, which recorded that the XJH were mainly immigrants from Northwestern China. For example, it is believed that the history of the Huis settlement in Xinjiang began after the suppression of the Junggar rebellion in the twentieth year of the Qing Emperor Qianlong (1755) ( Li 2010).

Also, our results suggested that Dungan was genetically more closely related to southern NXH. According to historical documents, Dungan were the Hui people who migrated from China into Central Asia in the year 1867. ADMIXTURE analysis suggested that there was no considerable gene flow between Dungan and surrounding populations after Dungan people migrated from China into Central Asia, which could due to that they speak the Sino-Tibetan language, whereas most of the surrounding populations speak Turkic language.

We evaluated the effect of some confounding factors on the inference of fine-scale population structure. ASD was commonly used to measure the genetic differentiation at the individual level. Compared with FST, it is not necessary to separate individuals into groups with different genetic backgrounds to estimate the allele frequency. Pairwise distance within one population was expected to be less than that between populations. However, we found that this was not true for the admixed population ( supplementary fig. S33 , Supplementary Material online). We performed a simulation to investigate whether this was due to the effect of admixture. Genetic distance within groups having higher western ancestry proportion was larger than that between groups having lower western ancestry proportion ( supplementary figs. S33 and S34 , Supplementary Material online). This was consistent with the larger ASD among samples from southern Ningxia ( supplementary fig. S35 , Supplementary Material online). The genetic distance between regions in southern Ningxia was larger than that between regions in northern Ningxia. This could partially explain the pattern observed in the estimated effective migration surfaces (EEMS) result that the lowest effective migration rate was among the southern regions in Ningxia ( supplementary fig. S35 , Supplementary Material online) and that genetic distance between NXH and HAN was less than genetic distance within NXH ( supplementary fig. S33 , Supplementary Material online).

We also found that enough markers were needed to detect fine-scale population structure ( supplementary fig. S36 , Supplementary Material online). Additionally, estimating admixture time is important to understand the history of the admixed population. We observed the admixture times inferred by ALDER and GLOBETROTTER are inconsistent with that inferred by MultiWaver 2.0. Both ALDER and GLOBETROTTER estimated that the admixture of NXH occurred 20 generations ago, whereas MultiWaver 2.0 identified an additional ancient admixture event that occurred 41 generations ago. Indeed, according to the recorded history, the admixture of the Hui population may have started as early as 1,400 years ago during the Tang and Song dynasties ( Chen 1999). Previous studies also suggested that MultiWaver 2.0 was more powerful than other methods in modeling ancient and complex admixture. For example, an ancient admixture of the Uyghurs that occurred in the Bronze Age was identified by MultiWaver 2.0, and has been confirmed by some recent ancient DNA studies ( Feng et al. 2017 Ning et al. 2019). MultiWaver 2.0 leveraged the information of length distribution of ancestral tracks and required the ancestral segments of local ancestry inference as input. However, many local ancestry inference methods need a priori admixture time. Our results showed that the marker density would affect the process to choose the optimized parameter, which would indirectly affect the result inferred based on the length distribution of ancestral tracks ( supplementary fig. S36 , Supplementary Material online). These findings valued the whole genome sequencing data in exploring the history of admixed populations such as the Huis.

Our results suggested a complex scenario of genetic origin, admixture history, and population structure in the Hui population. The two-wave model we proposed here does not necessarily mean there were only two admixture events in history. Rather, it suggested population admixture occurred at least more than once. Moreover, the first wave of admixture was estimated to occur 1,025 years (41 generations) ago, which might suggest the admixture event begins to occur 1,025 years ago at the latest. Furthermore, the admixture time could be underestimated ( Leslie et al. 2015). The ancient admixture we identified, that is, occurred over 1,025 years ago, is roughly corresponding to the late Tang Dynasty, and the Five Dynasties and Ten Kingdoms period. However, the intensive contact between western and eastern peoples might be common in the early Tang Dynasty according to historical records. Similarly, the time of a recent admixture that occurred nearly 500 years ago as we inferred in this study, corresponding to the Ming Dynasty, might be also underestimated. Again, according to the recorded history, west–east contacts were more frequent during the Mongolian Conquests in the 13th and 14th centuries. The concordance would be improved if we adopted a longer generation time, 29–30 years, as a previous study suggested ( Fenner 2005). Nonetheless, we believe history could be more complex than the simplified models as we presented in this study. We should point out that the Hui is one of the most distributed populations in China, the samples studied here were mainly descendants of the Hui people in Northwestern China, in which more than 51% of the Hui people are concentrated. Whether the Hui genomes in this study fully represent the diversity of the Hui China has not been evaluated. Further efforts in developing more sophisticated methods and recruiting more diverse population samples are expected to uncover a more comprehensive picture of the diversity, origins, and history of the Hui people.


Genetic study takes research on sex differences to new heights

Throughout the animal kingdom, males and females frequently exhibit sexual dimorphism: differences in characteristic traits that often make it easy to tell them apart. In mammals, one of the most common sex-biased traits is size, with males typically being larger than females. This is true in humans: Men are, on average, taller than women. However, biological differences among males and females aren’t limited to physical traits like height. They’re also common in disease. For example, women are much more likely to develop autoimmune diseases, while men are more likely to develop cardiovascular diseases.

In spite of the widespread nature of these sex biases, and their significant implications for medical research and treatment, little is known about the underlying biology that causes sex differences in characteristic traits or disease. In order to address this gap in understanding, Whitehead Institute Director David Page has transformed the focus of his lab in recent years from studying the X and Y sex chromosomes to working to understand the broader biology of sex differences throughout the body. Straipsnyje, paskelbtame m Mokslas, Page, a professor of biology at MIT and a Howard Hughes Medical Institute investigator Sahin Naqvi, first author and former MIT graduate student (now a postdoc at Stanford University) and colleagues present the results of a wide-ranging investigation into sex biases in gene expression, revealing differences in the levels at which particular genes are expressed in males versus females.

The researchers’ findings span 12 tissue types in five species of mammals, including humans, and led to the discovery that a combination of sex-biased genes accounts for approximately 12 percent of the average height difference between men and women. This finding demonstrates a functional role for sex-biased gene expression in contributing to sex differences. The researchers also found that the majority of sex biases in gene expression are not shared between mammalian species, suggesting that — in some cases — sex-biased gene expression that can contribute to disease may differ between humans and the animals used as models in medical research.

Having the same gene expressed at different levels in each sex is one way to perpetuate sex differences in traits in spite of the genetic similarity of males and females within a species — since with the exception of the 46th chromosome (the Y in males or the second X in females), the sexes share the same pool of genes. For example, if a tall parent passes on a gene associated with an increase in height to both a son and a daughter, but the gene has male-biased expression, then that gene will be more highly expressed in the son, and so may contribute more height to the son than the daughter.

The researchers searched for sex-biased genes in tissues across the body in humans, macaques, mice, rats, and dogs, and they found hundreds of examples in every tissue. They used height for their first demonstration of the contribution of sex-biased gene expression to sex differences in traits because height is an easy-to-measure and heavily studied trait in quantitative genetics.

“Discovering contributions of sex-biased gene expression to height is exciting because identifying the determinants of height is a classic, century-old problem, and yet by looking at sex differences in this new way we were able to provide new insights,” Page says. “My hope is that we and other researchers can repeat this model to similarly gain new insights into diseases that show sex bias."

Because height is so well studied, the researchers had access to public data on the identity of hundreds of genes that affect height. Naqvi decided to see how many of those height genes appeared in the researchers’ new dataset of sex-biased genes, and whether the genes’ sex biases corresponded to the expected effects on height. He found that sex-biased gene expression contributed approximately 1.6 centimeters to the average height difference between men and women, or 12 percent of the overall observed difference.

The scope of the researchers’ findings goes beyond height, however. Their database contains thousands of sex-biased genes. Slightly less than a quarter of the sex-biased genes that they catalogued appear to have evolved that sex bias in an early mammalian ancestor, and to have maintained that sex bias today in at least four of the five species studied. The majority of the genes appear to have evolved their sex biases more recently, and are specific to either one species or a certain lineage, such as rodents or primates.

Whether or not a sex-biased gene is shared across species is a particularly important consideration for medical and pharmaceutical research using animal models. For example, previous research identified certain genetic variants that increase the risk of Type 2 diabetes specifically in women however, the same variants increase the risk of Type 2 diabetes indiscriminately in male and female mice. Therefore, mice would not be a good model to study the genetic basis of this sex difference in humans. Even when the animal appears to have the same sex difference in disease as humans, the specific sex-biased genes involved might be different. Based on their finding that most sex bias is not shared between species, Page and colleagues urge researchers to use caution when picking an animal model to study sex differences at the level of gene expression.

“We’re not saying to avoid animal models in sex-differences research, only not to take for granted that the sex-biased gene expression behind a trait or disease observed in an animal will be the same as that in humans. Now that researchers have species and tissue-specific data available to them, we hope they will use it to inform their interpretation of results from animal models,” Naqvi says.

The researchers have also begun to explore what exactly causes sex-biased expression of genes not found on the sex chromosomes. Naqvi discovered a mechanism by which sex-biased expression may be enabled: through sex-biased transcription factors, proteins that help to regulate gene expression. Transcription factors bind to specific DNA sequences called motifs, and he found that certain sex-biased genes had the motif for a sex-biased transcription factor in their promoter regions, the sections of DNA that turn on gene expression. This means that, for example, a male-biased transcription factor was selectively binding to the promoter region for, and so increasing the expression of, male-biased genes — and likewise for female-biased transcription factors and female-biased genes. The question of what regulates the transcription factors remains for further study — but all sex differences are ultimately controlled by either the sex chromosomes or sex hormones.

The researchers see the collective findings of this paper as a foundation for future sex-differences research.

“We’re beginning to build the infrastructure for a systematic understanding of sex biases throughout the body,” Page says. “We hope these datasets are used for further research, and we hope this work gives people a greater appreciation of the need for, and value of, research into the molecular differences in male and female biology.”

This work was supported by Biogen, Whitehead Institute, National Institutes of Health, Howard Hughes Medical Institute, and generous gifts from Brit and Alexander d’Arbeloff and Arthur W. and Carol Tobin Brill.


Not all sex-biased genes are the same

In this issue of the New Phytologist, Sanderson ir kt. (pp. 527–539) characterize sexual dimorphism in gene expression in a long-lived dioecious tree (Populiarusis balsamiferas), adding a rare type of datapoint to the literature. The authors compared gene expression between the sexes from both reproductive (catkins) and somatic tissues (leaves). They found very limited sexual dimorphism in leaves, while reproductive tissues showed higher sexual dimorphism – c. 30% of the genes expressed in catkins were sex-biased. Sanderson ir kt. did not include genes that were only expressed in one sex, which should exclude most gene expression arising from sex-specific tissues.

Unlike most similar studies in other organisms, including dioecious willows (Darolti ir kt., 2017 ), there were twice as many female-biased genes compared to male-biased genes. This result demonstrates the usefulness of studying species from many domains of life, reproductive modes, and life histories. It nicely illustrates that very different genes can be sex-biased when different tissues or species are compared, and suggests that not all sex-biased genes evolve under the same constraints. In this context, the recent suggestion to split sexual dimorphism into primary and secondary, based on direct association with gamete production or not (Charlesworth, 2018 ), is a welcome step in the right direction. However, separate analysis of smaller subsets of sex-biased genes is likely to better inform independent biological processes that may produce results that cancel out when all sex-biased genes are analysed together.

Sex-biased genes are often assumed to evolve fast, because of their potential direct involvement in sexual antagonism (Zhang ir kt., 2004). In this context, the finding of Sanderson ir kt. that female-biased genes in catkins had atypically slow evolutionary rates is surprising. A similar result was obtained in the basket willow and may be attributed to haploid selection (the expression of many genes in haploid cells, as part of the normal life cycle of a plant), which would result in strong purifying selection (Darolti ir kt., 2017 ). To understand why these genes evolved slowly, the function of the sex-biased genes needs to be taken into account. Many of the female-biased genes identified by Sanderson ir kt. were associated with photosynthesis, which is an evolutionarily conserved process. Other explanations for slow evolutionary rates – such as the authors’ suggestion involving a combination of the old age of the sex chromosomes, prolonged dioecy and the assumption that rapid sequence evolution only occurs early in sex-chromosome evolution – may still be valid. However, these factors would be better suited to a subset of female-biased genes that excludes the evolutionarily conserved, female-biased, photosynthesis genes, such as those associated with immunity, which were also enriched in the female-biased genes identified by Sanderson ir kt.

The differentially expressed genes between the sexes will differ between species with different sexually dimorphic tissues. This is obvious to anyone who has held a P. balsamifera catkin and a Silene latifolia gėlė. However, when discussing sex-biased genes, cross-species comparisons in the numbers or rates of evolution of sex-biased genes are common. It is unlikely that all the genes differing in expression between sexes have the same evolutionary constraints, as illustrated in P. balsamifera, where many female-biased genes have resulted from a reduction in photosynthesis in male catkins. Treating sex-biased genes as a homogeneous group of genes, and investigating their evolution in different tissues and organisms, does not capture the complexity of differences in male and female biology.

The example of photosynthesis also illustrates the limitations of removing sex-specific genes and employing log2 fold change thresholds when defining sex bias, to avoid the effects of tissue composition, as Sanderson ir kt. did. While such methods are recommended to reduce the effects of allometric differences between samples (Montgomery & Mank, 2016 ), they do not help with comparisons between sexually dimorphic tissues, because fundamental differences between the sexes are due to sex-specific tissues. One solution is to avoid gene-expression comparisons between reproductive tissues, but this would remove tissues with genes showing high evolutionary rates, such as pollen in Arabidopsis thaliana (Gossmann ir kt., 2014 ) or accessory gland proteins in Drosophila (Swanson & Vacquier, 2002 ). Instead it is more important to accept that the comparison of two samples arising from the two sexes will never capture the complexity of sexual antagonism in a whole organism, such as sex allocation in hermaphrodites, sex-specific growth rates, differences in stress and investment in immunity.

One way to encompass these biological realities relating to sexual antagonism is to embrace the fact that the assumption that most parameters are unchanged when comparing two samples is not valid when two sexes are compared. Other than tissue composition, the two sexes often differ in the timing of gene expression. For example developmental time is different between animal meiotic tissue, with meiosis being ongoing or stalled in male and female animals, respectively. In addition, the sexes frequently differ in their overall pace of life, with males often adopting a ‘live fast, die young’ strategy (Immonen ir kt., 2018). Plants have the potential to inform our understanding of sexual dimorphism in many phenotypes associated with the pace of life, because they represent many independent data points of different life cycles, with trees representing one extreme, and annual plants the other. The availability of a plethora of sexually dimorphic traits makes plants particularly well suited to the study of sexual antagonism in biologically realistic conditions. These include some sexually antagonistic traits such as flowering time (Meagher & Delph, 2001 ) and other traits whose sexual antagonism interacts with environmental conditions (such as specific leaf area, which is sexually dimorphic only in sites with high water availability in S. latifolia Delph ir kt., 2011 ).

It is time to incorporate more biology in the discussion of sex-biased genes. One such case is when accounting for tissue specificity in gene expression, when investigating the evolutionary rate of sex-biased genes, which finds high tissue specificity in gene expression to explain fast protein-coding evolution better than sex bias (Meisel, 2011 ). The influence of genes associated with photosynthesis on the evolutionary rate of female-biased genes in P. balsamifera catkins is, essentially, such an example. Another parameter to consider involves the proportion of genes that are expressed in the haploid phase, which prevents degeneration of the allele restricted to the heterogametic sex (Chibalina & Filatov, 2011 ). The fact that such diverse cases of interesting biology can be studied through sex-biased gene expression, illustrates that grouping of genes into male- and female-biased is too broad. Sex-biased genes can be very different, depending on the tissue and species studied, and not all of them evolve under the same constraints.

The rationale for studying non-model organisms is often to understand how the tweaks in textbook biology that our species of interest represents affect evolutionary processes. Realizing and understanding the underlying biology behind sex-biased genes is essential before understanding the evolutionary forces that have resulted in their observed state of expression and sequence evolution. Gene expression studies such as Sanderson ir kt. are only the first step towards understanding the contribution of sexual antagonism to the observed differences between species.