Informacija

VCF informacijos lauke naudojamas vamzdžio simbolis

VCF informacijos lauke naudojamas vamzdžio simbolis


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Komentuodamas savo VCF failą su ClinVar, atkreipiau dėmesį į šią reikšmęCLNSIGsritis (t. y. klinikinė reikšmė):

CLNSIG=2|2|2|2|2|2|2

Tai iš tikrųjų pranešama šiame pavyzdyje, todėl manau, kad vamzdžio naudojimas yra gana įprastas tokio tipo genominėms anotacijoms.

Kam naudojamas vamzdis (|) charakteris? Aš jo ieškojau VCF failo formato specifikacijoje; tačiau tik kablelio reikšmė (,) yra nurodytas (t. y. kelios alternatyvios to lauko reikšmės). Vietoj to man įdomu, ką reiškia vamzdis.

Ačiū.


Getfasta¶

bedtools getfasta iš FASTA failo ištraukia sekas kiekvienam BED/GFF/VCF faile apibrėžtam intervalui.

1. Įvesties FASTA failo antraštės turi būti tiksliai atitiktų chromosomos stulpelį BED faile.

2. Norėdami nustatyti FASTA išvesties linijos plotį, galite naudoti UNIX fold komandą. Pavyzdžiui, sulankstant -w 60 kiekvienoje FASTA failo eilutėje bus ne daugiau kaip 60 nukleotidų, kad būtų lengviau peržiūrėti.

3. BED failams, kuriuose yra viena sritis, eilutės pabaigoje reikia naujos eilutės simbolio, kitaip sukuriamas tuščias išvesties failas.


KOMANDOS

Kiekviena komanda turi savo man puslapį, kurį galima peržiūrėti naudojant pvz. vyras samtools-view arba su neseniai naudotu GNU vyru man samtools vaizdas. Žemiau pateikiame trumpą sintaksės ir antrinių komandų aprašymo santrauką.

Visoms antrinėms komandoms bendros parinktys aprašytos toliau, skyriuje GLOBAL COMMAND OPTIONS.

Nenurodžius parinkčių ar regionų, visi nurodyto įvesties lygiavimo failo lygiavimai (SAM, BAM arba CRAM formatu) spausdinami į standartinę išvestį SAM formatu (be antraštės pagal numatytuosius nustatymus).

Po įvesties failo pavadinimo galite nurodyti vieną ar daugiau tarpais atskirtų regionų specifikacijų, kad išvestis būtų apribota tik tomis lygiuotėmis, kurios sutampa su nurodytu (-iais) regionu (-iais). Norint naudoti regiono specifikacijas, reikalingas koordinatėmis surūšiuotas ir indeksuotas įvesties failas.

Yra parinktys pakeisti išvesties formatą iš SAM į BAM arba CRAM, todėl ši komanda taip pat veikia kaip failo formato konvertavimo priemonė.

samtools tview [-p chr:pos] [-s STR] [-d ekranas] <in.sorted.bam> [ref.fasta]

Teksto lygiavimo peržiūros priemonė (pagal ncurses biblioteką). Peržiūros priemonėje paspauskite `? Norėdami gauti pagalbos, paspauskite „g“, kad patikrintumėte, ar lygiavimas prasideda nuo regiono tokiu formatu kaip „chr10:10,000,000“ arba „=10 000 000“, kai žiūrite tą pačią nuorodų seką.

Greitai patikrinkite, ar įvesties failai nepažeisti. Patikrina, ar failo pradžioje yra tinkama antraštė (visi formatai), kurioje yra bent viena tikslinė seka, tada ieško failo pabaigos ir patikrina, ar yra failo pabaiga (EOF) ir ji nepažeista (tik BAM).

Duomenys, esantys failo viduryje, neskaitomi, nes tai užtruktų daug daugiau laiko, todėl atkreipkite dėmesį, kad ši komanda neaptiks vidinių sugadinimų, bet yra naudinga norint patikrinti, ar failai nėra sutrumpinti prieš atliekant intensyvesnes užduotis.

Ši komanda bus baigta naudojant ne nulinį išėjimo kodą, jei įvesties failai neturi galiojančios antraštės arba trūksta EOF bloko. Priešingu atveju jis sėkmingai išeis (su nuliniu išėjimo kodu).

samtools indeksas [-bc] [-m INT] aln.sam.gz|aln.bam|aln.cram [out.index]

Indeksuokite koordinatėmis surūšiuotą SAM, BAM arba CRAM failą, kad galėtumėte greitai pasiekti atsitiktinę prieigą. Pastaba: SAM tai veikia tik tuo atveju, jei failas pirmiausia buvo suspaustas BGZF.

Šis indeksas reikalingas, kai regione argumentai naudojami siekiant apriboti samtools vaizdas ir panašias komandas į tam tikrus dominančius regionus.

Jei pateikiamas išvesties failo pavadinimas, indekso failas bus įrašytas out.index. Kitu atveju, CRAM failui aln.cram, rodyklės failas aln.cram.krai bus sukurtas BAM arba SAM failui aln.bam, arba aln.bam.bai arba aln.bam.csi bus sukurta, atsižvelgiant į pasirinktą rodyklės formatą.

samtools rūšiuoti [-l lygiu] [-m maxMem] [-o out.bam] [-O formatu] [-n] [-t žyma] [-T tmpprefiksas] [[email protected] siūlai] [in.sam|in.bam|in.cram]

Rūšiuoti lygiavimus pagal kairiąsias koordinates arba pagal skaitymo pavadinimą, kada -n yra naudojamas. Tinkamas @HD-SO Jei reikia, rūšiavimo tvarkos antraštės žyma bus pridėta arba esama atnaujinta.

Surūšiuota išvestis įrašoma į standartinę išvestį pagal numatytuosius nustatymus arba į nurodytą failą (out.bam) kada -o yra naudojamas. Ši komanda taip pat sukurs laikinus failus tmpprefiksas.%d.bam jei reikia, kai visi lygiavimo duomenys netelpa į atmintį (kaip valdoma per -m variantas).

Apsvarstykite galimybę naudoti samtools lyginti Vietoj to, jei jums reikia pavadinimų sugretintų duomenų be visos leksikografinės rūšiavimo.

Sumaišo ir grupės skaito kartu pagal savo vardus. Greitesnė alternatyva viso užklausos pavadinimo rūšiavimui, sugretinti užtikrina, kad to paties pavadinimo skaitymai būtų sugrupuoti į gretimas grupes, bet negarantuoja pavadinimų skaitymo tvarkos tarp grupių.

Šios komandos išvestis turėtų būti tinkama bet kuriai operacijai, kuriai reikia, kad visi skaitymai iš to paties šablono būtų sugrupuoti.

Gaukite ir spausdinkite statistiką indekso faile, atitinkančiame įvesties failą. Prieš iškviečiant idxstats, įvesties BAM failas turi būti indeksuojamas samtools indeksu.

Jei paleista SAM arba CRAM faile arba neindeksuotame BAM faile, ši komanda vis tiek pateiks tą pačią suvestinę statistiką, tačiau tai daroma perskaitant visą failą. Tai daug lėčiau nei naudojant BAM indeksus.

Išvestis yra atskirta TAB, kiekviena eilutė susideda iš nuorodos sekos pavadinimo, sekos ilgio, # susieto skaitymo ir # nesusieto skaitymo. Tai parašyta stdout.

Pereina visą įvesties failą, kad apskaičiuotų ir spausdintų statistiką į stdout.

Pateikiamas kiekvienos iš 13 kategorijų skaičius, visų pirma remiantis bitų vėliavėlėmis FLAG lauke. Kiekviena išvesties kategorija yra suskirstyta į QC patvirtintą ir nesėkmingą kokybės kontrolę, kuri pateikiama kaip „#PASS + #FAIL“, po kurios pateikiamas kategorijos aprašymas.

Konvertuoti tarp tekstinio ir skaitmeninio vėliavėlės vaizdavimo.

VĖLIAVAS:

0x1SUporuotassuporuoto galo (arba kelių segmentų) sekos technologija
0x2PROPER_PAIRkiekvienas segmentas tinkamai sulygiuotas pagal lygintuvą
0x4UNMAPsegmentas nepažymėtas
0x8MUNMAPkitas šablono segmentas nepriskirtas
0x10ATvirkščiaiSEQ papildyta atvirkščiai
0x20ATGRIEŽTAIKito šablono segmento SEQ papildyta atvirkščiai
0x40SKAITYTI1pirmas segmentas šablone
0x80SKAITYTI2paskutinis segmentas šablone
0x100ANTRINĖantrinis derinimas
0x200QCFAILnepraeina kokybės kontrolės
0x400DUPPGR arba optinis dublikatas
0x800PAPILDOMASpapildomas derinimas

samtools statistika renka statistiką iš BAM failų ir išveda teksto formatu. Išvestis gali būti vizualizuota grafiškai naudojant plot-bamstats.

Praneša apie bendrą skaitymo bazių skaičių (t. y. kiekvieno bazinio skaitymo gylio sumą) kiekviename genomo regione, nurodytame pateiktame BED faile. Regionai išvedami taip, kaip rodomi BED faile ir yra pagrįsti 0. Kiekvieno pateikto derinimo failo skaičiai pateikiami atskiruose stulpeliuose.

Apskaičiuoja skaitymo gylį kiekvienoje padėtyje ar regione.

samtools ampliconstats renka statistiką iš vieno ar kelių įvesties derinimo failų ir sukuria lenteles teksto formatu. Išvestis gali būti vizualizuota grafiškai naudojant plot-amplikonstats.

Išlygiavimo failai anksčiau turėjo būti iškirpti iš pradmenų sekos, pavyzdžiui, pagal samtools amplikonclip o šių gruntų vietas argumentuose reikėtų nurodyti kaip lovos failą.

samtools mpileup [-EB] [-C capQcoef] [-r reg] [-f in.fa] [-l sąrašą] [-K minBaseQ] [-q minMapQ] in.bam [in2.bam [. ]]

Sukurkite tekstinį krūvą vienam ar keliems BAM failams. VCF ir BCF išvestims naudokite bcftools mpileup vietoj to komandą. Lygiavimo įrašai yra sugrupuoti pagal pavyzdinius (SM) identifikatorius @RG antraštės eilutėse. Jei pavyzdžio identifikatorių nėra, kiekvienas įvesties failas laikomas vienu pavyzdžiu.

Pileup formato ir parinkčių aprašymą rasite samtools-mpileup vadovo puslapyje.

Sukuria kiekvienos chromosomos aprėpties histogramą arba lentelę.

samtools merge [-nur1f] [-h inh.sam] [-t žyma] [-R reg] [-b sąrašą] out.bam in1.bam [in2.bam in3.bam . inN.bam]

Sujunkite kelis surūšiuotus lygiavimo failus, sukurdami vieną surūšiuotą išvesties failą, kuriame yra visi įvesties įrašai ir išlaikoma esama rūšiavimo tvarka.

Jeigu -h nurodyta įvesties failų @SQ antraštės bus sujungtos į nurodytą antraštę, kitu atveju jos bus sujungtos į sudėtinę antraštę, sukurtą iš įvesties antraščių. Jei @SQ antraštės skiriasi viena po kitos, sujungus išvesties failą gali reikėti iš naujo rūšiuoti.

Įrašų tvarka įvesties failuose turi atitikti naudojimą -n ir -t komandinės eilutės parinktis. Jei to nepadarys, išvesties tvarka bus neapibrėžta. Pamatyti rūšiuoti informacijos apie įrašų užsakymą.

samtools padalintas [galimybės] susiliejo.sam|susiliejo.bam|susiliejo.cram

Padalija failą pagal skaitymo grupes ir sukuria vieną ar daugiau išvesties failų, atitinkančių bendrą priešdėlį (pagal numatytuosius nustatymus pagal įvesties failo pavadinimą), kurių kiekviename yra viena skaitymo grupė.

samtools katė [-b sąrašą] [-h antraštė.sam] [-o out.bam] in1.bam in2.bam [ . ]

Sujunkite BAM arba CRAM. Nors tai veikia BAM arba CRAM, visi įvesties failai turi būti vienodo formato. Kiekvieno įvesties failo sekos žodynas turi būti identiškas, nors ši komanda to netikrina. Ši komanda naudoja panašų triuką kaip perrašymas kuri įgalina greitą BAM sujungimą.

samtools fastq [galimybės] in.bam
samtools fasta [galimybės] in.bam

Konvertuoja BAM arba CRAM į FASTQ arba FASTA formatą, priklausomai nuo iškviestos komandos. Failai bus automatiškai suglaudinti, jei failų pavadinimai turi .gz arba .bgzf plėtinį.

Šios programos įvestis turi būti sugretinta pagal pavadinimą. Naudokite samtools lyginti arba samtools rūšiuoti -n tai užtikrinti.

samtools faidx <ref.fasta> [region1 [. ]]

Indeksuokite nuorodų seką FASTA formatu arba ištraukite poseką iš indeksuotos nuorodos sekos. Jei regionas nenurodytas, faidx indeksuos failą ir sukurs <ref.fasta>.fai diske. Jei nurodyti regionai, posekos bus nuskaitytos ir išspausdintos į stdout FASTA formatu.

Įvesties failas gali būti suspaustas BGZF formatu.

FASTQ failus galima nuskaityti ir indeksuoti naudojant šią komandą. Nenaudojant --greitai bet kokia ištraukta seka bus FASTA formatu.

samtools fqidx <ref.fastq> [region1 [. ]]

Indeksuokite nuorodų seką FASTQ formatu arba ištraukite poseką iš indeksuotos nuorodų sekos. Jei regionas nenurodytas, fqidx indeksuos failą ir sukurs <ref.fastq>.fai diske. Jei nurodyti regionai, posekos bus nuskaitytos ir išspausdintos į stdout FASTQ formatu.

Įvesties failą galima suspausti BGZF formatu.

samtools fqidx turėtų būti naudojamas tik „fastq“ failuose su nedideliu įrašų skaičiumi. Bandant jį naudoti faile, kuriame yra milijonai trumpų sekų nuskaitymų, bus sukurtas indeksas, kurio dydis bus beveik toks pat, kaip ir pradinis failas, o paieška naudojant indeksą bus labai lėta ir naudos daug atminties.

samtools dikt ref.fasta|ref.fasta.gz

Sukurkite sekos žodyno failą iš fasta failo.

samtools nurimo [-Eeubr] [-C capQcoef] aln.bam ref.fasta

Sugeneruokite MD žymą. Jei MD žyma jau yra, ši komanda įspės, jei sugeneruota MD žyma skiriasi nuo esamos žymos. SAM išvestis pagal numatytuosius nustatymus.

Calmd taip pat gali skaityti ir rašyti CRAM failus, nors daugeliu atvejų tai yra beprasmiška, nes CRAM perskaičiuoja MD ir NM žymas. Vienintelė šio atvejo išimtis yra tai, kad įvesties ir išvesties CRAM failai buvo sukurti / yra kuriami naudojant no_ref variantas.

samtools fixmate [-rpcm] [-O formatu] in.nameSrt.bam out.bam

Užpildykite pagalbines koordinates, ISIZE ir mate susijusias vėliavėles iš lygiavimo pagal pavadinimą.

samtools žymėjimas [-l ilgio] [-r] [-s] [-T] [-S] in.algsort.bam out.bam

Pažymėkite pasikartojančius lygiavimus iš koordinatėmis surūšiuoto failo, kuris buvo paleistas samtools fixmate su -m variantas. Ši programa remiasi MC ir ms žymomis, kurias teikia fixmate.

samtools rmdup [-sS] <input.srt.bam> <out.bam>

Ši komanda yra pasenusi. Vietoj to naudokite žymėjimą.

samtools addreplacerg [-r rg linija | -R rg-ID] [-m režimu] [-l lygiu] [-o out.bam] in.bam

Prideda arba pakeičia skaitytų grupių žymas faile.

samtools antraštė [-iP] in.header.sam in.bam

Pakeiskite antraštę in.bam su antrašte in.header.sam. Ši komanda yra daug greitesnė nei antraštės pakeitimas BAM&rarrSAM&rarrBAM konversija.

Pagal numatytuosius nustatymus ši komanda išveda BAM arba CRAM failą į standartinę išvestį (stdout), tačiau CRAM formato failams ji turi galimybę atlikti redagavimą vietoje, nuskaitant ir rašant į tą patį failą. Antraštės tinkamumo tikrinimas neatliekamas ir ar ji tinkama naudoti su pačiais sekos duomenimis.

samtools targetcut [-K minBaseQ] [-i nuobauda] [-0 em0] [-1 em1] [-2 em2] [-f ref] in.bam

Ši komanda identifikuoja tikslinius regionus, tirdama skaitymo gylio tęstinumą, apskaičiuoja haploidines taikinių konsensuso sekas ir išveda SAM su kiekviena seka, atitinkančia taikinį. Kai variantas -f yra naudojamas, bus taikomas BAQ. Ši komanda yra tik skirtas pjauti fosmidų klonus iš fosmidų telkinio sekos [Nuor. Kitzman ir kt. (2010)].

samtools fazė [-AF] [-k len] [-b priešdėlis] [-q minLOD] [-Q minBaseQ] in.bam

Iškvieskite ir fazuokite heterozigotinius SNP.

samtools depad [-SsCu1] [-T ref.fa] [-o išvestis] in.bam

Konvertuoja BAM, išlygiuotą pagal paminkštintą nuorodą, į BAM, išlygiuotą pagal pašalintą nuorodą. Paminkštintoje nuorodoje gali būti pažodinės „*“ bazės, tačiau „*“ pagrindai taip pat skaičiuojami nuorodos numeracijoje. Tai reiškia, kad sekos bazinis skambutis, suderintas su nuoroda „*“, laikomas cigarų atitikmens („M“ arba „X“) operatoriumi (jei bazinis skambutis yra „A“, „C“, „G“ arba "T"). Pašalinus nuorodą „*“ bazės ištrinamos ir tokios sulygiuotos sekos baziniai iškvietimai tampa įterpimais. Panašiai transformacijos taikomos ištrynimo ir cigarų užpildymo operacijoms.

samtools amplikonclip [-o out.failas] [-f stat.failas] [--minkštas klipas] [-- kietas klipas] [--abu galai] [-- sruoga] [-- nukirpta] [-- nepavyks] [-- ne-PG] -b lova.failas in.failas

Klipas nuskaitomas su SAM suderinamame faile pagal duomenis iš BED failo.


Įgyvendinimas

Apžvalga vcfanno funkcionalumą

Vcfanno komentuoja variantus VCF faile („užklausos“ intervalai) su informacija, sukaupta iš susikertančių intervalų rinkinio tarp daugelio skirtingų anotacijų failų („duomenų bazės“ intervalų), saugomų įprastais genomo formatais, tokiais kaip BED, GFF, GTF, VCF ir BAM. Jis naudoja "srautinės" sankirtos algoritmą, kuris naudoja surūšiuotus įvesties failus, kad žymiai sumažintų atminties suvartojimą ir padidintų greitį. Vykdant srautinio perdavimo sankirtą (išsamesnė informacija žemiau), duomenų bazės intervalai susiejami su užklausos intervalu, jei yra intervalų sankirta. Kai žinomos visos konkretaus užklausos intervalo sankirtos, anotacija tęsiama pagal vartotojo apibrėžtas operacijas, taikomas atributams (pvz., stulpeliui „balas“ BED anotacijos faile arba atributui VCF komentaro INFO lauke failą) duomenų bazės intervalais. Kaip paprastą pavyzdį apsvarstykite vieno nukleotido variantų (SNV) užklausą VCF, kurią anotavo SNV iš anotacijų duomenų bazės, pvz., dbSNP šaltinio VCF failo. Tokiu atveju užklausos ir duomenų bazės variantai suderinami pozicijos, REF ir ALT laukuose, kai yra, o reikšmė iš persidengiančio duomenų bazės intervalo (pvz., nedidelio alelio dažnis) perkeliama į toliau, kad taptų anotacija, saugoma INFO lauke užklausa VCF. Sudėtingesniame scenarijuje, kai užklausos struktūrinis variantas kerta kelis anotacijų intervalus iš kiekvienos duomenų bazės, informacija iš tų intervalų turi būti apibendrinta. Galima norėti pranešti apie kiekvieną atributą kaip kableliais atskirtą sąrašą, naudojant operaciją „concat“. Arba galima pasirinkti maksimalų alelio dažnį naudojant „max“ operaciją. Tais atvejais, kai su užklausa susietas tik vienas duomenų bazės intervalas, operacijos pasirinkimas neturės įtakos apibendrintai vertei.

VCF INFO lauko pavyzdys iš vieno varianto prieš ir po anotacijos su vcfanno 1 pav. Paprastas konfigūracijos failas naudojamas šaltinio failams ir atributų rinkiniui (VCF atveju) arba stulpelių rinkiniui (BED arba kitų tabuliavimo formatų atveju), kuriuos reikia pridėti, nurodyti. į užklausos failą. Be to, konfigūracijos failas leidžia pervardyti komentarus gautame VCF INFO lauke. Pavyzdžiui, galime ištraukti alelio dažnio (AF) atributą iš ExAC VCF failo [9] ir VCF užklausos įrašų INFO lauke pervadinti jį į „exac_aaf“. Konfigūracijos failas leidžia iš bet kokio skaičiaus anotacijų duomenų rinkinių išgauti tiek atributų, kiek reikia.

Apžvalga vcfanno darbo eiga. VCF be komentarų (a) siunčiamas į vcfanno (b) kartu su konfigūracijos failu, kuriame nurodomi anotacijų failų keliai, atributai, kuriuos reikia ištraukti iš kiekvieno failo, ir metodai, kurie turėtų būti naudojami apibūdinti arba apibendrinti iš tų failų ištrauktas reikšmes. Nauji komentarai gautame VCF (c) rodomi mėlynu tekstu su papildomais laukeliais, įtrauktais į stulpelį INFORMACIJA

Chromo nuvalymo algoritmo apžvalga

Chromosomų valymo algoritmas („chrom-sweep“) yra srautinio perdavimo, rūšiavimo ir sujungimo sujungimo algoritmo pritaikymas ir gali efektyviai aptikti kelių intervalų failų intervalų sankirtas, jei jos yra surūšiuotos pagal chromosomas ir intervalo pradžios padėtį. . Naudojamas tiek BEDTOOLS [10, 11], tiek BEDOPS [12], „chrom-sweep“ randa sankryžas vienu praėjimu, kiekviename faile pastumdamas rodykles, kurios sinchronizuojamos pagal genomo padėtį. Kiekviename šlavimo žingsnyje šios rodyklės palaiko intervalų rinkinį, kuris kerta tam tikrą padėtį ir, savo ruožtu, kerta vienas kitą. Ši strategija yra naudinga dideliems duomenų rinkiniams, nes vengiama naudoti duomenų struktūras, tokias kaip intervalų medžiai ar hierarchinės talpyklos (pvz., UCSC sujungimo algoritmas [13]). Nors šiems medžio ir suskirstymo metodams nereikia surūšiuotos įvesties, šių metodų atminties plotas prastai keičiasi, ypač lyginant su srautinio perdavimo algoritmais, kuriems paprastai būdingas mažas vidutinis atminties poreikis.

Chromo nuvalymo algoritmas įdiegtas vcfanno vyksta taip.Pirmiausia sukuriame užklausos VCF ir kiekvieno duomenų bazės anotacijos failo intervalų įrašų iteratorių. Tada sujungiame intervalus iš užklausos VCF ir kiekvienos anotacijos į vieną prioritetinę eilę, kuri suskirsto intervalus iš visų failų pagal chromosomas ir pradžios koordinates, taip pat stebi failą, iš kurio kilo kiekvienas intervalas. Vcfanno progresuoja, prašydamas intervalo iš prioritetinės eilės ir įterpia jį į talpyklą. Jei paskutinis pastebėtas intervalas yra iš užklausos VCF, patikriname, ar nėra susikirtimų su visais duomenų bazės intervalais, kurie šiuo metu yra talpykloje. Nuo vcfanno reikalauja, kad visi failai būtų rūšiuojami, žinome, kad intervalai įvedami į talpyklą, išdėstyti pagal pradžios koordinates. Todėl, norėdami patikrinti, ar nėra persidengimo, turime tik patikrinti, ar naujo intervalo pradžia yra mažesnė nei bet kurio talpykloje esančio intervalo pabaiga (darant prielaidą, kad intervalai yra pusiau atviri). Išvalymo algoritmo pavyzdys parodytas 2 pav. atvejis, apimantis du anotacijų failus ir tris įrašus iš vienos užklausos VCF. Talpyklos turinys rodomas, kai šlavimas pasiekia kiekvieno naujo intervalo pradžią. Kai į talpyklą patenka naujas užklausos intervalas, bet koks intervalas, kuris jo nesikerta, pašalinamas iš talpyklos. Jei pašalintas intervalas atsirado iš užklausos VCF, jis siunčiamas kartu su kiekvienu susikertančiu anotacijos intervalu, kad būtų apdorotas pagal konfigūracijos faile nurodytas operacijas. Gautos anotacijos saugomos VCF failo INFO lauke, o atnaujintas VCF įrašas pateikiamas kaip išvestis.

Chromo nubraukimo intervalo sankirtos algoritmo apžvalga. Chromo valymo algoritmas nušluoja iš paliko į teisingai jam progresuojant išilgai kiekvienos chromosomos. Žalias intervalai iš užklausos VCF pirma eilė yra komentuojami komentarų failais A (mėlyna) ir B (oranžinė) viduje konors antra ir trečios eilės, atitinkamai. Talpyklos eilutė rodo, kurie intervalai šiuo metu yra talpykloje kiekviename valymo algoritmo eigos taške. Intervalai įvedami į talpyklą pagal jų chromosomų pradinę padėtį. Pirmas A1 įeina į talpyklą, po kurios seka Q1. Nuo Q1 susikerta A1, jie yra susiję, kaip ir yra Q1 ir B1 kada B1 patenka į talpyklą. Kiekvieną kartą, kai į talpyklą patenka naujas užklausos intervalas, bet koks intervalas, kurio jis nesikerta, pašalinamas. Todėl kai Q2 patenka į talpyklą, Q1 ir A1 yra išstumiami. Nuo Q1 yra užklausos intervalas, jis siunčiamas pranešti kaip išvestis. Einant į dešinę, A2 ir tada Q3 Įveskite talpyklą, pastarasis yra užklausos intervalas, taigi intervalai, kurie jo nepersidengia -B1, Q2, ir A2- pašalinami iš talpyklos su užklausos intervalu, Q2, kuris siunčiamas skambinančiajam. Galiausiai, kai pasiekiame įeinančių intervalų pabaigą, išaiškiname finalą Q3 intervalą ir užbaigti šios chromosomos išvestį. EOF: failo pabaiga

Chromo nuvalymo algoritmo apribojimai

Dėl to, kad anotacijų rinkiniai nėra įkeliami į daug atminties reikalaujančias duomenų struktūras, chromo šlavimo algoritmas lengvai pritaikomas dideliems duomenų rinkiniams. Tačiau jis turi keletą svarbių apribojimų. Pirma, reikalaujama, kad visi intervalai iš visų anotacijų failų atitiktų tą pačią chromosomų tvarką. Nors konceptualiai paprasta, tai ypač sudėtinga, nes VCF, kuriuos sukuria alternatyvūs skambintojai, pvz., GATK, nustato kitokią chromosomų tvarką (1, 2, …21, X, Y, MT) nei dauguma kitų skaitiniu būdu surūšiuotų anotacijų failų, dėl kurių MT būtų prieš X. ir Y. Žinoma, rūšiuojant skaitines chromosomas kaip simbolius arba sveikuosius skaičius taip pat atsiranda skirtinga rūšiavimo tvarka. Chromosomų eilės neatitikimai tarp failų dažnai neaptinkami, kol jau neatliekamas esminis skaičiavimas. Susijusi problema yra ta, kad kai viename faile yra intervalai iš tam tikros chromosomos, kurių kitame nėra, neįmanoma atskirti, ar chromosomų tvarka skiriasi, ar tos chromosomos tiesiog nėra viename iš failų, kol nebus išanalizuoti visi intervalai.

Antra, standartinis chromo nuvalymo diegimas yra neoptimalus, nes jis dažnai yra priverstas apsvarstyti (ir išanalizuoti) daugybę anotacijų intervalų, kurie niekada nesusikirs su užklausos intervalais, todėl reikia atlikti nereikalingą darbą [14]. Pvz., atsižvelgiant į VCF failą variantų, kurie yra retai pasiskirstę visame genome (pvz., VCF iš vieno egzomo tyrimo) ir tankius viso genomo anotacijų duomenų rinkinius, chromo nuskaitymas turi išanalizuoti ir išbandyti kiekvieną viso intervalo intervalą. genomo anotacijos, skirtos susikirtimui su užklausos intervalu, net jei dominančios sritys sudaro mažiau nei 1 % failo regionų. Kitaip tariant, retos užklausos su tankiais anotacijų failais yra blogiausias chromo nuvalymo našumo scenarijus, nes didelė duomenų rinkinių intervalų dalis niekada nesusikirs.

Trečias chromo nuvalymo algoritmo apribojimas yra tas, kad dėl algoritmui būdingo nuoseklaus pobūdžio sunku lygiagrečiai aptikti intervalų susikirtimus, o vieno procesoriaus našumą riboja greitis, kuriuo galima analizuoti intervalus. Kadangi intervalai pateikiami surūšiuota tvarka, sunku praleisti į priekį ir apdoroti naują sritį iš kiekvieno failo skirtingoje apdorojimo gijoje be iš anksto apskaičiuoto erdvinio intervalų indekso ir pateikiant intervalus surūšiuota tvarka po susikirtimo, reikia papildomos apskaitos.

Lygiagretusis chromo šlavimo algoritmas

Norėdami pašalinti šiuos trūkumus, sukūrėme paralelinį algoritmą, kuris vienu metu chromuoja užklausų ir duomenų bazės intervalų „gabalėlius“. Skirtingai nuo ankstesnių atmintyje lygiagretaus valymo metodų, kurie tolygiai skaido įvestį [15], mes apibrėžiame (be išankstinio apdorojimo [16]) dalis nuosekliais užklausos intervalais, atitinkančiais vieną iš dviejų kriterijų: arba rinkinys pasiekia „gabalo dydį“. slenkstis arba genomo atstumas iki kito intervalo viršija „tarpo dydžio“ slenkstį. Apribojus gabalo dydį, sukuriamas pakankamai tolygus darbas tarp gijų, kad būtų palaikomas efektyvus apkrovos balansavimas (t. y., kad būtų išvengta užduočių skirtumų). Tarpo dydžio ribojimas sukurtas taip, kad būtų išvengta pernelyg didelio nesusijusių duomenų bazės intervalų, esančių tarp tolimų užklausų intervalų, apdorojimo.

Kai tik dalis apibrėžiama, suplanuojama, kad ji bus lygiagrečiai nuvaloma kartu su kitais anksčiau apibrėžtais gabalais. Užklausos intervalų ribos gabale nustato intervalų, kurių prašoma iš kiekvieno anotacijos failo, diapazoną (3 pav.). Šiuo metu šios užklausos yra į Tabix [17] indeksuotą failą arba BAM failą per bíogo paketą [18], tačiau bet kokia erdvinė užklausa gali būti lengvai palaikoma. Svarbus duomenų bazės intervalų rinkimo naudojant šias užklausas šalutinis poveikis yra tas, kad nors anotacijų failai turi būti rūšiuojami, nereikia, kad anotacijų chromosomų tvarka atitiktų. Tai kartu su vidiniu bet kokio „chr“ priešdėlio pašalinimu palengvina susijusią chromosomų tvarką ir vaizdavimo sudėtingumą, aprašytą aukščiau. Šių užklausų intervalų rinkinys integruojamas su užklausos intervalais, kad būtų užbaigta dalis, kuri vėliau apdorojama standartiniu chromo nuvalymo algoritmu. Tačiau praktiškai tai atliekama srautais, todėl atmintyje saugomi tik užklausos intervalai, o anotacijų intervalai nuskaitomi iš jų iteratorių chromo valymo metu. Viena iš šios strategijos našumo kliūčių yra ta, kad išvestis turi būti rūšiuojama, o kadangi dalys gali būti baigtos bet kokia tvarka, turime užpildyti užbaigtas dalis, kad atkurtume surūšiuotą tvarką. Tai, kartu su disko greičio apribojimais, yra pagrindinis papildomų išlaidų šaltinis, neleidžiantis optimaliam lygiagretinimo efektyvumui.

Lygiagretaus šlavimo algoritmas. Kaip ir 2 pav., mes braukiame per chromosomą iš žemesnės į aukštesnę padėtį (ir paliko į teisingai paveiksle). The žalias užklausos intervalai turi būti pažymėti dviem komentarų failais, pavaizduotais su mėlyna ir oranžinė intervalais. Lygiagretinimas įvyksta gabaliukais užklausos intervalų, nubrėžtų juodos vertikalios linijos. Vienas procesas nuskaito užklausos intervalus į atmintį, kol pasiekiamas maksimalus tarpo dydis iki kito intervalo (pvz., 2, 4 gabalai) arba intervalų skaičius viršija gabalų dydžio slenkstį (pvz., 1, 3 dalys). Kol kaupiasi naujas užklausų intervalų rinkinys, pirmasis gabalas, kurį dešinėje riboja pirmasis vertikali juoda linija Aukščiau, yra siunčiamas nuvalyti, o rezervuota vieta įtraukiama į FIFO (pirmas įeinantis, pirmasis išeinantis) eilę, kad išvestis liktų surūšiuota, net jei kiti gabalai gali baigtis pirmi. Anotacijos failų užklausos pateikiamos su regionais, remiantis intervalų ribomis užklausos dalyje. Tada užklausos grąžina intervalų srautus ir galiausiai tie srautai siunčiami į chromo nuvalymo algoritmą naujame procese. Kai jis baigsis, jo rezervuota vieta gali būti ištraukta iš FIFO eilės ir pateikiami rezultatai

Vcfanno įgyvendinimas

Vcfanno yra parašyta Go (https://golang.org), o tai suteikia daug privalumų. Pirma, „Go“ palaiko kryžminį kompiliavimą 32 ir 64 bitų sistemoms, skirtoms „Mac“, „Linux“ ir „Windows“. „Go“ pasirodymas tai reiškia vcfanno gali palyginti greitai apdoroti didelius duomenų rinkinius. „Go“ taip pat siūlo paprastą lygiagretumo modelį, leidžiantį vcfanno lygiagrečiai atlikti sankryžas, sumažinant lenktynių sąlygų ir apkrovos balansavimo problemų, kurios dažnai vargina lygiagrečius diegimus, galimybę. Be to, kaip parodome skiltyje „Rezultatai“, vcfannoLygiagretus chromo nuvalymo algoritmo įgyvendinimas užtikrina greitį ir mastelį. Galiausiai, tai labai lankstus įrankis, nes palaiko daugelio įprastų formatų, tokių kaip BED, VCF, GFF, BAM ir GTF, komentarus.


%>% .$stulpelio_pavadinimo atitikmuo R pagrindiniam vamzdžiui |>

Baziniame vamzdyje nepateikiama vieta duomenims, kurie perduodami vamzdžiu. Tai yra vienas skirtumas tarp magrittr vamzdžio ir bazinio R vamzdžio. Norėdami pasiekti objektą, galite naudoti anoniminę funkciją.

Tiesioginis $ naudojimas |> šiuo metu išjungtas. Galbūt viena priežastis galėtų būti rašymas

Jei vis tiek reikia iškviesti $ (arba kitas išjungtas funkcijas |>), šalia funkcijos sukūrimo, panašiai kaip @jay-sf sprendimas, yra naudoti $ per funkciją :: kaip bazę: :`Naudokite vamzdžio simbolį VCF informacijos lauke – Biologija, [nobr][H1toH2] arba įdėkite jį į stabdžius ( $ ):

Kitas variantas gali būti a keistas vamzdis ->. . Vieni tai vadina pokštu, kiti sumaniai naudoja esamą sintaksę.

Tai sukuria arba perrašo . .GlobalEnv. rm(.) galima jį pašalinti. Arba jį galima apdoroti vietiniu būdu:

Šiuo atveju jis sukuria du tuos pačius objektus aplinkoje rainelės ir . bet kol jie yra nepakeistas jie nurodo tą patį adresą.


Kas naujo?

Neregėtas greitis
Dėl intensyvaus bitų operatorių naudojimo, nuoseklių atminties prieigos modelių, kelių gijų ir aukštesnio lygio algoritminių patobulinimų PLINK 1.9 yra daug, daug greitesnis nei PLINK 1.07 ir kita populiari programinė įranga. Keletas sudėtingiausių darbų, įskaitant tapatybės pagal būseną matricos skaičiavimą, atstumu pagrįstą klasterizavimą, LD pagrįstą genėjimą, haplotipo blokų identifikavimą ir asociacijos analizės max(T) permutacijos testus, dabar atlieka šimtus ar net tūkstančius kartų greičiau. , o dėl įvesties/išvesties patobulinimų net ir pačios smulkmeniškiausios operacijos paprastai būna 5–10 kartų greitesnės.

Skubame pridurti, kad didžioji dauguma idėjų, prisidedančių prie PLINK 1.9 našumo, kai kuriais atvejais buvo sukurtos kitur, mes tiesiog perkėlėme mažai žinomus, bet puikius įgyvendinimus be reikšmingos papildomos peržiūros (net ir galbūt neatpažįstamai apmaudus, atsiprašau, Romanas.). Žr. kreditų puslapį, kuriame pateikiamas dalinis žmonių, kuriems reikia padėkoti, sąrašas. Kalbant apie susijusią pastabą, jei žinote apie PLINK komandos įgyvendinimą, kuris yra daug geresnis nei šiuo metu, praneškite mums, kad mielai pereisime prie jų algoritmo ir nurodysime juos savo dokumentuose ir dokumentuose.

Beveik neribotas mastas
Pagrindinės genominių duomenų matricos nebereikia tilpti į RAM, todėl pažangiausius duomenų rinkinius, kuriuose yra milijonai variantų iškvietimų iš dešimčių tūkstančių mėginių egzome arba viso genomo sekos, galima apdoroti įprastuose staliniuose kompiuteriuose (šis apdorojimas paprastai bus baigtas). per protingą laiką). Be to, keli pagrindiniai imties x imties ir varianto x varianto matricos skaičiavimai (įskaitant toliau paminėtą GRM) gali būti aiškiai padalyti į skaičiavimo grupes (arba nuosekliai tvarkomi vieno kompiuterio valdomomis dalimis).

Komandinės eilutės sąsajos patobulinimai
Standartizavome, kaip veikia komandų eilutės analizatorius, perėjome nuo originalaus dizaino „viskas yra vėliavėlė“ prie labiau organizuoto vėliavėlių ir modifikatorių metodo (išlaikant atgalinį suderinamumą) ir pridėjome išsamią komandinės eilutės pagalbos priemonę.

Papildomos funkcijos
2009 m. GCTA nebuvo. Šiandien yra svarbi ir auganti įrankių ekosistema, padedanti naudoti genetinių santykių matricas mišrių modelių asociacijų analizėje ir kituose skaičiavimuose. -bin diegimas, kuris veikia „MacOS“ ir „Windows“, taip pat „Linux“, ir arčiau optimalaus --rel-cutoff genėjimo įrankis.

Yra ir kitų papildymų, pavyzdžiui, klasterių pagrindu sukurti filtrai, kurie gali palengvinti kelių populiacijos genetikų gyvenimą, ir LASSO koordinatės. Naujos funkcijos šiuo metu nėra svarbiausias prioritetas (svarbiau pasiekti 95 % ir daugiau atgalinio suderinamumo ir palaikyti dozavimo/fazinius/trialelinius duomenis. ), tačiau norime skirti laiko nuo darbo su programos esme, jei gražiai paklausk.


Sukurti
Operacinė sistemaVystymas (birželio 8 d.)„Alpha 2.3“ finalas (2020 m. sausio 24 d.)
Linux AVX2 Intel 1 parsisiųstiparsisiųsti
Linux 64 bitų Intel 1 parsisiųstiparsisiųsti
32 bitų Linuxparsisiųstiparsisiųsti
macOS AVX2parsisiųstiparsisiųsti
macOS 64 bitųparsisiųstiparsisiųsti
Windows AVX2parsisiųstiparsisiųsti
Windows 64 bitųparsisiųstiparsisiųsti
32 bitų Windowsparsisiųstiparsisiųsti

1: Šios versijos vis tiek gali veikti AMD procesoriuose, tačiau jos yra statiškai susietos su Intel MKL, todėl kai kurios linijinės algebros operacijos bus lėtos. Pasistengsime pateikti AMD Zen optimizuotą versiją, kai tik atsiras palaikomos bibliotekos.

Šaltinio kodą ir kūrimo instrukcijas galima rasti „GitHub“. (Štai dar viena šaltinio kodo kopija.)

Naujausių versijų istorija

2021 m. birželio 8 d: Ištaisyta kelių alelinių variantų rašymo klaida (paprastai pasireiškianti kaip segmentavimo klaida arba tvirtinimo klaida), kuri gali atsirasti naudojant --sort-vars arba esant mažai atminties sąlygoms.

Gegužės 25 d.: .fa loader dabar toleruoja tuščias eilutes. gzip failai, kuriuose yra keli srautai arba šiukšlės, turėtų būti vėl priimti.

Gegužės 23 d.: ištaisytas FID+IID+SID įkėlimas (paskutinėse versijose buvo pateikta neteisinga klaida „SID stulpelis ne iškart po IID stulpelio“).

Gegužės 5 d.: Ištaisyta – riktas, pristatytas sausio 16 d.

Balandžio 20 d.: --het cols= dabar turėtų veikti tinkamai.

Balandžio 16 d.: --data/--gen dabar palaiko .gen failus su 6 priekiniais stulpeliais. Šį formatą galima eksportuoti naudojant "--export oxford-v2".

Balandžio 14 d.: --pmerge-list nebeturi būti ribojamas sistemos #-of-open-failų viršutinės ribos.

Balandžio 13 d.: --glm vietinio kovariato tvarkymo klaidų taisymas. Ištaisyta --pmerge[-list] klaida, dėl kurios sugeneruota .pgen antraštė gali būti netinkama, kai yra daugiaalelių variantų.

Balandžio 6 d.: --data/--sample dabar atpažįsta stulpelio tipą „C“ kaip „P“ (nepertraukiamo fenotipo) sinonimą. (Atsiprašome, šioje versijoje yra neteisingas „6 kovo“ datos antspaudas.)

Kovo 28 d.: --sample-counts chrX no-known-males trikčių pataisa.

Kovo 25 d.: --pmerge[-list] .bim-handling klaidų taisymas.

Kovo 23 d.: Unbreak --make-pgen + --sort-vars (tai buvo sugadinta vasario 28 d. versijoje).

2 kovo d.: --pmerge[-list] klaidų pataisymai (nebėra segfaults, kai visi variantai yra skirtingose ​​padėtyse, jei išvesties .pvar failas jau yra, pirmiausia jis ištrinamas, o ne pridedamas, jei įvesties failas apima kelias chromosomas, nebėra tikėtina tvirtinimo klaida išsprendė kai kurias problemas, susijusias su tos pačios pozicijos to paties ID variantų sujungimu).

Kovo 1 d.: įdiegta vėliavėlė --pmerge-list-dir (nurodo bendrą katalogo priešdėlį visiems --pmerge-list įrašams).

Vasario 28 d.: --pmerge[-list] dabar gali būti naudojamas sujungimui panašiems darbams.
Atkreipkite dėmesį, kad tai ne būtinai atlikti gryną sujungimą chromosomų suskaidytame duomenų rinkinyje: jei du failo variantai turi tą pačią vietą ir ID, jie bus sujungti tokiu būdu ne suderinamas su „suskaldytais“ daugiaaleliniais variantais, turinčiais vieną ID (jie turi būti sujungti su specialia „prisijungimo“ operacija, pvz., „bcftools norm -m +“). Dėl to --pmerge[-list] nustato klaidą, kai aptinka tokį suskaidytą variantą. Vienas iš būdų yra naudoti --set-all-var-ids, kad kiekvienai padalinto varianto daliai būtų priskirti skirtingi ID.

Vasario 3 d.: ištaisyta .pvar įkėlimo klaida, kuri suveikė, kai FILTER reikšmės buvo svarbios tuo pačiu metu kaip INFO/PR arba CM reikšmės. .ped failų rinkiniai, kuriuose yra variantų, kuriuose trūksta REF ir ALT, vėl leidžiami (tokie variantai buvo uždrausti naujausiose versijose). --vcf-ref-n-trūksta vėliavėlė pridėta siekiant supaprastinti pakartotinį .ped gautų VCF importavimą. Pašalinti papildomi skirtukai iš --pgen-diff išvesties.

Sausio 23 d.: --chr-set dabar nustato MT į haploidą. ##chrSet .pvar antraštės eilutė be atitinkamos komandinės eilutės vėliavėlės dabar teisingai inicijuoja chrX, chrY ir MT ploidiją.

sausio 18 d.: ##chrSet .pvar antraštės eilutės dabar atitinka VCFv4.3 specifikaciją (įtrauktas ID laukas). VCF / BCF eksportas dabar atlieka daugiau antraštės patvirtinimo.

Sausio 16 d.: --update-parents dabar tinkamai veikia su kitų komandų išvesties stulpelių rinkiniais „galbūtparents“.

Sausio 14 d.: --update-ids dabar tinkamai veikia su „maybefid“ išvesties stulpelių rinkiniais kitose komandose, kai sukuria FID stulpelį.

Sausio 4 d.: „-normalize now“ tinkamai praleidžia trūkstamus ir „*“ alelius.

Sausio 3 d.: ištaisyta --bcf klaida, paveikusi nefazinius daugialypius variantus (dažniausiai dėl to įvyksta netikra "GT half-call" strigtis, bet jei ją panaikintumėte naudodami --vcf-half-call, duomenys nebūtų tinkamai importuoti). Ištaisyta klaida „--export bcf“, įvykusi antraštėse su FILTER/INFO/FORMAT raktais su identiškais pavadinimais, ir strigtis, įvykusi variantuose su keliais FILTER gedimais. --output-missing-genotype/--output-missing-phenotype klaidų pataisymai/valymas.

sausio 2 d.: --pgen-diff daugialypių variantų tvarkymo klaidų taisymas. Įdiegtas pgen-diff DS palyginimas. --adjust cols= analizės klaidų taisymas ('cols=+qq' turėtų veikti dabar).

2021 m. sausio 1 d.: keli SID tvarkymo klaidų pataisymai. --sample-diff 'dosage' ir 'id-delim=' modifikatorius komandinės eilutės analizės klaidų taisymai. --sample-diff nebepraleidžia vėlesnių ALT alelių, kai jų nėra lyginamuosiuose mėginiuose. Įdiegtas --pgen-diff GT palyginimas (PLINK 1.x apibendrinimas --merge-mode 6/7).

2020 m. gruodžio 12 d.: --q-score-range balo vidurkis, ALLELE_CT, DENOM ir NAMED_ALLELE_DOSAGE_SUM stulpelio riktas.

Spalio 28 d.: Multipass „--export A“ trikčių pataisymas. Jei anksčiau paleidote plink2 "--export A" faile, kuris per didelis, kad tilptų į atmintį, rekomenduojame paleisti iš naujo su šia versija.

Spalio 20 d.: --fst Weir-Cockerham metodas įdiegtas. --fst ids= ir chrX klaidų pataisymai. --fst variant-report OBS_CT dabar būdinga populiacijų porai.

Spalio 19 d.: „Linux“ dvejetainiai failai dabar turėtų duoti atkuriamus rezultatus visuose įrenginiuose, nebent buvo nurodyta „-native“ (anksčiau „Intel MKL“ galėjo pasirinkti nuo procesoriaus priklausančius kodo kelius su skirtingu slankiojo kablelio apvalinimo elgesiu). --fst Hudsono metodas įdiegtas. Kategorinių fenotipų kategorijos dabar pateikiamos natūralia tvarka. --variant-score MISSING_CT/OBS_CT klaidų taisymas.

Rugsėjo 23 d.: --update-ids no-FID trikčių pataisymas.

Rugsėjo 14 d.: --glm + --parameters chrX/chrY klaidų taisymas.

Rugpjūčio 31 d.: --data/--sample dabar palaiko QCTOOLv2 .sample dialektą. --export 'sample-v2' jį eksportuoja.

Liepos 27 d.: įdiegtas --glm 'cc-residualize'. Atminkite, kad šie apytiksliai skaičiavimai nerekomenduojami, jei turite daug trūkstamų genotipų.

Liepos 25 d.: pridėtas modifikatorius „firth-residualize“. Tai įgyvendina greitą Firth aproksimaciją, pristatytą Mbatchou J ir kt. (2020) Skaičiavimo požiūriu efektyvi viso genomo regresija kiekybiniams ir dvejetainiams požymiams.

Liepos 6 d.: įdiegta žyma --af-pseudocount. Tai leidžia nurodyti kitą pseudoskaitą nei 0 arba 1 alelio dažniui įvertinti.

Liepos 1 d.: įdiegtas modifikatorius --make-[b]pgen 'užpildykite trūkstamą iš dozės', kad palaikytų algoritmus, kuriems nereikia trūkstamų kietųjų skambučių.

Birželio 27 d.: --hardy/--hwe chrX daugialypių variantų tvarkymo klaidų pataisymai.

Birželio 25 d.: pakeistas klaidinantis failo skaitymo klaidos pranešimas „Nėra tokio failo ar katalogo“.

Birželio 15 d.: --glm local-covar= ilgose RFMix2 antraštės eilutėse nebėra klaidų, jei ID ilgis yra pagrįstas.

Gegužės 31 d.: Pridėtas vieno tikslumo – varianto balų režimas.

Gegužės 11 d.: ištaisytas --glm gedimas, įvykęs, kai buvo kategorinių kintamųjų, bet nė vienas neturėjo daugiau nei 2 kategorijų.

Balandžio 9 d.: Firth regresijos įgyvendinimas dabar naudoja tą pačią maxit=25 reikšmę kaip R logistf(). „UNFINISHED“ klaidos kodas buvo pridėtas prie žymėjimo logistikos / „Firth“ regresijos rezultatų, kurie pasikeistų dar daugiau iteracijų.

Kovo 28 d.: ištaisyta kovo 21 d. versijos „glm“ klaida, dėl kurios atsirado gedimų, kai buvo nulinio MAF dvialelių variantų. --glm dabar pateikia klaidas, kai nenurodytas joks kintamasis failas, nebent nurodytas modifikatorius „allow-no-covars“.

Kovo 21 d.: Ištaisytos --glm daugiaalelių variantų tvarkymo klaidos, kurios gali atsirasti, kai buvo nurodytas "genotipinis", "hethom", "dominuojantis", "recesyvinis", "sąveika" arba -testai, ir ištaisyta "dominuojanti"/" recesyviniai dokumentai. Nebereikia apkarpyti nulinės (ar kitos pastovios) dozės alelių iš daugiaalelių variantų, kad būtų gauti --glm kitų alelių rezultatai.

Kovo 14 d.: --make-pgen/--make-just-pvar 'vcfheader' stulpelių rinkinys pridėtas (tai leidžia tiesiogiai sugeneruoti galiojančią tik svetainėms skirtą VCF). .pvar failo bgzipavimas tiesiogiai nepalaikomas, bet galite naudoti pavadintą vamzdį, kad tai atliktumėte su mažomis sąnaudomis.

Kovo 11 d.: ištaisyta --glm gedimas, kuris gali atsirasti, kai nenurodyta jokių kovariacijų. VCF / BCF importuotojai dabar pagal numatytuosius nustatymus suspaudžia laikinąjį .pvar failą, kad failams, kuriuose yra daug INFO lauko turinio, nereikėtų neproporcingai daug laisvos vietos diske. --keep-autoconv dabar turi "vzs" modifikatorių, reikalingą suglaudinti .pvar failą (ir atvirkščiai, kai --vcf/--bcf naudojamas su bare --keep-autoconv, .pvar nesuglaudinamas).

Kovo 10 d.: ištaisytas --make-pgen gedimas, įvykęs, kai buvo nustatytos fazinės dozės be jokių fazuotų standžiųjų skambučių.

Kovo 8 d.: įdiegta "--export bcf". VCF eksportuokite daugialypius HDS klaidų taisymus. Pridėta trūkstama FILTER/fa antraštės eilutė prie viso genomo 1000 genomų 3 fazės anotuotų .pvar failų puslapyje Resources.

Vasario 25 d.: --ld kelių alelinių fazių duomenų tvarkymo klaidų taisymas.

Vasario 22 d.: --bcf n_allele=1 (ALT='.') klaidų taisymas.

Vasario 19 d.: --bcf GQ/DP filtravimo klaidų pataisymai. --vcf ir --bcf dabar įgyvendina VCF kontiginių pavadinimų apribojimus.

Vasario 11 d.: „--vcf-half-call reference“ vėl veikia tinkamai (paskutinėse versijose ji elgėsi kaip „--vcf-half-call error“).

Vasario 8 d.: BGZF suglaudinti tekstiniai failai dabar turėtų tinkamai veikti su visomis komandomis, kurios kelis kartus perkelia failą (anksčiau jie dirbo su --vcf, bet beveik jokių kitų tokio tipo komandų). Įvedus šias komandas, įvedus vardinį vamzdį, per pagrįstą laiką turėtų būti pateikiamas klaidos pranešimas, anksčiau tai galėjo likti amžinai.

Vasario 3 d.: --trūkstamas kodas dabar tinkamai veikia su --haps.

Sausio 24 d.: Ištaisyta --extract/--exclude klaida, kuri gali atsirasti, kai anksčiau operacijų eilės tvarka buvo pritaikytas kitas filtro variantas (pvz., --snps-only, --max-alleles, --extract-if-info). Šis klaidų taisymas buvo perkeltas į alfa 2 versiją.

Sausio 21 d.: „--extract range“ ir „--exclude range“ nebėra klaidų, kai jų įvesties failuose yra chromosomos kodo, kurio nėra dabartiniame duomenų rinkinyje.

Sausio 16 d.: --pca alelio / varianto svorio kelių gijų klaidų taisymas.

Sausio 14 d.: --make-king-table rel-check trikčių pataisa.

2020 m. sausio 3 d.: ištaisyta --extract-if-info/--exclude-if-info skaitmeninių argumentų klaida, pristatyta spalio pabaigoje.

2019 m. gruodžio 30 d. (alfa 3): dėl to bus atlikti toliau nurodyti suderinamumą pažeidžiantys pakeitimai:

    ir --indep-pairwise reikalauja, kad visi variantų ID būtų unikalūs. „ --write-snplist“ tai gali būti nepaisoma pridedant „allow-dups“ modifikatorių. reikalauti, kad REF/ALT režimas būtų aiškiai nurodytas. numatytasis dvejetainių fenotipų režimas „pirmasis atsarginis“. Senos elgsenos galima paprašyti naudojant modifikatorių „no-firth“.
  • --glm klaidos, užuot tiesiog praleidus fenotipą ir išspausdinus įspėjimą, kai fenotipas ir kovariatės yra linijinės priklausomybės. Senos elgsenos galima paprašyti naudojant „praleisti“ modifikatorių. 's 'var-wts' antrinė komanda buvo pakeista į 'allele-wts', kuri tinkamai apdoroja daugiaalelius variantus. Duomenų rinkiniams, kuriuose yra tik dvialeliniai variantai, senojo išvesties formato vis tiek galima pateikti užklausą naudojant „biallelic-var-wts“.
  • PLINK 2 dabar pateikia klaidas, kai prašote atlikti LD skaičiavimą duomenų rinkinyje, kuriame yra mažiau nei 50 steigėjų. Tai gali būti pakeista naudojant --bad-ld. senas NMISS_ALLELE_CT stulpelis (nįjungtapanelealelių skaičius) buvo pervardytas į ALLELE_CT, o stulpelių rinkinys atitinkamai pervardytas, nes kituose kontekstuose „nmiss“ reiškia nskaičius iš panelevertybes, o tai iš esmės yra priešinga. ID <1,2>stulpeliai buvo pervardyti į IID<1,2>, kad atitiktų kitas PLINK 2 komandas.

Be to, GRM skaičiavimas (kartu su „--pca apytiksliai“ ir „--score variance-standardize“) dabar tinkamai apdoroja daugiaalelius variantus, užuot tiesiog sutraukęs visus nedidelius alelius kartu – balas leidžia kiekvienam aleliui daugiaaleliniame variante turi būti priskirtas atskiras balas ir --glm tvarko kategorinius kovariatorius tokiu būdu, kuris mažiau gali sukelti VIF perpildymą.

Galutinė alfa 2 versija buvo pažymėta „GitHub“ ir ją bus galima atsisiųsti iš čia keletą ateinančių mėnesių.

Gruodžio 29 d.: Ištaisyta klaida, turėjusi įtakos kai kurių heterozigotinių dvigubų ALT daugiaalelių variantų apdorojimui, ir klaida, sukėlusi ALT2/ALT3 ir kt. alelių dažniai tam tikromis aplinkybėmis nebūtų tinkamai inicijuojami.

Gruodžio 13 d.: ištaisyta klaida, įdiegta lapkričio 22 d., dėl kurios kai kurios nurodytos dozės / skaičiai (pvz., --freq OBS_CT stulpelis) buvo padvigubinti. -- loop-cats klaidų pataisymai.

Lapkričio 28 d.: ištaisyta praėjusį mėnesį pristatyta VCF pusės skambučių tvarkymo klaida.

Lapkričio 26 d.: ištaisyta neseniai įvykusi klaida, dėl kurios kilo gedimas, kai buvo atlikta be pasikartojančių leistinų variantų ID paieška su daugiau nei 16 gijų.

Lapkričio 25 d.: Ištaisyta klaida, dėl kurios --sort-vars išsijungė, kai kontigų skaičius buvo 16 kartotinis. --keep-fcol ir --extract-fcol buvo nuspręsta, kad pavadinimai yra netvarkingi ir buvo pervadinti į -- Keep-col-match ir --extract-col-cond atitinkamai (senieji pavadinimai vis tiek veiks šioje versijoje).
Internetinė dokumentacija dabar beveik baigta. Šoninės juostos paieškos laukelis veikia.

Lapkričio 22 d.: Pirmosios regresijos greičio pagerinimas. "--freq counts" dabar eksportuoja dozes pakankamai tiksliai, kad --read-freq puikiai atkurtų pradinius alelių dažnius iš .acount failo, o --read-freq buvo modifikuotas taip.

Lapkričio 15 d.: Ištaisyta klaida „--glm cols=+err“, galinti sukelti šiukšlių išvestį, kai nenurodyta „hide-covar“. --covar-number atšauktas (anksčiau jis buvo neteisingai konvertuojamas į --covar-col-nums, kurio semantika nėra tokia pati).

Lapkričio 12 d.: Visi prieš visus --make-king[-table] paleidimai dabar daug efektyviau apdoroja MAF < 1% variantus. -- Pridėta parinktis be įvesties, trūksta fenotipo. --variant-score dabar palaiko dvejetainę išvestį.

Lapkričio 10 d.: ištaisyta klaida, pristatyta spalio 29 d., kuri sukėlė segfault, kai buvo susidurta su „NA“ / „nan“ fenotipu arba kovariato verte.

Lapkričio 9 d.: įdiegtas --variant-score (perkėlimas iš --balo).

Lapkričio 4 d.: atkurtas įspėjimas apie netinkamą alelio kodą „--export vcf“.

Spalio 31 d.: įdiegtas --split-cat-pheno modifikatorius „praleisti didžiąją dalį“ jis veikia geriau su --glm integruotu dispersijos-infliacijos koeficiento tikrinimu nei „praleisti paskutinį“, ir --glm pereis prie kategorinių kovariacijų tvarkymo tokiu būdu alfa 3.

Spalio 30 d.: ištaisyta klaida, dėl kurios susimaišė --covar-col-nums ir --covar iid-only. Griežtesnė daugumos teksto įvesties failų tuščių eilučių politika: jie leidžiami pabaigoje (nes kartais tai nutinka rankiniu būdu redaguojamuose failuose), bet kitur nebeleidžiami. Pašalinus stulpelius FILTER ir (arba) INFO generuojant .pvar failą (su, pvz., „pvar-cols=-info“), dabar pašalinamos atitinkamos antraštės eilutės.

Spalio 29 d.: įdiegtas --q balų diapazonas. Eilutės, prasidedančios skaičiumi, bet turinčios neskaitinį turinį (pvz., „-123.4abc“), dabar suaktyvina klaidą, kai tikimasi slankiojo kablelio skaičiaus. Pavyzdinė eilutė anksčiau buvo išanalizuota kaip -123.4.

Spalio 25 d.: --make-king-table 'rel-check' modifikatorius pridėjo, kad tai turi tokį patį poveikį kaip ir PLINK 1.9 -genome. --pca „var-wts“ modifikatorius nebenaudojamas: perjunkite į „biallelic-var-wts“, kai jūsų duomenyse yra tik dvialeliniai variantai ir norite toliau generuoti tik vieną kiekvieno varianto svorį. (Alpha 3 įdiegs modifikatorių „alele-wts“, kuris generuoja vieną svorį kiekvienam aleliui, o tai būtina norint palaikyti daugiaalelius variantus analitiškai pagrįstu būdu.)

Spalio 22 d.: įdiegtas „recover-var-ids“. (Tai skirta pakeisti --set-all-var-ids.)

Spalio 20 d.: įdiegtas --sample-counts tai suteikia pagrindinį (ne indel) mėginių skaičių, apie kurį praneša "bcftools stats" vėliavėlė -s, ir yra >100x greitesnis dideliems plink2 formatuotų duomenų rinkiniams. --extract-fcol išplėstas, kad palaikytų poeilutės atitikmenis.

Spalio 15 d.: Ištaisyta spalio 12 d. „Linux“ versijų klaida, dėl kurios „plink2“ pakibo naudojant --extract/--exclude/--snps ir panašių variantų ID filtrus. Įdiegtas --extract-fcol, kuris filtruoja variantus pagal TSV stulpelį (tai yra PLINK 1.x --qual-scores plėtinys).

Spalio 12 d.: „--hwe 0“ nebepašalina kelių labai mažos HWE-p vertės variantų.

Spalio 9 d.: pridėtas --pheno/--covar 'iid-only' modifikatorius, palaikantis failus be antraščių su vienu ID stulpeliu. Windows BGZF glaudinimas dabar yra kelių gijų. Patobulinti skaitymo klaidų pranešimai.

Spalio 6 d.: „Windows“ – tylus klaidų taisymas. Šaltinio kodas dabar palaiko dinaminį susiejimą su libzstd (nors našumas gali nukentėti, jei nesukursite tos bibliotekos kelių gijų versijos).

Spalio 4 d.: --king-table-subset + --parallel riktų pataisymas. Automatinis Zstd teksto failo išglaudinimas buvo sugadintas kelioms komandoms dėl rugsėjo 28 d. versijos, kuri dabar turėtų tinkamai veikti.

Spalio 3 d.: Ištaisytos BGZF dekompresijos klaidos rugsėjo 28 d. (Tai neturėjo įtakos VCF &rarr .bed/.pgen konvertavimui, nors buvo paveikti kai kurie retesni naudojimo atvejai.) SID įkėlimo trikčių taisymas.

Rugsėjo 28 d.: mišrios preliminarios nuorodos klaidų pataisos. --ref-allele/--alt1-allele/--update-map/--update-name skip-count klaidų taisymas. --glm local-covar eilutės praleidimo riktas. Automatinis pervadinimas, kai įvesties failo pavadinimas sutampa su išvesties failo pavadinimu, turėtų vėl tinkamai veikti, o ne padaryti klaidų (nors to vis tiek reikėtų vengti).

Rugsėjo 10 d.: --glm jungties testo p-vertės klaidų taisymas. (Ši klaida paveikė tik tuos paleidimus, kuriuose --tests buvo iškviestas su 4 ar daugiau prognozių.)

Rugpjūčio 26 d.: --read-freq dabar spausdina įspėjimą, užuot sujungęs arba įvedęs begalinį ciklą, kai visi variantai jau buvo išfiltruoti.

Rugpjūčio 21 d.: ištaisyta --ref-from-fa/--ref-allele + VCF eksporto sąveika, dėl kurios buvo pranešta apie netikras „PR“ INFO vėliavėles.

Rugpjūčio 10 d.: Klaidų pranešimuose „Open-fail“ ir „Watch-fail“ dabar pateikiamas išsamesnis paaiškinimas, kas nutiko. --bgen, --data ir --gen dabar turi modifikatorių „ref-unknown“, kad būtų aiškiai nurodyta, kad nei pirmasis, nei paskutinis alelis nėra nuosekliai REF.

Liepos 31 d.: kai įvesties failo eilutė yra sutrumpinta, --score spausdina klaidos pranešimą, o ne „segfaulting“. Ištaisyta reta --glm klaida, dėl kurios visi rezultatai gali būti pateikiami kaip „NA“, kai apibrėžiamas tiksliai vienas kintamasis. .log failai vėl tinkamai spausdina „--out“ ir „--d“ (tai buvo sugadinta dėl liepos 24 d. versijos). --glm dabar turi pasirenkamą išvesties stulpelį („err“), kuriame nurodoma kiekvieno „NA“ koeficiento priežastis.

Liepos 8 d.: --rm-dup/--sample-diff/--ld daugialypis variantas.

Liepos 5 d.: --read-freq perkeltas prieš įprastą alelių dažnio / skaičiaus skaičiavimą operacijų tvarka. Įkelti alelių dažniai daugiau neperskaičiuojami.

Birželio 28 d.: --king-table-subset vėl turėtų tinkamai veikti.

Birželio 26 d.: Ištaisyta --glm daugiaalelių variantų klaida, dėl kurios vienas alelis gali būti praneštas du kartus, o vienas kovariacinis testas gali būti nepraneštas, kai nebuvo nurodyta nei „slėpti kovaras“, nei „pertraukti“. Išspręsta problema, dėl kurios „ --glm genotypic/hethom“ gali nutrūkti be kovariacijų.

Birželio 17 d.: Ištaisytas retas --glm p vertės skaičiavimo trūkumas, dėl kurio gali sutrikti tvirtinimas.

Gegužės 27 d.: Unbroke --adjust-file. „--export ind-major-bed“ našumo gerinimas.

Gegužės 12 d.: ištaisyta --glm linijinės regresijos fenotipo ir paketų tvarkymo klaida, galinti sukelti strigtį (arba, naudojant .bed formatuotus duomenis, sugeneruoti neteisingus rezultatus) didesnėse nei 240 dydžio partijose.

Balandžio 29 d.: BGEN 1.2/1.3 fazinio dozavimo importo klaidų pataisymai. --make-pgen + --dosage-erase-threshold be --hard-call-threshold nebestringa.

Balandžio 28 d.: supaprastinti PLINK 2 plėtiniai, skirti --update-ids ir --update-parents. --id-delim/--sample-diff 'sid' modifikatorius, nurodantis, kad vieno skiriamojo ženklo mėginių ID turėtų būti interpretuojami kaip IID-SID, pakeistas į --iid-sid vėliavėlę.

Balandžio 27 d.: --haps klaidų taisymas, kai mėginių skaičius atitinka 17..31 (mod. 32). Tai paveikė tik kelis paskutinius failo pavyzdžius, bet jei naudojote --galbūt su ankstesne versija, primygtinai rekomenduojame jį paleisti iš naujo. --glm logistinė regresija „SE“ stulpelis pervardytas į LOG(OR)_SE, kai pranešama apie šansų santykį, kad būtų akivaizdžiau, jog pranešta standartinė klaida nenaudoja šansų santykio vienetų. -- Įdiegtas atnaujinimas-tėvai.

Balandžio 2 d.: ištaisyta --hwe klaida, dėl kurios chrY ir MT variantai gali būti netinkamai filtruojami. --glm „feno-ids“ dabar veikia kiekybinių fenotipų grupėms.

Balandžio 1 d.: --glm be --adjust dabar aptinka kiekybinių fenotipų grupes su tuo pačiu "trūkumo modeliu" ir apdoroja juos kartu (didelis greitis, bet būkite atsargūs dėl vietos diske, tikriausiai norite naudoti "slėpti" -covar" modifikatorius, "zs" ir (arba) --pfilter taip pat gali būti naudingi). --glm tiesinė regresija local-covar= klaidų taisymas.

Kovo 26 d.: Minimac3-r2 skaičiavimo klaidų taisymas. --glm nebegeneruoja .id failų, kuriuose išvardijami visi kiekvienam fenotipui naudojami pavyzdžiai, nebent būtų pridėtas keitiklis „pheno-ids“. -- Įdiegti atnaujinimo ID.

Kovo 23 d. Ištaisyta kelių alelinių variantų rašymo klaida, galinti paveikti failus, kuriuose didžiausias alelių skaičius yra 6 arba 18. Įdiegtas --minimac3-r2-filter ir --freq minimac3r2 stulpelis.

Kovo 18 d.: --write-covar dabar gali būti naudojamas, kai neįkeliami jokie kintamieji, jei įkeltas bent vienas fenotipas ir buvo prašoma fenotipo išvesties.

Kovo 9 d.: plink2 --version ir --help nebegrąžina nulinių išėjimo kodų.
Dabar yra PGEN specifikacijos projektas.

Kovo 6 d.: ištaisyta alelio dažnio skaičiavimo klaida, galinti sukelti klaidingą „Neteisingai suformuoto .pgen failo“ klaidą, kai buvo aktyvus variantų filtras.

Kovo 5 d.: kelių gijų --ištraukimas/-išskirti.

Kovo 4 d.: – išbando tiesinės regresijos išvesties klaidų taisymą.

Kovo 3 d.: pataisykite --glm šansų santykio spausdinimo klaidą, pristatytą kovo 1 d.

Kovo 2 d.: daugiau pagalbos teksto valymo (dabar įskaitant internetinę dokumentaciją).

Kovo 1 d.: įdiegtas --recode-allele (ir nuoseklumo dėlei pervardytas į --export-allele). Importuojant VCF, dabar įvyksta klaidų, kai importuojama INFO reikšmė, kurioje yra vietos. Komandinės eilutės žinyno teksto skliaustai dabar naudojami panašiai kaip kiti įrankiai.

Vasario 21 d.: --glm sąnarių testai dabar yra pagrįsti F statistika, kad būtų geresnis mažų mėginių tikslumas.

Vasario 20 d.: --import-dozavimo tikrumas dabar visada sukuria trūkstamą skambutį, užuot sugrįžęs į VCF GT lauką, kai dozės tikrumas yra nepakankamas. --Pridėta ištraukimo-susikirtimo vėliavėlė.

Vasario 19 d.: --glm vėl veikia tinkamai, be kintamųjų (jis buvo išjungtas su klaidinga „atminties trūkumo“ klaida). --importo dozavimo tikrumas dabar turi tikėtiną poveikį vienkartinėms dozėms, o ne tik genotipo tikimybės tripletams.

Vasario 18 d.: ištaisyta klaida, dėl kurios gali trūkti dozavimo duomenų.

Vasario 14 d.: Komandinės eilutės sveikųjų skaičių parametrai dabar gali naudoti mokslinį žymėjimą.

Vasario 12 d.: laipsniško dozavimo importo trikčių pataisymas.

Vasario 2 d.: --tests + --parameters klaidų taisymas.

Sausio 31 d.: --pca apytiksliai dabar pateikia klaidas, užuot pranešusi apie netikslius rezultatus, kai variantų skaičius per mažas, palyginti su kompiuterių skaičiumi. --pca apytikslis savosios vertės klaidų taisymas.

Sausio 30 d.: --glm kovariato skalės klaida dabar sklinda tinkamai, o ne sukuria paslaptingą atminties trūkumo klaidos pranešimą.

Sausio 22 d.: --glm dabar daro klaidą ir rekomenduoja pridėti --covar-variance-standardize, kai kovariacijų mastelis pakankamai skiriasi, kad skaitmeninis nestabilumas keltų didelį susirūpinimą.

2019 m. sausio 2 d.: laipsniško dozavimo importo trikčių pataisymas.

2018 m. gruodžio 27 d.: --ref-allele/--alt1-allele skipchar buvo sugadintas pastaruosius kelis mėnesius, jis turėtų vėl tinkamai veikti. Ištaisyta klaida, kuri įvyko importuojant ne sveikų skaičių dozavimo variantą.

Spalio 28 d.: --keep-fam/--remove-fam trikčių pataisymas.

Spalio 2 d.: ištaisyta klaida, kuri gali atsirasti įkeliant labai ilgas teksto eilutes (pvz., VCF eilutes, ilgesnes nei 5 MB).

Rugsėjo 22 d.: ištaisyta reta klaida, kuri gali atsirasti apdorojant variantus netvarkingai. Įdiegta komanda -sample-diff.

Rugsėjo 12 d.: pridėtas „normalize“ modifikatorius.

Rugsėjo 11 d.: pridėtas --rm-dup 'sąrašo' modifikatorius, skirtas visų pasikartojančių variantų ID sąrašui. (Tai gali būti vykdoma kaip atskira komanda.)

Rugsėjo 9 d.: Ištaisyta teksto išskleidimo reta lenktynių būklė, dėl kurios įvesties eilutės gali būti praleistos. (Manome, kad tai buvo VCF importo „Failo skaitymo nesėkmės“ gedimų, apie kuriuos pranešta per pastaruosius kelis mėnesius, priežastis.)

Rugsėjo 8 d.: ištaisyta VCF eksporto klaida, kuri galėjo atsirasti, kai buvo papildomų ##contig antraštės eilučių.--sort-vars klaidų taisymas. --normalize now aptinka, kai po normalizavimo variantai nebėra surūšiuoti, ir tokiu atveju išspausdina įspėjimą.

Rugsėjo 7 d.: --ld fazinių daugiaalelių variantų klaidų taisymas. Pridėta --rm-dup vėliavėlė (pašalina pasikartojančius ID variantus, gali patikrinti genotipo/INFO/tt lygybę).

Rugsėjo 4 d.: ištaisyti A1_CASE_FREQ ir susiję stulpeliai --glm išvestyje, sugadinti dėl naujausio daugiaalelio atnaujinimo. Išvalyti keli stulpelių pavadinimai --geno-counts ir --hardy output.

Rugpjūčio 31 d.: ištaisyta --glm klaida su apdorojimo konstanta ir visi pastovūs, bet 1 kintamieji.

Rugpjūčio 30 d.: AVX2 ir 32 bitų --export bgen-1.2/1.3 klaidų pataisymai (daugiausia paveikia trūkstamus genotipus). „--export vcf-4.2“ režimas pridėtas, kad būtų suderinama su programomis (pvz., SNPTEST), kurios atmeta VCF 4.3 failus. Eksportuoti VCF dabar turėtų turėti tinkamesnes ##contig antraštes, kai įvestyje yra PAR1 ir (arba) PAR2. Pridėta kairiojo normalizavimo (--normalize) žyma.

Rugpjūčio 26 d.: paskutinis --pca .eigenvec antraštės eilutės stulpelis nebepraleidžiamas.

Rugpjūčio 21 d.: ištaisytos --mac/--max-mac 'nref' ir 'alt1' režimų klaidos vakarykštėje versijoje.

Rugpjūčio 20 d.: ištaisyta klaida „--vcf dosage=GP“, pristatyta gegužės 7 d., jei naudojote bet kurią paskutinių trijų su puse mėnesio versiją VCF FORMAT / GP duomenims importuoti, paleiskite iš naujo su naujesne versija. „--vcf dosage=GP“ dabar pateikia klaidą ir pateikia tinkamą pranešimą, kai faile taip pat yra laukas FORMAT/DS, o buvo pridėta parinktis „dosage=GP-force“, kad būtų aptikti reti atvejai, kai importuojant GP lauką gali vis tiek verta. --maf/--max-maf/--mac/--max-mac dabar leidžia filtruoti ne pagrindinius (numatytuosius), nenurodinius, alt1 arba nedidelius alelių dažnius/skaičius, tam galite naudoti bcftools žymėjimą (pvz. "--min-af 0.01:minor"), tačiau nepamirškite kitokio numatytojo.

rugpjūčio 18 d.: Plink2 formatu suformatuotus 1000 genomų 3 fazės failus su faziniais haplotipais ir anotacijomis bei keletą oficialios kilmės dokumentų pataisymų (nustatytą KING-robust analize) dabar galima atsisiųsti iš išteklių puslapio. --king-cutoff dabar gali tvarkyti pavyzdinius ID failus, kuriuose yra antraštės eilutė.

Rugpjūčio 16 d.: --glm logistinė regresija dabar palaiko daugiaalelius. Ištaisyta --glm linijinės regresijos dozės tvarkymo klaida vakarykštėje versijoje.

Rugpjūčio 15 d.: --glm tiesinė regresija dabar palaiko daugiaalelius variantus. --ld klaidų taisymas. --parameters + "--glm sąveika" dabar veikia tinkamai, kai kovariatas dalyvauja tik kaip sąveikos dalis.

Rugpjūčio 9 d.: --make-king[-table] vieno/monomorfinio varianto optimizavimas įdiegtas.

Rugpjūčio 7 d.: GRM konstravimas ir – trūksta kelių alelinių duomenų.

Rugpjūčio 6 d.: įdiegtas VCF daugiaalelis (fazinis) importas ir eksportas. --hwe dabar tikrina kiekvieną alelį atskirai dėl daugiaalelių variantų. Pridėtos --min-alleles/--max-alleles filtravimo vėliavėlės.
(--glm dar nepalaiko daugialypių variantų, kuriuos planuojama atnaujinti kitą savaitę.)

Liepos 30 d.: pridėta vėliavėlė --vcf-max-dp.

Liepos 26 d.: --vcf-half-call dabar turėtų tinkamai veikti naudojant nefazuotus duomenis.

Liepos 25 d.: Ištaisyta --sort-vars/low-memory-make-pgen dozavimo tvarkymo klaida, galinti sukelti nepageidaujamą kietojo skambučio slenkstį. Jei naudojote 2018 m. balandžio 14 d.–liepos 19 d. versiją, kad galėtumėte dirbti su dozavimo duomenimis, kietieji skambučiai gali būti netinkamai apriboti. Nefiltruotus dozavimo duomenų rinkinius, importuotus paveiktos versijos, galima pataisyti paleidus --make-pgen + explicit --hard-call-threshold. Kietųjų skambučių filtrai, tokie kaip --geno/--mind, turėtų būti paleisti iš naujo (pataisius griežtus skambučius).

Liepos 19 d.: įdiegta --update-alleles.

Liepos 16 d.: Pridėtas daugiau kelių gijų VCF analizavimo derinimo registravimo kodo.

Liepos 13 d.: ištaisyta chrX/Y/MT automatinio pašalinimo klaida --make-king/--make-grm/--pca.

Liepos 12 d.: nesugadintas --mach-r2 filtras.

Liepos 3 d.: .fam/.psam failai dabar tinkamai įkeliami, kai prašoma arba pateikiamas tik IID stulpelis.

Birželio 29 d.: .bim/.pvar failai su daugiau nei

134 milijonai variantų vėl tinkamai įkeliami (turint pakankamai atminties).

Birželio 25 d.: Ištaisyti keli nelyginio imčių skaičiaus eksporto atvejai, kurie buvo sugadinti apie gegužės 30 d.

Birželio 22 d.: ištaisyti keli žurnalo pranešimai, kurie buvo sugadinti birželio 19–20 d. Pridėtas derinimo spausdinimo kodas, kad būtų palaikomas vykstantis kelių gijų VCF dozavimo importo klaidos tyrimas (jei susiduriate su paslaptingomis „Failo skaitymo nesėkmės“ klaidomis VCF importavimo metu arba „Neteisingai suformuoto .pgen“ klaidomis, kai nuskaitote rezultatą, pridedant „--threads“ 1" į VCF-import komandą tikriausiai išspręs jūsų neatidėliotiną problemą, bet jei taip pat galėtumėte atsiųsti man .log failą iš nesėkmingo kelių gijų paleidimo (arba dar geriau, bandymo duomenis), tai būtų labai naudinga).

Birželio 20 d.: GRM/PCA/balų skaičiavimo klaida, pristatyta gegužės 30 d. Jei naudojote gegužės 30 d. arba birželio pradžios versiją GRM/--pca/--score, turėtumėte pakartoti operaciją (-as) su šia versija. Atsiprašome už klaidą.

Birželio 19 d.: Ištaisytas retas --ref-allele/--alt1-alele kampinis atvejis, kuris gali atsirasti, kai trūkstamas alelis buvo pakeistas labai ilgu aleliu.

Birželio 5 d.: VCF importo nepainicijuoto kintamojo trikčių pataisa. --score modifikatorius 'ignorre-dup-ids'.

Gegužės 30 d.: „--export haps[legend]“ klaidų pataisymai ir bgzip palaikymas. „--export vcf vcf-dosage=DS“ nebeeksportuoja nedeklaruotų HDS verčių, kai yra fazės informacijos. Unbreak --import-dosage + --map, šį kartą tikrai.

Gegužės 21 d.: pridėta komanda --pgen-info (rodo pagrindinę informaciją apie .pgen failą, pvz., ar jame yra fazės ar dozės duomenų).

Gegužės 17 d.: --import-dosage ir .gen importas buvo pažeistas pastarąsias kelias savaites, tai dabar reikėtų pataisyti. A1 stulpelis pridėtas prie --koreguoti išvestį ruošiantis daugiaaleliniams variantams. --glm 'a0-ref' modifikatorius pervardytas į 'omit-ref'.

Gegužės 15 d.: ištaisyta chrX alelio dažnio skaičiavimo klaida, kai yra dozės. --ld modifikuotas, kad būtų pagrįstas pagrindiniais, o ne etaloniniais aleliais, kad būtų geriau žaisti su daugiaaleliais variantais. --Hardy antraštės eilutė ir alelių stulpeliai pakeisti ruošiantis daugialypio varianto palaikymui.

Gegužės 8 d.: --vcf dosage=HDS dabar turėtų tinkamai apdoroti failus be DS lauko.

Gegužės 7 d.: Ištaisyta reta įvesties / išvesties aklavietė. Patobulintas VCF importo lygiagretumas.

Gegužės 4 d.: ištaisyta --bgen importas/eksportas, kai dozavimo tikslumo bitai nėra 8 kartotiniai (anksčiau klaidingai interpretuota šių atvejų specifikacija, atsiprašau).

Gegužės 3 d.: --bgen dabar gali importuoti variantų įrašus su iki 28 bitų dozavimo tikslumu (nors tik

15 bitų išliks). „--export vcf-dosage=HDS-force“ trikčių pataisymas.

Gegužės 2 d.: --vcf dosage= importui nebereikia, kad būtų GT laukas. Fiksuotas potencialas --vcf dosage=HDS buferio perpildymas.

Balandžio 28 d.: Ištaisyta --glm klaida, kuri atsirado, kai buvo ir autosomos, ir lytinės chromosomos arba buvo ir chrX, ir chrY. Jei atlikote viso genomo --glm paleidimą su 2018 m. vasario 9 d. arba naujesne versija, turėtumėte iš naujo paleisti naujausią versiją. Tačiau klaidos nepaveikė vienos chromosomos ir tik autosomos --glm.

Balandžio 24 d.: VCF fazinio dozavimo importas („--vcf dosage=HDS“) ir eksportavimas („--export vcf vcf-dosage=HDS“). --pca ir GRM skaičiavimai dabar naudoja teisingą visų haploidinių genomų dispersiją.

Balandžio 22 d.: --export bgen-1.2/bgen-1.3 dabar turėtų veikti su chrX/chrY/chrM, taip pat ištaisytos tų chromosomų importo klaidos.

Balandžio 16 d.: --ref-from-fa kontiginės eilutės analizės klaidų taisymas.

Balandžio 14 d.: --Export bgen-1.2/bgen-1.3 įdiegtas autosominiams diploidiniams duomenims. Tokios operacijos kaip --pca, kurioms reikalingi tinkami alelių dažniai, dabar daro klaidą, kai dažniai apskaičiuojami pagal mažiau nei 50 mėginių, nebent pridedate žymą --bad-freqs. Įdiegtas laipsniškas dozavimo palaikymas. Pavyzdžių trūkumo rodiklis eksportuotuose .sample failuose dabar pagrįstas dozėmis, o ne griežtais skambučiais. Ne AVX2 fazės pogrupio klaidų taisymas. --vcf + --psam klaidų taisymas. --vcf dosage= dabar nepaiso sunkaus skambučio, kai vietoj jo yra dozė, ji atkuriama pagal --hard-call-threshold 0.1 (nebent nurodėte kitą slenkstį). --bgen 'ref-second' modifikatorius pervadintas į 'ref-last', siekiant tinkamai apibendrinti daugiaalelius variantus.

Kovo 31 d.: --export haps[legend] dabar turėtų tinkamai veikti, kai --ref-allele/--ref-from-fa/etc. apverčia kai kuriuos alelius tame pačiame bėgime.

Kovo 29 d.: --set--var-ids ne AVX2 trikčių pataisymas. --pheno/--covar autonominio pavadinimo klaidų taisymas.

Kovo 28 d.: įdiegtas --bgen 1 bito fazinio haplotipo importas.

Kovo 26 d.: --make-bed + --indiv-sort klaidų taisymas.

Kovo 23 d.: „Windows“ versijos vėl turėtų tinkamai veikti (kovo 20–21 d. „Windows“ versijos buvo labai sugedusios). --glm dabar palaiko log-pvalue išvestį (pridėkite 'log10' modifikatorių), ir jie išlieka tikslūs žemiau dvigubo tikslumo slankiojo kablelio ribos p=5e-324.

Kovo 21 d.: 3 stulpelių .sample failo įkėlimas vėl veikia tinkamai. Ištaisyta failų skaitymo lenktynių sąlyga.

Kovo 20 d.: ištaisykite galimą aklavietę naujausiose versijose įkeliant labai ilgas eilutes.

Kovo 19 d.: Pataisykite --sample segfault naujausiose versijose. .bgen importo/eksporto greičio gerinimas. --oxford-single-chr nebuvo tinkamai išplėstas kovo 4 d. versijoje, tai turėtų būti ištaisyta dabar.

Kovo 11 d.: Pataisykite --pheno segfault praėjusios savaitės versijose, kurios galėjo atsirasti, kai faile nebuvo antraštės eilutės.

Kovo 9 d.: pataisykite klaidą „Failo rašymo klaida“, kuri įvyko, kai viena įrašymo operacija buvo didesnė nei 2 GB (tai gali nutikti, kai paleistas „-make-bed“ su daugiau nei 128 tūkst. pavyzdžių). Sumažintas atminties poreikis pasikloti.

Kovo 7 d.: ištaisyta galima failų skaitymo aklavietė naujausiose versijose (vasario 23 d. ar vėliau).

Kovo 5 d.: --glm local-covar= vėl turėtų tinkamai veikti.

Kovo 4 d.: --oxford-single-chr dabar gali būti naudojamas .bgen failuose. --make-pgen dalinis duomenų tvarkymo klaidų taisymas.

Vasario 26 d.: --keep/--remove/etc. dabar turėtų tinkamai veikti tik IID failuose be antraštės eilutės.

Vasario 23 d.: ištaisyta alfa 2 --vcf + --id-delim klaida. Patobulintas suglaudintų VCF ir .pvar failų analizės greitis.

Vasario 20 d.: „--xchr-model 1“ dabar turėtų veikti tinkamai.

2018 m. vasario 16 d. (2 alfa): dėl to bus atlikti toliau nurodyti suderinamumą pažeidžiantys pakeitimai:

  • FID dabar yra pasirenkamas laukas: jei jo nėra įvesties .psam faile, pagal numatytuosius nustatymus jis yra praleistas keliuose išvesties failuose (dabar jie turi stulpelių rinkinius „maybefid“ ir „fid“, kur numatytasis rinkinys apima „maybefid“) , ir apdorojamas kaip visada-0, atliekant bet kokią operaciją, kuriai reikalingos FID reikšmės (pvz., --make-bed). Eksportuojant genominių duomenų failus, „maybefid“ taip pat traktuoja, kad stulpelis trūksta, jei visos likusios reikšmės yra „0“.
  • Atitinkamai, importuojant pavyzdinius ID iš VCF arba .bgen failo, numatytasis režimas dabar yra „--const-fid 0“, o FID stulpelis į diską nebus įrašomas. --keep, --remove ir panašios komandos taip pat dabar turi "--const-fid 0" semantiką, kai įvesties eilutėje yra tik vienas prieigos raktas. Dabar galite elgtis taip, lyg IID būtų vienintelis ID komponento pavyzdys, jei tai yra prasmingiausia jūsų darbo eigai. Ir atvirkščiai, dabar būtina aiškiai naudoti --id-delim, kai norite padalinti VCF/.bgen pavyzdžių ID į kelis komponentus.
  • MT vėl traktuojama kaip haploidinė chromosoma. PLINK 1.9 ir ankstesnėse plink2 versijose MT buvo traktuojamas kaip diploidinis, kad nebūtų išmesta informacija apie heteroplazmines mutacijas, kaip pasekmė --glm(/--linear/--logistic) genotipo stulpelis ir tokios komandos kaip "--freq skaičiuoja“ naudojo 0..2 skalę. Dabar, kai „plink2“ turi tinkamą dozių palaikymą, šis kludge nebereikalingas.
  • --glm stulpelių rinkinys „t“ buvo pervadintas į „tz“, kad atspindėtų tai, kad tai yra tiesinės regresijos T statistika, o logistikos/Firth – Wald Z balas. Atitinkamo stulpelio .glm.logistic[.hybrid] ir .glm.firth failuose antraštės eilutėje dabar yra „Z_STAT“.

Be to, --glm dabar pagal numatytuosius nustatymus regresuoja mažesnes, o ne ALT alelių dozes (tai gali būti nepaisoma naudojant „a0-ref“).

Galutinė alfa 1 versija buvo pažymėta „GitHub“ ir ją bus galima atsisiųsti iš čia ateinančius kelis mėnesius.

Vasario 11 d.: .king.cutoff.in/.king.cutoff.out failai dabar baigiasi .id, kad atitiktų kitus išvesties failus su pavyzdiniais ID ir jokios kitos informacijos. Panašiai --mind išvesties failas dabar turi plėtinį .mindrem.id ir pagal nutylėjimą turi antraštės eilutę. Dabar galite naudoti --no-id-header, kad užblokuotumėte antraštės eilutę (ir priverstumėte stulpelius į FID/IID) visuose .id išvesties failuose.

Vasario 10 d.: pridėta parinktis --update-sex 'male0' ir pakeista tinkinta stulpelių pasirinkimo sąsaja (dabar 'col-num='). --glm 'gcountcc' stulpelių pavadinimai atnaujinti (dabar 'CASE_NON_A1_CT', 'CASE_HET_A1_CT' ir t. t.) ruošiantis pereiti prie A1 = pagrindinis alelis. --make-just-pvar + --ref-allele/--ref-from-fa nebelaiko visų pradinių nuorodų alelių laikinųjų, kai įvestyje .pvar yra antraštės eilutė.

Vasario 9 d.: priverstinis .pvar QUAL/FILTER išvestis, kai tokios reikšmės neįkeliamos, nebesukelia gedimo.

Vasario 5 d.: AVX2 fazės pogrupio trikčių pataisymas.

Vasario 3 d.: Pridėta --score 'dominuojantis' ir 'recesyvinis' modifikatoriai.

Sausio 30 d.: pataisykite .pgen rašymo klaidą, kuri įvyko, kai variantų skaičius buvo 64 kartotinis, o pavyzdžių skaičius buvo didelis.

Sausio 24 d.: "--export oxford" dabar palaiko bgzipped išvestį.

sausio 21 d.: --glm dabar visada praneša apie papildomą stulpelį „A1“, nurodantį, kuris (-i) alelis (-iai) atitinka teigiamas genotipo stulpelio reikšmes. --glm stulpelių rinkiniai buvo pakeisti, kad sukasi aplink A1, o ne ALT, todėl pereinant prie šios versijos gali prireikti nedidelių scenarijaus pakeitimų.
Šioje versijoje A1 ir ALT vis dar yra sinonimai. Tai pasikeis alfa 2: A1 pagal numatytuosius nustatymus naudos smulkųjį (-ius) alelį (-ius), kad sumažintų daugiakolineariškumą (imituoja PLINK 1.x elgseną, jei nėra --keep-allele-order), tačiau vis tiek turėsite galimybę priverstinai A1. =ALT.

Sausio 12 d.: ištaisyta „--glm interakcijos“ klaida, kuri įvyko, kai keliuose iš eilės variantuose nebuvo trūkstamų skambučių. Rekomenduojame iš naujo atlikti visus --glm paleidimus su „sąveikos“ modifikatoriumi, kurie buvo atlikti su kūrimu, pagamintu nuo 2017 m. lapkričio 27 d. iki 2018 m. sausio 10 d. imtinai.

Sausio 10 d.: įdiegtas --adjust-file (atlieka --adjust kelių bandymų taisymą bet kuriame asociacijos analizės faile).

Sausio 9 d.: Prie kelių komandų pridėta modifikatorių „no-idheader“ ir nustatyta, kad tai yra numatytasis --make-grm-bin/--make-grm-list, kad būtų išvengta sąveikos sutrikimo.

sausio 7 d.: --vcf dabar gali būti suteiktas tik svetainėms skirtas VCF, kai paleidimui nereikia genotipo duomenų. Pavyzdiniai ID failai, pvz., sukurti naudojant --write-samples, dabar pagal numatytuosius nustatymus turi antraštės eilutę, kurios reikės norint atskirti FID-IID ir IID-SID išvestį ateityje. (Naudodami --write-samples, galite nuslėpti antraštės eilutę pridėdami modifikatorių „noheader“.)

sausio 5 d.: įdiegtas --pheno-col-nums/--covar-col-nums.

2018 m. sausio 2 d.: įdiegtas --keep-fcol (atitinka PLINK 1.x --filter).

2017 m. gruodžio 19 d. – pritaikyta pritaikyta. Įdiegtas --zst lygis (leidžia valdyti Zstd glaudinimo lygį). Atšauktas – paleisti iš naujo.

Gruodžio 18 d.: --extract/--exclude dabar galima naudoti tiesiogiai UCSC interval-BED failuose (gerai, jei koordinatės yra pagrįstos 0 arba jei nėra 4 stulpelio). Dėl „--output-chr 26“ PAR1 / PAR2 dabar pateikiama kaip „25“ (žmonėms), kad būtų atkurtas suderinamumas su tokiomis programomis kaip ADMIXTURE, kurios negali apdoroti abėcėlės chromosomų kodų. Įdiegtas --merge-x (dabar paprastai reikia derinti su --sort-vars). --pvar paprastai dabar gali tvarkyti „tik svetaines“ skirtus VCF failus (pvz., išleistus projekto gnomAD). Įdiegta --thhin, --thhin-count, --thhin-indiv ir --thhin-indiv-count.

Gruodžio 16 d.: įdiegtas kelių gijų zstd glaudinimas („Linux“ ir „MacOS“). --make-grm-gz pervadintas į --make-grm-list ir pašalintas gzip režimas.

Gruodžio 15 d.: ištaisytas --extract-if-info ir --exclude-if-info elgesys neskaitinėms reikšmėms, kurios prasideda skaičiumi. Egzistavimo tikrinimo vėliavėlės pervadintos į --require-info ir --require-no-info, kad pavadinimai būtų nuoseklūs.

Gruodžio 13 d.: pridėtos vėliavėlės --extract-if-info ir --exclude-if-info, kad būtų paprasta filtruoti INFO rakto/reikšmių poras arba rakto egzistavimą.

Gruodžio 11 d.: pridėta vėliavėlė --king-table-subset. Dėl to nesudėtinga atlikti dviejų etapų ryšio/dublikatų aptikimą: pradėkite nuo --make-king-table su nedideliu skaičiumi aukštesnio MAF variantų, išsibarsčiusių po genomą, tada paleiskite jį iš naujo su --king-table-subset. atitinkamas kandidatų imties porų pogrupis nuo pirmojo etapo. --bp-space įdiegtas (naudinga pirmajam etapui aukščiau).
Dviejų etapų darbo eigą pirmą kartą įdiegė Wei-Min Chen naujausioje KING versijoje, susisiekite su juo dėl citatos informacijos.

Gruodžio 7 d.: Ištaisyta klaida, kuri gali atsirasti filtruojant pavyzdžius iš fazinio duomenų rinkinio. Dabar pasiekiama „Windows AVX2“ versija.

Lapkričio 28 d.: pridėtos parinktys --import-dosage 'format=infer' (tai dabar yra numatytoji) ir 'id-delim=' (reikia pakartotinai importuoti duomenis "--export A-transpose"). Ištaisyta --import-dozavimo klaida, dėl kurios ji klaidingai nustatė trūkstamus genotipus formatu = 1. --no-psam-pheno (arba --no-pheno/--no-fam-pheno) dabar gali būti naudojamas norint nepaisyti visų fenotipų pavyzdiniame faile, išsaugant fenotipą (-us) --pheno faile, jei buvo nurodyta viena.

Lapkričio 27 d.: įdiegtas greitas kelias --glm netrūkstančio genotipo atveju (daugiausia turi įtakos tiesinei regresijai). --make-king[-table] dabar gali automatiškai tvarkyti per dideles matricas, kad tilptų į atmintį, nenaudojant aiškaus --parallel. AVX2 mėginių filtravimo našumo gerinimas. – patvirtinkite klaidų taisymą.

Lapkričio 19 d.: pataisykite VCF FORMAT/GT antraštės eilutės analizavimo klaidą, pristatytą lapkričio 14 d.

Lapkričio 18 d.: --make-king[-table] našumo patobulinimai.

Lapkričio 16 d.: ištaisyta lapkričio 14 d. versijos klaida, kuri nutraukė ##chrSet antraštės eilutės analizę.

Lapkričio 14 d.: ištaisyta klaida, sukėlusi --export pakabinti, kai variantų skaičius buvo nuo 65 iki maždaug tūkstančio.

Lapkričio 4 d.: Dabar galimi „Linux“ ir „MacOS“ iš anksto sukurti dvejetainiai AVX2 failai, kurie turėtų gerai veikti daugumoje įrenginių, sukurtų per pastaruosius 4 metus. Ištaisyta kita Firth regresijos klaidinga NA klaida. Ištaisyta – balo klaida, kuri įvyko, kai mėginio filtras (-ai) buvo pritaikyti vienu metu. Ištaisyta --ld fazinio sudėtingo skambučio tvarkymo klaida. Vykdomas „Array-popcount“ atnaujinimas (dėl neseniai atlikto Wojciecho Muła, Nathano Kurzo, Danielio Lemire'o ir Kimo Walischo darbo).

Lapkričio 3 d.: Fiksuotas daugiapakopis eksportas klaida. --dummy dosage-freq= dabar užpildo sunkiuosius skambučius su numatytuoju --hard-call-threshold ribą 0,1, kai --hard-call-threshold nėra aiškiai nurodytas.

Lapkričio 2 d.: --eksportuoti įgyvendinta (su dozavimo palaikymu). --dummy dosage-freq= modifikatorius dabar tinkamai veikia, kai dozavimo dažniai viršija 0,75.

Spalio 16 d.: įdiegta vėliavėlė --ref-from-fa, kad būtų nustatyti atskaitos aleliai iš FASTA failo. (Atkreipkite dėmesį, kad tai gali nepavykti nustatyti, kuris alelis yra nuoroda, kai keičiasi ilgis, bet jis visada turėtų veikti SNP ir kelių nukleotidų polimorfizmams.) Įdiegtas atnaujinimo pavadinimas. Ištaisyta stulpelių rinkinio analizės klaida spalio 13 d. versijoje.

Spalio 13 d.: Ištaisyta --glm logistic/Firth regresijos klaida, kuri gali duoti klaidingų NA rezultatų.

Spalio 9 d.: ištaisyta – ld tvarko kai kurias dozes ir haploidinius atvejus. Ištaisyta klaida, dėl kurios --make-pgen gali atmesti fazės / dozės informaciją, kai išgaunamas nedidelis variantų poaibis. --geno-skaičiai nebepraneša dvigubai chrY skaičių.

Spalio 8 d.: įdiegtas --ld, palaikomas suskirstytas į genotipus ir dozes (išbandykite "--ld <var1> <var2> dosage"). Ištaisyta maža bgen-1.1 importo klaida, kuri suveikė, kai gijų skaičius viršijo variantų skaičių.Alelio dažnio skaičiavimas chrX nebestringa, kai yra dozės, bet reikia tik griežtų skambučių.

Spalio 1 d.: Ištaisyta GRM skaičiavimo klaida, kuri kartais sukeldavo gedimų, kai buvo ir dozės, ir trūkstamos reikšmės. --glm dabar yra šiek tiek greitesnis, kai yra daug kintamųjų.

Rugsėjo 20 d.: Firth regresija Heseno matricos inversijos žingsnis padidintas iki dvigubo tikslumo, praėjusios savaitės statymams atskleidus, kad vieno tikslumo inversija gali būti nepatikima.

Rugsėjo 15 d.: Dabar veikia --vif/--max-corr kiekvieno varianto patikros. Logistinės regresijos metu jie nebepraleidžiami.

Rugsėjo 8 d.: dabar yra toleruojami alternatyvūs VCF INFO/PR laukai. Pašalintas derinimo kodas, kuris sulėtino vakarykštį --make-pgen.

Rugsėjo 7 d.: --score neinicializuotas atminties klaidų taisymas. Iš dalies etapinis duomenų tvarkymo klaidų taisymas.

Rugsėjo 6 d.: išspręskite „macOS“ dėklo dydžio problemą (gali sugesti --pca ir kai kurios kitos komandos naujausiose versijose. Rugsėjo 1 d. versijoje buvo neišsamus sprendimas).

Rugsėjo 4 d.: --[covar-]variance-standardize trūkstamų reikšmių tvarkymo klaidų taisymas. Įdiegtas --ref-allele/--alt1-alelis (--a2-alelis ir --a1-alelis traktuojami kaip slapyvardžiai).

Rugsėjo 1 d.: ---kvantiliuoti-normalizuoti trūkstamo fenotipo tvarkymo klaidų taisymą.

Rugpjūčio 29 d.: pridėta --glm 'gcountcc' stulpelių rinkinio parinktis (praneša genotipo standžiųjų skambučių skaičius, suskirstytas pagal atvejį / kontrolės būseną). Pridėta komanda --write-samples (analogiška --write-snplist).

Rugpjūčio 2 d.: --sort-vars įdiegtas.

Liepos 25 d.: --loop-cats dabar tinkamai veikia su genotipu pagrįstais variantų filtrais.

Liepos 24 d.: Ištaisyta „--pca apytiks“ alelio dažnio tvarkymo klaida, pristatyta birželio 4 d., rekomenduojame iš naujo atlikti visus „--pca apytiks“ paleidimus, atliekamus su paveikta versija. (Įprastas --pca nebuvo paveiktas.) Įdiegtas --loop-cats (panašus į PLINK 1.x --loop-assoc, išskyrus tai, kad tai neapsiriboja asociacijos testais). VCF eksportavimas dabar palaiko režimą „vcf-dosage=DS-force“. --Manekeno daugiagija + dozavimo klaidų taisymas.

Liepos 17 d.: BGEN v1.2/1.3 importuotojo atminties paskirstymo klaidų taisymas. Nepavykusio paskirstymo dydis dabar registruojamas dėl daugelio klaidų, kai trūksta atminties.

Liepos 2 d.: patobulintas daugiasriegis siuntimas BGEN v1.2/1.3 importuotoje. Python rašytojas dabar gali būti iškviestas su keliais variantais vienu metu.

Birželio 25 d.: Pagrindinis BGEN v1.2/1.3 importas (pakanka nefazuotų dvialelių dozių pagrindiniam JK Biobanko duomenų paskelbimui). -- Warning-errcode vėliavėlė pridėta (sukelia klaidos kodą, kuris grąžinamas į OS išeinant, kai išspausdinamas bent vienas įspėjimas).

Birželio 20 d.: --condition-list + variantų filtro klaidų taisymas.

Birželio 5 d.: --make-pgen atminties poreikis labai sumažėjo. Pabaigos laikas dabar spausdinamas konsolėje daugeliu atvejų.

Birželio 4 d.: --hwe nebesukelia segfault, kai yra chrX ir nėra informacijos apie lytį. Ištaisyta klaida.

Gegužės 29 d.: --import-dosage format=1 trikčių pataisymas.

Gegužės 26 d.: --glm 'standartinis beta' modifikatorius pakeistas žyma --variance-standardize. -- Pridėta kvantinio normalizavimo funkcija. Ištaisyta trūkstamos lyties alelių skaičiavimo klaida.

Gegužės 25 d.: --hardy/--hwe vėl tinkamai veikia, kai yra chrX, bet ne duomenų rinkinio pradžioje.

Gegužės 22 d.: Ištaisyti pagrindiniai dozavimo duomenys + mėginio filtro klaida, rekomenduojame iš naujo atlikti visas operacijas, susijusias su dozavimo duomenimis ir mėginių filtravimu, atliktu naudojant ankstesnes plink2 versijas. --score 'sąrašo variantų' modifikatorius pridėtas.

Gegužės 19 d.: Ištaisyta dozavimo duomenų alelio dažnio skaičiavimo klaida, kai taikomas (-i) mėginio filtras (-ai).

Gegužės 18 d.: Įdiegta daug kategorinių fenotipų tvarkymo vėliavėlių (--viduje, --keep-cats, --split-cat-pheno, . ). Įdiegtas pagrindinis fenotipu pagrįstas filtravimas (pvz., „--remove-if PHENO1 '>' 2.5“ atkreipkite dėmesį, kad neįvardintiems fenotipams priskiriami pavadinimai „PHENO1“, „PHENO2“ ir tt, o simboliai „<“ ir „>“ turi būti cituojamos daugumoje apvalkalų). --write-covar įdiegtas. Įdiegtas filtras --mach-r2, o neapdorotos MaCH r 2 reikšmės gali būti pašalintos naudojant "--freq cols=+machr2".

Gegužės 11 d.: --condition[-list] + --covar klaidų taisymas.

Gegužės 8 d.: pataisykite kiekybinį fenotipo / kovariato įkėlimo klaidą, pristatytą gegužės 6 d.

Gegužės 7 d.: --importo dozavimas įgyvendintas.

Gegužės 6 d.: Ištaisyta klaida, dėl kurios „0“ buvo traktuojama kaip kontrolinė, o ne trūko dvejetainių fenotipų. Nedidelis --glm stulpelių antraščių pakeitimas, ruošiantis daugialypiams duomenims.

Gegužės 2 d.: --score klaidų taisymas. --maj-ref klaidų taisymas. Įdiegti --vcf-min-dp ir "--export A-transpose".

Gegužės 1 d.: įdiegta VCF dozės importas / eksportavimas, --vcf-min-gq ir --read-freq. --score dabar gali dirbti su standartinėmis klaidomis. --autosome[-par] dabar veikia tinkamai. SNPHWE2 ir SNPHWEX funkcijos iš naujo licencijuotos kaip GPL-2+, kad būtų galima įtraukti į HardyWeinberg R paketą.

Balandžio 20 d.: .sample eksportavimo klaidų taisymas (neveikė, jei failas buvo didesnis nei 256 KB ir nebuvo fenotipų). -- Įdiegtas manekenas (dabar gali generuoti dozes).

Balandžio 19 d.: --hardy/--hwe chrX klaidų taisymas (ačiū Janui Graffelmanui už problemos supratimą ir pataisymo patvirtinimą). --new-id-max-allele-len dabar turi tris režimus („klaida“, „trūksta“ ir „sutrumpintas“), ir numatytasis režimas dabar yra „klaida“ (t. y. --set-missing-var-ids ir --set-all-var-ids dabar klaidos, kai aptinkamas ilgesnis nei 23 simbolių alelio kodas, o ne tyliai sutrumpinamas). --score įdiegtas ir išplėstas, kad būtų palaikomas dispersijos normalizavimas ir keli balų stulpeliai (šios dvi funkcijos suteikia paprastą būdą projektuoti naujus pavyzdžius į anksčiau apskaičiuotus pagrindinius komponentus).

Balandžio 11 d.: --pca var-wts riktų pataisymas ir --pca eigenvalue užsakymo riktas. Pridėta --glm tiesinė regresija ir --condition[-list] palaikymas. --geno/--mind/--missing/-genotiping-rate dabar gali reikšti trūkstamas dozes, o ne tiesiog trūkstamus iškvietimus (atminkite, kad importuojant dozavimo duomenis, dozės nurodytos (0.1, 0.9) ir (1.1, 1.9) yra išsaugoti, bet paprastai nesusijusių sunkiųjų skambučių nebus).


IŠRAIŠKOS

Šias filtravimo išraiškas priima dauguma komandų.

Tinkamose išraiškose gali būti:

skaitinės konstantos, eilučių konstantos, failų pavadinimai (šiuo metu tai palaikoma tik norint filtruoti pagal ID stulpelį)

". Išraiškose skiriamos didžiosios ir mažosios raidės, nebent pridėta "/i".

loginiai operatoriai. Taip pat žr. toliau pateiktus pavyzdžius ir filtravimo mokymo programą apie skirtumą tarp „&&“ nuo „&“ ir „||“ prieš "|".

INFO žymos, FORMAT žymos, stulpelių pavadinimai

pradedant nuo 1.11, stulpelio FILTRAS užklausą galima pateikti taip:

1 (arba 0), kad patikrintumėte vėliavėlės buvimą (arba nebuvimą).

Trūkstamus genotipus galima suderinti nepriklausomai nuo fazės ir ploidiškumo (".|.", "./.", ".", "0|.") naudojant šias išraiškas

trūkstamus genotipus galima suderinti, įskaitant fazę ir ploidiją (.|.", "./.", ".") naudojant šias išraiškas

mėginio genotipas: nuoroda (haploidas arba diploidas), alternatyvus (hom arba het, haploidas arba diploidas), trūkstamas genotipas, homozigotinis, heterozigotinis, haploidas, ref-ref hom, alt-alt hom, ref-alt het, alt-alt het, haploidinis ref., haploidinis alt (neatskiriamos didžiosios ir mažosios raidės)

TYPE varianto tipui REF, ALT stulpeliuose (indel,snp,mnp,ref,bnd,other,persidengimas). Naudokite reguliariosios išraiškos operatorių "

" reikalauti bent vieno nurodyto tipo alelio arba lygybės ženklo " literallayout">TYPE="snp" TYPE

masyvo apatiniai indeksai (pagrįsti 0), „*“ bet kuriam elementui, „-“ nurodo diapazoną. Atkreipkite dėmesį, kad užklausai FORMAT vektorių, dvitaškis ":" gali būti naudojamas norint pasirinkti pavyzdį ir vektoriaus elementą, kaip parodyta toliau pateiktuose pavyzdžiuose.

su daugybe pavyzdžių gali būti praktiškiau pateikti failą su pavyzdžių pavadinimais, po vieną pavyzdžio pavadinimą eilutėje

funkcija FORMAT žymose (virš pavyzdžių) ir INFO žymose (virš vektorinių laukų): maksimalus minimalus aritmetinis vidurkis (AVG yra MEAN sinonimas) vidutinis standartinis nuokrypis nuo vidutinės sumos eilutės ilgio absoliučios vertės elementų skaičius:

Atminkite, kad anksčiau pateiktos funkcijos įvertinamos iki vienos vertės visuose pavyzdžiuose ir yra skirtos svetainėms, o ne pavyzdžiams, atrinkti, net kai jos taikomos FORMAT žymoms. Tačiau, kai priešdėlis yra SMPL_ (arba "s", kad būtų trumpas, pvz., SMPL_MAX arba sMAX), jie bus įvertinti kaip pavyzdžio verčių vektorius, kai bus pritaikyti FORMAT žymoms:

dviejų uodegų binominis testas. Atkreipkite dėmesį, kad N=0 testas įvertina trūkstamą reikšmę, o kai FORMAT/GT naudojamas vektorių indeksams nustatyti, homozigotiniams genotipams jis įvertina iki 1.

kintamieji apskaičiuoti skrydžio metu, jei jų nėra: alternatyvių alelių skaičius mėginių skaičius alternatyvių alelių skaičius mažųjų alelių skaičius (panašus į AC, bet visada mažesnis nei 0,5) alternatyvių alelių dažnis (AF=AC/AN) mažų alelių dažnis ( MAF=MAC/AN) alelių skaičius vadinamuose genotipuose mėginių, kurių genotipo dalis trūksta, skaičius mėginių, kurių genotipo indelio ilgis trūksta (delecijos neigiamos, įterpimai teigiami)

imčių, kurios perduoda išraišką, skaičius (N_PASS) arba trupmena (F_PASS).

pasirinktinis perl filtravimas. Atminkite, kad ši komanda nėra sudaryta pagal numatytuosius nustatymus, žr. skyrių Neprivalomas kompiliavimas naudojant Perl faile INSTALL, kad gautumėte pagalbos, o misc/demo-flt.pl – darbo pavyzdžiu. Demonstracinė versija apibrėžė perl paprogramę „sunkumas“, kurią galima iškviesti iš komandinės eilutės taip:

Kablelis eilutėse interpretuojamas kaip skyriklis, o kai lyginamos kelios reikšmės, naudojama ARBA logika. Todėl šios dvi išraiškos yra lygiavertės, bet ne trečioji:

Užklausant kelias reikšmes, visi elementai yra išbandomi ir rezultatui naudojama ARBA logika. Pavyzdžiui, užklausus „TAG=1,2,3,4“, jis bus įvertintas taip:

Korpuso išplėtimas:

Atminkite, kad posakiai dažnai turi būti cituojami, nes kai kurie simboliai apvalkale turi ypatingą reikšmę. Išraiškos pavyzdys, įtrauktas į atskiras kabutes, dėl kurių visa išraiška perduodama programai, kaip numatyta:

Išsamesnės informacijos ieškokite savo apvalkalo dokumentacijoje.


Koduoti kelis įrašus Po to Duomenis renkate paketu

The NIOSH pramonės ir profesijų kompiuterizuota kodavimo sistema (NIOCCS) yra nemokama žiniatinklio programinės įrangos programa, verčianti pramonės ir profesijų tekstus į standartizuotus pramonės ir profesijų kodus. NIOCCS koduoja dideles jau surinktų pramonės ir profesijų duomenų partijas.

1.Eikite į NIOCCS puslapis. Jei turite daug koduojamų įrašų, turėsite užsiregistruoti saugios prieigos valdymo paslaugos (SAMS) paskyrai. Norėdami užsiregistruoti, atsiųskite savo vardą ir pavardę bei el. pašto adresą [email protected] Jei koduojate tik kelis įrašus, galite naudoti vieno įrašo kodavimo priemonę, kuriai nereikia paskyros.

Pateikite užkoduotą pramonės ir profesijos tekstą. Jei turite tik kelis įrašus, galite juos įvesti neįkeldami failo. Jei turite daug įrašų, greičiausia informaciją įkelti failo formatu. Į NIOCCS įkelti failai turi būti standartinio .txt failo formato, atskirto tabuliavimo arba vamzdžio simboliu (|), ir juose turi būti bent:

Kiekvienas pateiktas įrašas turi turėti reikšmę ID lauke ir turi turėti bent vieną reikšmę pramonės pavadinime arba profesijos pavadinime – pavyzdys, kaip gali atrodyti failas, rodomas čia:

2.Kodas naudojant NIOCCS. NIOCCS automatiškai koduoja visus įvestus įrašus, tačiau svarbu įvesti gerą informaciją. Jei kyla problemų dėl įvestų pareigybių aprašymų, pvz., rašybos klaidų ar neišsamių aprašymų, jūsų rezultatai nebus tokie geri.

3. Atsisiųskite rezultatus. Kai kodavimo procesas bus baigtas, galite atsisiųsti užkoduotą išvesties failą, kuriame yra originalūs įkelti duomenys arba įvesties duomenų laukai ir standartizuotas surašymas, NAICS ir SOC pramonės ir profesijų kodai.


Apibūdinimas

Mėnuo

Sugeneruoja atsitiktinį įmonės pavadinimą, kurį sudaro lorem ipsum žodis ir atitinkama priesaga, pvz., Dolor Inc. arba Convallis Limited.

Šis duomenų tipas generuoja atsitiktinį SIRET / SIREN Prancūzijos verslo identifikavimo numerį.

SIRET:

SIRENA:

Daugiau informacijos:

Sugeneruoja asmens numerį, kai kuriose šalyse naudojamą socialinio draudimo draudimui. Šiuo metu palaikomos tik švediškos. Asmeniniai numeriai generuojami pagal jūsų nurodytą formatą:

AsmeninisNumerisBe brūkšnelio

AsmeninisNumerisSu brūkšneliu

Generuoja organizacijų numerius, naudojamus kai kuriose šalyse registruoti įmones, asociacijas ir pan. Šiuo metu palaikomi tik švediški. Organizacijos numeriai generuojami pagal jūsų nurodytą formatą:

OrganizationNumberWithoutBrūkšnelis

OrganizationNumberWithBrūkšneliu

Sugeneruoja atsitiktines Kanados provincijas, valstijas, teritorijas ar grafystes pagal jūsų pasirinktas parinktis. The Pilnas vardas ir Santrumpa antrinės parinktys nustato, ar išvestyje bus visa eilutė (pvz., "British Columbia") ar jos santrumpa (pvz., "BC"). JK apskričių santrumpa yra standartinis 3 simbolių Chapman kodas.

Šis duomenų tipas generuoja atsitiktinę platumą ir (arba) ilgumą. Jei pasirenkami abu, rodomi abu atskirti kableliu.

Šis duomenų tipas generuoja atsitiktinius galiojančius kredito kortelių numerius pagal jūsų nurodytą formatą. Šiuo metu ji gali generuoti šių prekių ženklų numerius: Mastercard, viza, Visa Electron, „American Express“., Atrasti, American Diner's, Carte Blanche, „Diner's Club International“., , JCB, Maestro, Solo, Perjungti, Lazeris.

Sugeneruoja atsitiktinį kredito kortelės PIN kodą nuo 1111 iki 9999.

Sugeneruoja atsitiktinį kredito kortelės CVV numerį nuo 111 iki 999.

Ši parinktis sugeneruoja fiksuotą skaičių atsitiktinių žodžių, paimtų iš standartinio lotyniško teksto lorem ipsum.

Ši parinktis sugeneruoja atsitiktinį žodžių skaičių – bendrą skaičių jūsų nurodytame diapazone (imtinai). Kaip ir naudojant fiksuoto skaičiaus parinktį, žodžiai ištraukiami standartiniu lotynišku tekstu lorem ipsum.

Šis duomenų tipas leidžia generuoti atsitiktines raidines ir skaitmenines eilutes. Šioje lentelėje yra šio lauko simbolių legenda. Visi kiti šiame lauke įvesti simboliai bus rodomi be kodo.

Sugeneruoja Būlio reikšmę reikiamu formatu. Galite nurodyti kelis formatus, atskirdami juos vamzdžio (|) simboliu. Šios eilutės bus konvertuotos į jų loginį atitikmenį:

  • Taip ar ne
  • Netiesa ar tiesa
  • 0 arba 1
  • Y arba N
  • Fortas
  • klaidinga ar tiesa

tikrosios ir klaidingos vertybės yra ypatingos. Atsižvelgiant į eksporto tipą, jie gali būti išvesti be dvigubų kabučių.

Sugeneruoja stulpelį, kurio kiekvienoje eilutėje yra unikalus skaičius, didėjantis bet kokia įvesta verte. Ši parinktis gali būti naudinga įterpiant duomenis į duomenų bazės lauką su automatiškai didėjančiu pirminiu raktu.

Pasirenkama rezervuotos vietos eilutė leidžia įterpti sugeneruotą prieaugio reikšmę į eilutę per vietos rezervuaras. Pavyzdžiui:

Tai atsitiktinai sugeneruoja skaičių tarp jūsų nurodytų reikšmių. Abu laukeliai leidžia įvesti neigiamus skaičius.

Šis duomenų tipas generuoja atsitiktines valiutos reikšmes bet kokiu norimu formatu ir diapazonu. Išskleidžiamajame pavyzdyje yra keletas parinkčių, kad galėtumėte suprasti, kaip tai veikia, bet štai ką reiškia kiekviena parinktis.

Formatas

Svyruoja nuo

Diapazonas – iki

Valiutos simbolis

Priešdėlis / Priesaga

Šis duomenų tipas leidžia generuoti duomenų stulpelį, kuriame yra pasikartojančios reikšmės iš eilutės į eilutę. Štai keletas pavyzdžių, kad suprastumėte, kaip tai veikia.

  • Jei norite pateikti kiekvienos eilutės reikšmę "1", galite įvesti "1" lauke Reikšmė (-ės) ir bet kurią reikšmę (>0) lauke Ciklo skaičius.
  • Jei norite, kad 100 eilutės "Male" po 100 eilučių būtų "Female" ir kartotųsi, galite įvesti "100" lauke Ciklų skaičius ir "Male|Female" lauke Reikšmė (-ės).
  • Jei norite 5 eilučių nuo 1 iki 10, įveskite "5" lauke Ciklo skaičius ir "1|2|3|4|5|6|7|8|9|10" lauke Reikšmė (-ės).

Pabandyk su juo susitvarkyti. Jūs suprasite idėją.

Sudėtinių duomenų tipas leidžia sujungti duomenis iš bet kurios kitos eilutės ar eilučių ir jais manipuliuoti, keisti, derinti informaciją ir dar daugiau. Turinys turi būti įvestas Smarty šablonų kalba.

Norėdami išvesti vertę iš bet kurios eilutės, tiesiog naudokite vietos rezervavimo ženklus , ir tt Negalite kreiptis į dabartinę eilutę – tai arba ištirpdytų serverį, ir (arba) susprogtų visata.

  • Rodyti reikšmę iš 6 eilutės:
  • Darant prielaidą, kad 1 ir 2 eilutėse yra atsitiktiniai skaičiai, toliau pateikiami paprastos matematikos pavyzdžiai:
    • - atimti
    • - daugyba
    • <$ROW2/$ROW1> - padalijimas

    Daugiau informacijos apie sintaksę rasite Smarty svetainėje.

    Šis duomenų tipas leidžia generuoti į medį panašius duomenis, kuriuose kiekviena eilutė yra kitos eilutės antrinė eilutė, išskyrus pačią pirmąją eilutę, kuri yra medžio kamienas. Šis duomenų tipas turi būti naudojamas kartu su automatinio didinimo duomenų tipu: tai užtikrina, kad kiekviena eilutė turėtų unikalią skaitinę reikšmę, kurią šis duomenų tipas naudoja pirminėms eilutėms nurodyti.

    Parinktys leidžia nurodyti, kuris iš formos laukų yra tinkamas automatinio didinimo laukas ir maksimalų mazgo antrinių skaičių.

    Įveskite elementų sąrašą, atskirtą vamzdeliu | charakteris. Tada pasirinkite, ar norite Būtent X prekių skaičius arba Daugiausia X elementų iš sąrašo. Keli elementai rezultatuose pateikiami kableliais atskirtame sąraše. Jei norite, kad į duomenų rinkinį būtų įtrauktos tuščios reikšmės, tiesiog pabaigoje pridėkite vieną ar daugiau vamzdžių simbolių – kuo daugiau vamzdžių įvesite, tuo didesnė tikimybė, kad bus sugeneruota tuščia reikšmė.

    The Apskaičiuota Duomenų tipas suteikia prieigą prie metaduomenų apie laukus eilutėje, kad galėtumėte generuoti bet kokią norimą išvestį pagal šią informaciją. Jei jums tiesiog reikia pasiekti sukurtas eilutės reikšmę iš kito lauko (ty ką matote išvestyje), žr Sudėtinis Duomenų tipas. Šis lauko tipas suteikia daug daugiau prieigos prie kiekvieno lauko.

    , ir t. t. yra viskas, ką galima rasti apie konkrečią eilutę. Turinys keičiasi atsižvelgiant į eilutės duomenų tipą ir tai, kas buvo sugeneruota, tačiau aukšto lygio jame yra šios savybės:

    • - bet kokios parinktys buvo įvestos sąsajos / API iškvietime eilutėje
    • - bet kokie papildomi metaduomenys, grąžinti pagal duomenų tipą
    • – faktinis sugeneruotas atsitiktinis šio lauko turinys (visada „rodymo“ ypatybėje) ir bet kokia kita informacija apie sugeneruotą turinį
    • - patogus JSON serializavimas visko, kas yra eilėje, kad galėtumėte matyti, kas yra. Tiesiog paleiskite jį per JSON formatuotoją.
    • – išves sukurto a turinio lytį („vyras“, „moteris“ arba „nežinoma“). Vardai Laukas Duomenų tipas (būtinai pakeiskite „1“ teisingu eilutės numeriu!). Jei naudojote Moters vardas kaip vietos rezervavimo eilutė, šis kintamasis kiekvieną kartą grąžins „moterį“. Jei įvedėte „Vardas“, grąžinama reikšmė priklausys nuo sugeneruotos eilutės. Jei įvedėte kelių formatų rezervuotos vietos eilutę, ji pateiks „nežinoma“, jei joje yra abiejų lyčių, arba jos nėra (pvz., pavardė be vardo).

    De-nied. Jei norite bendrinti šį duomenų rinkinį su kitais žmonėmis, pirmiausia turite jį išsaugoti.

    Suprantu, kad norėdamas bendrinti šį duomenų rinkinį turiu jį paskelbti viešai.

    Išsiųskite vartotojui prisijungimo informaciją el. paštu

    Ar tikrai norite ištrinti šią vartotojo paskyrą?

    Pirmas vardas
    Pavardė
    El. paštas

    Įjungėte grupavimą / sumažinimą. Jei spustelėsite mygtuką Reset Plugins, turėsite paleisti niurzgėti kad atkurtumėte ryšulius. Norėdami gauti daugiau informacijos, skaitykite šį dokumentacijos puslapį. Jei kyla problemų, galbūt norėsite išjungti grupavimą.

    Apie

    Ar kada nors reikėjo pasirinktinio formato pavyzdžių / bandymų duomenų, pvz., blogai? Na, tokia šio scenarijaus idėja. Tai nemokamas atvirojo kodo įrankis, parašytas „JavaScript“, PHP ir „MySQL“, leidžiantis greitai generuoti didelius tinkintų duomenų kiekius įvairiais formatais, kuriuos galima naudoti testuojant programinę įrangą, pildant duomenų bazes ir. Ir taip toliau.

    Ši svetainė siūlo internetinę demonstracinę versiją, kurioje galite pažaisti, kad suprastumėte, ką veikia scenarijus, kokias funkcijas jis siūlo ir kaip veikia. Tada, kai tik sužadinsite apetitą, galėsite atsisiųsti nemokamą, visiškai funkcionalią, GNU licencijuotą versiją. Arba, jei norite išvengti rūpesčių nustatydami jį savo serveryje, galite paaukoti 20 USD ar daugiau, kad gautumėte paskyrą šioje svetainėje, kad galėtumėte generuoti iki 5 000 įrašų vienu metu (vietoj 100). ir leidžia išsaugoti duomenų rinkinius. Norėdami gauti daugiau informacijos, spustelėkite skirtuką „Paaukoti“.

    Išplėskite jį

    Paruoštame scenarijuje yra tokių funkcijų, kurių jums paprastai reikia. Tačiau niekas niekada nėra baigtas – galbūt jums reikia sugeneruoti atsitiktines ezoterines matematikos lygtis, ištraukti atsitiktinius tviterius arba rodyti atsitiktinius vaizdus iš „Flickr“ su žodžiu „Raudonnugaris pelėnas“ pavadinime. Kas žino. Kiekvieno naudojimo atvejis yra skirtingas.

    Atsižvelgiant į tai, naujoji scenarijaus versija (3.0.0+) buvo sukurta taip, kad ją būtų galima visiškai išplėsti: kūrėjai gali rašyti savo duomenų tipus, kad generuotų naujų tipų atsitiktinius duomenis, ir net tinkinti eksportavimo tipus, ty formatą kurių duomenys išvedami. Žmonės, norintys generuoti tikslesnius lokalizuotus geografinius duomenis, gali pridėti naujų šalies įskiepių, kuriuose pateikiami pasirinktos šalies regionų pavadinimai (valstybės, provincijos, teritorijos ir kt.), miestų pavadinimai ir pašto / pašto kodų formatai. Norėdami gauti daugiau informacijos apie visa tai, apsilankykite kūrėjo dokumentacijoje.

    Parsisiųsti

    Spustelėkite toliau esantį mygtuką, kad atsisiųstumėte naujausią scenarijaus versiją iš github. Daugiau informacijos rasite vartotojo dokumentacijoje.

    Projekto naujienos

    Vartotojų paskyros

    Šioje skiltyje galite sukurti bet kokį vartotojų paskyrų skaičių, kad žmonės galėtų pasiekti scenarijų. Tik jūs galite sukurti arba ištrinti paskyras.

    Dar nepridėta jokių vartotojų paskyrų.

    Paaukok dabar!

    Jei tai padėjo jums jūsų darbe, auka visada vertinama! Jei bendro gero darymo jausmo nepakanka, kad įtikintumėte jus aukoti, pateikiame dar keletą materialinių paskatų:

    • Projekto palaikymas suteikia puikių naujų funkcijų! Nuoširdus!
    • Paaukoję 20 USD ar daugiau, gausite vartotojo paskyrą šioje svetainėje. Naudodami vartotojo paskyrą galite:
      • Vienu metu sukurkite iki 10 000 eilučių, o ne 100.
      • Išsaugokite formos konfigūracijas, kad jums nereikėtų iš naujo kurti duomenų rinkinių kiekvieną kartą, kai grįžtate į svetainę.

      Kiekvienas jūsų paaukotas 20 USD prideda a metų į savo sąskaitą. Galite grįžti vėliau ir pridėti daugiau laiko prie paskyros – jis bus pridėtas prie dabartinio laiko pabaigos. Tiesiog būtinai paaukokite tuo pačiu el. pašto adresu. Jei turite problemų dovanodami ar su savo vartotojo paskyra, tiesiog parašykite man.

      Paaukojus, jums bus išsiųstas el. laiškas su išsamia informacija apie tai, kaip užbaigti paskyros sukūrimą (patikrinkite pašto šiukšlių aplanką!). Jei turite kokių nors problemų, susisiekite su manimi.


      Žiūrėti video įrašą: Essential Bioinformatics Linux Commands. head wc cut grep sed (Birželis 2022).