該研究為當(dāng)前的人類參考基因組(GRCh38)增加了1.19億個(gè)堿基對(duì)(指在DNA雙螺旋結(jié)構(gòu)中的兩個(gè)互補(bǔ)配對(duì)的堿基)和1115個(gè)基因重復(fù),并由此得到了兩個(gè)新發(fā)現(xiàn)。未來(lái),該計(jì)劃旨在觀察和描繪350名個(gè)體的遺傳多樣性。
泛基因組管狀圖譜:人類泛基因組草圖增加了1.19億個(gè)堿基對(duì)(指在DNA雙螺旋結(jié)構(gòu)中的兩個(gè)互補(bǔ)配對(duì)的堿基)和1115個(gè)基因重復(fù)。
當(dāng)?shù)貢r(shí)間5月10日,人類泛基因組參考聯(lián)盟(Human Pangenome Reference Consortium)發(fā)表了首個(gè)人類泛基因組草圖。相關(guān)的四篇論文均已發(fā)布,其中三篇發(fā)布在《自然》(Nature)雜志,一篇發(fā)布在《自然-生物技術(shù)》(Nature Biotechnology)雜志。
該草圖旨在盡可能多地描繪出最終代表整個(gè)物種的DNA(脫氧核糖核酸)序列。它從47個(gè)祖先不同的個(gè)體中開發(fā)而來(lái),相比于此前的人類參考基因組版本(GRCh38,是一個(gè)目前被廣泛使用的,用于描述人類基因組序列的標(biāo)準(zhǔn)),人類泛基因組草圖增加了1.19億個(gè)堿基對(duì)(指在DNA雙螺旋結(jié)構(gòu)中的兩個(gè)互補(bǔ)配對(duì)的堿基)和1115個(gè)基因重復(fù)。相比于GRCh38,該草圖能檢測(cè)到結(jié)構(gòu)變異基因的數(shù)量增加了104%,為更完整地描繪人類基因組的遺傳多樣性提供了更多支持。
覆蓋全球范圍的泛基因組。
該項(xiàng)研究由美國(guó)華盛頓大學(xué)醫(yī)學(xué)院( University of Washington School of Medicine)、美國(guó)加利福尼亞大學(xué)(University of California)等主導(dǎo)。研究稱,GRCh38是目前已知的人類基因組序列的一個(gè)標(biāo)準(zhǔn)版本,它由一小部分人類基因組測(cè)序數(shù)據(jù)組成,其中包含許多已知的人類基因組變異和SNP(單核苷酸多態(tài)性)信息。GRCh38是人類基因組研究的重要工具,可以用來(lái)識(shí)別、定位和注釋基因,以及進(jìn)行遺傳變異分析和比較基因組學(xué)研究。“但是,由于人類基因組是高度復(fù)雜的,存在很大的個(gè)體差異和變異形態(tài),因此仍需要更深入的研究和探索來(lái)完善我們對(duì)其的理解?!?/p>
發(fā)表于《自然-生物技術(shù)》的文章《A draft human pangenome reference》表示,自20年前首次發(fā)布人類參考基因組以來(lái),它一直是人類基因組學(xué)的支柱。但在當(dāng)前的GRCh38版本中,有210 Mb(兆堿基)的DNA序列段沒(méi)有被完整地測(cè)序,或無(wú)法確定其序列,其中151 Mb的區(qū)域完全未知,而59 Mb的區(qū)域是通過(guò)計(jì)算機(jī)模擬得到的預(yù)測(cè)序列。這種情況會(huì)造成相關(guān)研究的數(shù)據(jù)偏差,也意味著在人類基因圖譜中,依然有很多區(qū)域是我們尚未可知?!耙虼?,我們需要不斷完善它。”
發(fā)表在《自然》的三篇文章提出了使用人類泛基因組草圖得到的新發(fā)現(xiàn)。在第一篇文章《Increased mutation and gene conversion within human segmental duplications》中,Evan Eichler和同事開發(fā)了一個(gè)單核苷酸變異(SNV)圖譜,其中包含了數(shù)百萬(wàn)先前未被描繪的SNV,同時(shí),該圖譜描述了一些基因組區(qū)域的變異性質(zhì),這些區(qū)域擁有片段重復(fù)序列,并在基因組的一個(gè)或多個(gè)位點(diǎn)上重復(fù)出現(xiàn),共享著高度相同的DNA序列。這種重復(fù)序列的存在可能導(dǎo)致基因組變異,從而對(duì)個(gè)體的表型特征和患病風(fēng)險(xiǎn)產(chǎn)生影響。
首個(gè)人類泛基因組草圖發(fā)表。
在第二篇《Recombination between heterologous human acrocentric chromosomes》文章中,Erik Garrison和同事利用人類泛基因組草圖,觀察到異源著絲粒染色體短臂(q-arm translocation,染色體的一個(gè)部分,通常位于染色體的末端)之間的重組模式,并觀察到了某種DNA交換機(jī)制。這表明,在染色體之間,一種過(guò)去曾被推測(cè)但未被證實(shí)的DNA交換方式的確存在。
在第三篇《Pangenome graph construction from genome alignments with Minigraph-Cactus》中,研究人員利用人類泛基因組草圖提高了Pangenome參考基因組的準(zhǔn)確性。Glenn Hickey等人表示,Pangenome是一種新興的基因組分析模式,這種模式不僅能分析個(gè)體基因組的變異,還能分析物種內(nèi)所有個(gè)體之間共享的基因組變異,從而為更全面、準(zhǔn)確地描述一個(gè)物種基因組提供了框架。在此次研究中,科學(xué)家們展示了“Minigraph-Cactus pangenome pipeline”的流程,該方法可以直接從全基因組比對(duì)中創(chuàng)建Pangenome,同時(shí)它還可以處理比較人類和果蠅之間的跨物種基因組數(shù)據(jù)。這為將來(lái)更好地理解物種間和個(gè)體間的基因組變異提供了更全面的信息。
當(dāng)然,這些成果還只是人類泛基因組研究發(fā)展中的一個(gè)過(guò)渡階段,該計(jì)劃旨在觀察和描繪350名個(gè)體的遺傳多樣性。研究人員Arya Massarat 強(qiáng)調(diào)了目前成果的重要性,但也表示,還需要持續(xù)改進(jìn)以克服現(xiàn)有不足,比如,更多樣化的取樣?!斑@將幫助我們理解促成生理和臨床特征的遺傳變異,并為全球健康事業(yè)做出貢獻(xiàn)。”
聯(lián)系客服