近些年來,隨著生物信息分析方法的發(fā)展,MinION測序reads成功比對(duì)參考基因組的比例已經(jīng)從66%提升至92%。文章下面對(duì)各種工具的適用場景進(jìn)行了分別介紹。工具概述見表1。
Metrichor是ONT公司推出的基于隱馬爾可夫模型進(jìn)行堿基識(shí)別的軟件。它的使用需要網(wǎng)絡(luò)連接。MinION注冊(cè)用戶需要獲得開發(fā)者賬號(hào)才能獲得軟件的源代碼。2016年初,兩個(gè)實(shí)驗(yàn)室分別開發(fā)了Nanocall和DeepNano軟件。這兩個(gè)軟件都可以在本地運(yùn)行,不需要網(wǎng)絡(luò)連接。Nanocall基于隱馬爾可夫模型,可對(duì)1D read在本地進(jìn)行堿基識(shí)別;DeepNano基于recurrent neural network framework,可以獲得比隱馬爾可夫模型更準(zhǔn)確的堿基識(shí)別。
(2)序列比對(duì)工具
傳統(tǒng)的NGS序列比對(duì)軟件不能滿足MinION序列比對(duì)的需求。這是因?yàn)镸inION測序數(shù)據(jù)錯(cuò)誤率相對(duì)高且序列長,即使調(diào)整參數(shù)也不能取得好的效果。在這種情況下,適合MinION測序數(shù)據(jù)的比對(duì)軟件應(yīng)運(yùn)而生。
MarginAlign是通過更好地估計(jì)MinION測序reads測序錯(cuò)誤來源從而提高與參考基因組的比對(duì)效率。通過評(píng)估檢測到的變異,發(fā)現(xiàn)其顯著提高了比對(duì)的準(zhǔn)確性。由于MarginAlign是基于LAST或BWA mem的比對(duì)結(jié)果進(jìn)行優(yōu)化,結(jié)果的最終準(zhǔn)確性依賴最初的比對(duì)結(jié)果。GraphMap是另一個(gè)用于MinION測序數(shù)據(jù)比對(duì)的軟件。它利用的是一種啟發(fā)式(heuristics)方法,對(duì)高錯(cuò)誤率reads和長reads進(jìn)行了優(yōu)化。一項(xiàng)研究表明GraphMap比對(duì)的靈敏性可與BLAST媲美,且它對(duì)reads測序錯(cuò)誤率的估計(jì)與MarginAlign相當(dāng)。
(3) 從頭組裝工具
MinION測序數(shù)據(jù)不適合利用NGS數(shù)據(jù)組裝的de Bruijn圖法進(jìn)行組裝,主要存在兩方面的原因。第一,de Bruijn圖法等方法依賴測序reads拆分的k-mer測序準(zhǔn)確,而高錯(cuò)誤率的MinION測序reads不能保證這一點(diǎn);第二,de Bruijn圖的結(jié)構(gòu)不適用長reads。
MinION測序數(shù)據(jù)的長reads更適合Sanger測序時(shí)期基于有overlap的共有(consensus)序列組裝的方法。需要的是在組裝前進(jìn)行測序reads的糾錯(cuò)。第一個(gè)基于這種原理進(jìn)行組裝的研究組利用MinION數(shù)據(jù)組裝了一個(gè)完整的E. coli K-12 MG1655基因組,序列準(zhǔn)確率達(dá)到99.5%。他們利用的流程稱為nanocorrect,首先利用graph- based,greedy partial order aligner方法進(jìn)行糾錯(cuò),然后利用Celera Assembler將糾錯(cuò)后的reads進(jìn)行組裝,最后利用nanopolish對(duì)組裝結(jié)果進(jìn)行進(jìn)一步提升。
(4)單核苷酸變異檢測工具
Reference allele bias是一種在變異檢測中傾向于少檢測出變異的現(xiàn)象。該現(xiàn)象在測序reads錯(cuò)誤率高的情況下尤為嚴(yán)重。
MarginAlign中的marginCaller模塊是研究機(jī)構(gòu)開發(fā)的適用于MinION測序數(shù)據(jù)的變異檢測軟件。MarginCaller利用maximum-likelihood參數(shù)估計(jì)和多條測序reads序列比對(duì)來檢測單核苷酸變異。當(dāng)計(jì)算機(jī)模擬出測序錯(cuò)誤為1%時(shí),測序深度在60X,marginCaller檢測出的SNV具有97%的準(zhǔn)確率和完整度。另外一項(xiàng)研究中,研究者利用GraphMap方法,檢測人基因組的雜合變異,可以達(dá)到96%的準(zhǔn)確率。利用計(jì)算機(jī)模擬的數(shù)據(jù),GraphMap同樣可以高準(zhǔn)確率,高完整度地檢測出結(jié)構(gòu)變異。Nanopolish也可以用來檢測變異。它用的是event-level alignment算法。在該方法中,從參考基因組序列開始,依次評(píng)估參考基因組序列產(chǎn)生的電信號(hào)與測序reads的相似性進(jìn)而依次修飾參考基因組序列,生成一個(gè)consensus read。直到consensus read與測序read產(chǎn)生的電信號(hào)足夠相似,將consensus read與參考基因組序列比較,得到變異。該方法在埃博拉病毒的研究中有大約80%的準(zhǔn)確性。
PoreSeq采用與Nanopolish類似的算法。它可以利用更低深度的測序數(shù)據(jù)獲得高準(zhǔn)確率和高完整度的SNV檢測。在一項(xiàng)研究中,PoreSeq在16X測序深度下獲得99%準(zhǔn)確率和完整度的SNV檢測,與marginAlign相比,它顯著降低了測序深度。
(5)共有序列的測序(consensus sequencing)方法
MinION測序數(shù)據(jù)目前只有92%的準(zhǔn)確性。在低深度測序的情況下,不能夠滿足類似單體型(haplotype phasing)和人樣品的SNV檢測的要求。文章提到的解決問題的方法是rolling circle amplication,它的原理是將一個(gè)片段進(jìn)行多次擴(kuò)增,在一個(gè)DNA分子上生成多個(gè)拷貝,這樣最終獲得的共有序列測序結(jié)果的準(zhǔn)確率可以達(dá)到97%。
三、MinION目前的應(yīng)用領(lǐng)域
1、即時(shí)檢測傳染源
NGS測序方法可以在醫(yī)院環(huán)境下進(jìn)行傳染源等病菌的檢測,而MinION測序方法提供的是一種全新的體驗(yàn)。MinION在測序讀長,攜帶的方便性,檢測時(shí)長方面具有NGS不可比的優(yōu)勢。文獻(xiàn)記載從樣品準(zhǔn)備到發(fā)現(xiàn)致病菌只需要6小時(shí)時(shí)間,而從樣品放置機(jī)器到發(fā)現(xiàn)致病菌只需要4分鐘。文章列舉了截至目前用MinION測序儀涉及研究的物種及詳細(xì)描述了西非爆發(fā)埃博拉病毒時(shí),MinION測序方法在病毒檢測過程中起到的重要作用。
MinION可以在胎兒非整倍體產(chǎn)前檢測中發(fā)揮重要作用。利用NGS平臺(tái),通常需要1-3周時(shí)間獲得結(jié)果。而利用MinION測序方法,文獻(xiàn)報(bào)道只需要4小時(shí)。
3 、太空應(yīng)用
在太空飛行中,發(fā)掘細(xì)菌和病毒是很困難的事情。大部分研究是將樣品帶回地球進(jìn)行測序鑒定。目前,NASA準(zhǔn)備利用MinION測序儀在國際空間站進(jìn)行病菌的實(shí)時(shí)測序。
為了滿足研究人員對(duì)高通量測序的需求,ONT公司開發(fā)了一個(gè)臺(tái)式納米孔測序儀—PromethION。PromethION有48個(gè)flow cell,可以單獨(dú)運(yùn)行也可以并行。每個(gè)flow cell包括3,000個(gè)通道(channel),每天產(chǎn)生6Tb測序數(shù)據(jù)。
2. 測序read準(zhǔn)確性
目前MinION測序儀的測序準(zhǔn)確率在92%左右。對(duì)于類似致病菌和可變剪切的發(fā)掘,這樣的測序準(zhǔn)確率可以滿足需求。但是對(duì)于臨床檢測,通常read準(zhǔn)確率需要達(dá)到99.99%。因此,文章提到ONT公司需要在測序相關(guān)的化學(xué)反應(yīng)和堿基識(shí)別軟件方面進(jìn)行優(yōu)化。另外,文章提到MinION測序方法存在非隨機(jī)的測序錯(cuò)誤。比如MinION不能很好處理長于6個(gè)核苷酸的同聚物的測序,同時(shí)缺少堿基修飾檢測的內(nèi)參訓(xùn)練。如果這兩個(gè)問題能夠得到解決,共有序列(consensus)測序的準(zhǔn)確率可以達(dá)到大于99.99%。
3. 測序read長度
目前MinION測序長度達(dá)到150kb。在未來一段時(shí)間,可以期許其測序長度可以得到更大提升。
4. RNA直接測序
逆轉(zhuǎn)錄和PCR擴(kuò)增會(huì)導(dǎo)致很多RNA自身信息的丟失,所以目前ONT公司和一些研究機(jī)構(gòu)正在嘗試用納米孔技術(shù)進(jìn)行RNA直接測序。之前的研究已經(jīng)為此奠定了基礎(chǔ),比如研究表明可以對(duì)tRNA進(jìn)行單通道和固態(tài)納米孔(solid-state nanopore)檢測,且納米孔可以檢測DNA和tRNA的堿基修飾。
5. 單分子蛋白測序
目前,質(zhì)譜(mass spectrometry)是做蛋白組分析較好的技術(shù),但是對(duì)于靈敏性,準(zhǔn)確性和分辨率,目前的技術(shù)都存在局限性。2013年一項(xiàng)研究報(bào)道了酶介導(dǎo)的蛋白通過單通道納米孔。這項(xiàng)研究表明蛋白的序列特征可以被檢測。這些發(fā)現(xiàn)為蛋白質(zhì)納米孔測序奠定了很好的基礎(chǔ)。
參考文獻(xiàn):The Oxford Nanopore MinION: delivery of nanopore sequencing to the genomics community
來源:生信人
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。