九色国产,午夜在线视频,新黄色网址,九九色综合,天天做夜夜做久久做狠狠,天天躁夜夜躁狠狠躁2021a,久久不卡一区二区三区

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
單倍型序列 | 基于重測序數(shù)據(jù)快速獲得目的區(qū)間多個單倍型

開展農(nóng)學(xué)方面研究,我們常常手上會有許多材料。對于做基因功能研究的朋友,最關(guān)心的并不是基因組如何如何,或者其他數(shù)據(jù)大小多大多大,演化路徑如何如何;相反,大家最關(guān)心的是,我關(guān)注的這個基因到底序列是什么?尤其關(guān)注的材料時常為高雜合(2個n的序列有很大不同),或者多倍體。于是一個很現(xiàn)實(shí)的問題就是,我們關(guān)注的基因調(diào)控功能是,可能存在劑量效應(yīng)。比如AA是高抗,Aa是弱抗,aa是病。那么A的序列是什么,a的序列又是什么。這是一個有趣的問題。
盡管我們時常提到可能是一個SNP引起了一個功能變化,但或許是一個indel,更或許應(yīng)該是跟這個SNP緊密連鎖的一系列SNP引起。確定一段序列,往往會比確定一個SNP,在實(shí)驗(yàn)起始課題設(shè)計(jì)階段更為關(guān)鍵和實(shí)用。當(dāng)然,對于后續(xù)數(shù)據(jù)分析,亦是如此。
于是,我們需要這個功能。目前可用軟件有一些,不過「真正能讓幾乎所有人都能簡單用上的軟件」幾乎沒有。需要有這個功能,所以我做了這個功能。同樣,通過 TBtools 插件模式實(shí)現(xiàn),大伙可按需安裝。整體覆蓋三個插件(邏輯上對于不少人直接可以進(jìn)行第三步,因?yàn)榍皟刹焦究赡芙o你做完了):

  1. 序列比對到參考基因組

  2. 變異檢測(如有可跳過)

  3. 局部單倍型序列提取

文件說明

整體上,我們需要的是兩個數(shù)據(jù):

  1. 參考基因組序列(一般是某個物種的某個參考基因組,往往是一個嵌合單倍型材料)

  2. 目標(biāo)材料的重測序數(shù)據(jù)(最好是每個單倍型測序深度>10X,如一個單倍型大小為100Mb,如果是二倍體則需要測2G數(shù)據(jù);如果是三倍體則需要測3G數(shù)據(jù);如果是6倍體則需要測6G數(shù)據(jù))。

序列比對到參考基因組

操作簡單,直接使用前述推出的 BWA-MEM2 GUI Wraper 即可。按照界面提示,

  1. 設(shè)置參考基因組序列

  2. 設(shè)置重測序數(shù)據(jù)

  3. 設(shè)置線程數(shù)

  4. 設(shè)置輸出文件夾路徑

等待即可,邏輯上速度很快(然而還是跑了3個小時,畢竟只用了臺式機(jī)的 4 個線程,其實(shí)很快了,如果主頻OK,跑到12個線程,那就只需要大概1個小時...)。
運(yùn)行結(jié)束會出現(xiàn)一個 .bam 文件

變異檢測(如有可以跳過)

要獲取一個區(qū)間的兩個單倍型,主要原理是通過單倍型內(nèi)部緊密連鎖的SNP/Indel來區(qū)分,所以我們需要獲得高質(zhì)量的可行的變異結(jié)果。如果已有VCF,可以跳過這一步。
如無,首先是對 reads 進(jìn)行排序,使用 SAMTOOLS GUI Wrapper 插件即可。

隨后是標(biāo)記重復(fù),同樣使用 SAMTOOLS GUI Wrapper 插件即可。

邏輯上,只有比對是比較耗時的,剩下的都是幾分鐘完事。
重復(fù)標(biāo)記(或含去除)結(jié)束,即可開始 call SNP。

邏輯上,這一步速度也不是非常快,因?yàn)?freebayes 是單線程運(yùn)行。從某個角度來說,我們可以后續(xù)優(yōu)化,只call 目標(biāo)區(qū)間的 SNP,這樣就省時省事(事實(shí)上,我也不是為了寫這些插件來折騰這些功能,TBtools絕大多數(shù)功能,只是副產(chǎn)品或者中間結(jié)果....盡管這并不影響這個功能真的有用)。

局部單倍型序列提取

一切準(zhǔn)備就緒,假定我們有個目標(biāo)區(qū)間

準(zhǔn)備區(qū)間信息列表

隨后開始

PS: 發(fā)現(xiàn)使用 ploidy 2 沒有輸出結(jié)果,認(rèn)為是測序深度不夠。直接按照ranbow開發(fā)目標(biāo),為 6 倍體,設(shè)置為 6 效果不錯。

提取其中某個區(qū)域的兩個單倍型序列,BLAT到基因組上,另外也對兩個序列進(jìn)行雙序列比對。

整體感覺效果佳?。?!Indels 和 SNP 的連鎖信息似乎都正常被串聯(lián)起來了,感覺效果不錯。

寫在最后

Emmm.... 怎么說這個功能?感覺還行。實(shí)際上,這個功能我一直想做,就是沒有合適的工具。同時,也在早前上研究生課的時候,有個學(xué)生問,比如他有幾百份材料的重測序,想要針對某個區(qū)間獲得單倍型序列....其實(shí)這事不是不能干,就是不好干。當(dāng)然現(xiàn)在可以干了。
回到主題,我最關(guān)注的,還是如何讓幾乎所有有需求的都能自己搞定一些數(shù)據(jù)分析工作,于是很多軟件功能流,想在windows、macos下都支持,其實(shí)比較麻煩,尤其是windows下。五一假期,花在這上面還是有一些時間。
回到工作單位,想想這個事情還是要有個中結(jié)果,看看效果。我目前大體感覺是這樣,整體效果沒有達(dá)到我的預(yù)期,因?yàn)槲移谕氖钦麄€區(qū)間直接能組裝成2個單倍型序列,但目前沒有。邏輯上,這個跟測序深度有關(guān)系。另外,可能調(diào)用的這個軟件的實(shí)際功能可能還不夠完善(比如ploidy 6 可以出 ploidy 2 的結(jié)果,為什么ploidy 2 則不行?與好友馮董聊了下,其提到了我另一個好基友kang弟弟老板的工作,或許我更應(yīng)該去嘗試個工作?具體不太清楚為何沒有做這個事情,是一些考慮?還是測序深度要求高?其他,我想我肯定會試試,只是不是最近。
無論如何,我覺得目前這個功能不錯,有需要的朋友可以玩玩。

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
賽?;蚬_課第五節(jié)《全外顯子組數(shù)據(jù)分析簡介》
測序技術(shù)及測序報(bào)告中的SNP用途
一文囊括全基因組測序各步驟工具,值得收藏
文獻(xiàn)解讀 | 最大參考序列集(reference panel)助力基因型推斷
SNV和INDEL僅僅是比較數(shù)量嗎?(學(xué)徒作業(yè))
UCSC Genome Browser-基因組瀏覽器
更多類似文章 >>
生活服務(wù)
熱點(diǎn)新聞
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服