DNA甲基化作為一種重要的表觀遺傳修飾,在生長發(fā)育、基因調(diào)控、染色質(zhì)結(jié)構(gòu)、分子印記以及許多疾病中起著至關(guān)重要的作用。目前針對于DNA甲基化數(shù)據(jù)的研究主要體現(xiàn)在基因組的局部區(qū)域上,而針對全基因組的分析則無法直觀表現(xiàn)……那么為了能夠更加直觀的分析出同一位點不同修飾信號的DNA甲基化數(shù)據(jù)間的差別該腫么辦呢?
哈哈哈,不用急,今天來給大家介紹一種本人曾在科研中挖掘出的一個罕見軟件WashU Epigenome Browser,想必看過的小伙伴們會有新的收獲哦,也期待能助你們一臂之力!
1.什么是DNA甲基化呢?
DNA甲基化是指在DNA甲基轉(zhuǎn)移酶(DNMTs)的催化作用下,以S-腺苷甲硫氨酸(SAM)為甲基供體將甲基轉(zhuǎn)移至DNA堿基上的一種表觀遺傳修飾方式。在人的體細胞中,DNA甲基化一般發(fā)生于CpG雙核苷酸部位。正常細胞CpG島通常處于非甲基化或低甲基化狀態(tài),如果發(fā)生高甲基化則會抑制基因的表達。雖然它不改變核苷酸序列,但是卻能調(diào)控基因的轉(zhuǎn)錄。
其中約有60%的人類基因啟動子上含有GpG島,并且在TSS位置上游形成NDRs。TSS附近的核小體通常有與轉(zhuǎn)錄活性有關(guān)的H3K4me3標記,而組蛋白的變體H2AZ與DNA甲基化酶(DNMTs)相對抗。在TSS下游的DNA通常不含CpG島,甲基化優(yōu)先發(fā)生在重復(fù)序列和基因本體上,轉(zhuǎn)錄延伸因子不同于轉(zhuǎn)錄起始因子,不會因為DNA甲基化而受阻。
染色質(zhì)上CpG位點的甲基化分子機制
2.WashU Epigenome Browser的基本使用方法
WashU EpigenomeBrowser是由圣路易斯華盛頓大學(xué)醫(yī)學(xué)院的王艇教授小組(http://wang.wustl.edu/)創(chuàng)建維護。相比于其他的表觀基因組瀏覽器,WashUEpiGenome Browser在瀏覽表觀遺傳修飾數(shù)據(jù)中表現(xiàn)的更加專業(yè);同時可以加載ENCDOE、RoadMap和用戶自定義文件,實現(xiàn)數(shù)據(jù)的快速瀏覽比對。
WashU的主頁鏈接:http://epgg-test.wustl.edu/。打開后如圖1所示,1-1鏈接到WashUEpiGenomeBrowser(以下用WashU表示),1-2鏈接到RoadMapEpiGenome Browser。這里我們先只看WashU的用法,點擊1-1進入。
圖1
WashU進入后會首先讓用戶選擇參考基因組(如圖2),這里我們選擇2-1中的Humanhg19,這個參考基因組下的數(shù)據(jù)量是最大的。當然,做其他物種的也有相應(yīng)的參考基因組數(shù)據(jù),比如小鼠、斑馬魚,水稻等,可以在2-2中選擇相應(yīng)的分組。
圖2
進入后,系統(tǒng)提示hg19基因組已經(jīng)加載(如圖3.A),并提示接下來應(yīng)該加載哪種track(其原始含義表示軌道,CD誕生后一首歌曲數(shù)據(jù)會存在一個音軌中,因此track也就表示一串儲存好的信號文件)。如圖所示,有三種方式,a、“Customtracks”按鈕可以加載用戶自己的文件,比如ChIP-Seq(結(jié)合位點分析法,又稱染色質(zhì)免疫共沉淀技術(shù),用來研究體內(nèi)蛋白質(zhì)與DNA的相互作用)的bed文件或者bigwig文件;b、“PUBLIChubs”可以加載GEO中的公共數(shù)據(jù);c、“GENOMEbroeser”可以瀏覽整個基因組。在圖3.A的界面上我們單擊PUBLIChubs按鈕來查看所有公開數(shù)據(jù)集中的表觀基因組瀏覽器。在WashU中每個數(shù)據(jù)信號會按照圖3.B的形式通過數(shù)據(jù)波峰展示,因此加載一個ChIP-Seq文件也叫作加載一個track。隨后如圖3.C所示,點擊C-1參考路線圖表觀基因組學(xué)數(shù)據(jù)集中的人類表觀基因組數(shù)據(jù)按鈕。這里我們使用Roadmap中的表觀修飾數(shù)據(jù),點擊圖3.D-1中的“Load”按鈕,完成數(shù)據(jù)加載。
圖3
加載后系統(tǒng)顯示圖4界面,即為WashU EpiGenome Browser。該區(qū)域包含了與參考基因和染色體表意文字一起排列到基因組的數(shù)據(jù)軌跡。用戶可以添加其他的公共軌道,注釋跟蹤,以及自定義軌道。當前,系統(tǒng)默認加載模式細胞系IMR90(人胚肺成纖維細胞)的數(shù)據(jù)。4-1表示的是當前的顯示位置,點擊藍色方框可以輸入染色體位置、基因名或SNP位點來跳轉(zhuǎn)到特定位置。同時可以使用放大,縮小和滾動按鈕在基因組中進行探索。4-2是當前染色體的位置,可以用鼠標在此處拖拽選取查看特定區(qū)域。4-3是相關(guān)的組蛋白修飾tracks,從上往下依次是input數(shù)據(jù)、H3K4me3修飾信號(兩次重復(fù))、H3K4me1修飾信號(兩次重復(fù))、H3K9me3修飾信號(兩次重復(fù))、H3K27me3修飾信號(兩次重復(fù))。在4-3所示的每個track中點擊右鍵,可以設(shè)置顯示方式(如圖5所示)。圖5-3中反復(fù)點擊+號可以增加數(shù)據(jù)波峰的高度,但并不會改變y軸刻度。4-4中顯示了染色體狀態(tài)與順式調(diào)控元件,不同的顏色代表不同的信息(也可以自定義顏色),將鼠標移上去即可顯示:如深灰色代表被PolyComb抑制表達區(qū)域,明黃色代表enhancer,紅色代表活化的TSS(轉(zhuǎn)錄起始位點),綠色代表轉(zhuǎn)錄本。4-5中顯示的是IMR90的methylC-Seq(是一種檢測5-甲基胞嘧啶修飾位點的全基因組方法)的數(shù)據(jù)波峰。展示了甲基化測序數(shù)據(jù),背景中灰色代表該區(qū)域CpG的豐度,藍色代表甲基化CpG豐度。4-6中主要說明了基因組上一些重復(fù)序列情況,如短散在元件(SINE)、長散在元件(LINE)、Alu序列等,這些重復(fù)序列具有調(diào)控基因表達的功能。4-7中顯示的是轉(zhuǎn)錄本情況,箭頭代表了轉(zhuǎn)錄方向。
圖4
圖5
下面介紹一下軌道重排問題,則需按照元數(shù)據(jù)進行重新排序。要根據(jù)測定類型重新排序,需要單擊熱圖上方的分析項(如圖6)?;蛘?,也可以單擊軌道名稱并將該軌道移動到新位置。
圖6
基本操作就是這樣,你學(xué)會了嗎?下一期我們將繼續(xù)介紹表觀基因組瀏覽器上數(shù)據(jù)集的添加方法還有親自示范哦,歡迎感興趣的小伙伴多多學(xué)習!
聯(lián)系客服