解螺旋公眾號(hào)·陪伴你科研的第2533天
在pubmed搜索ceRNA,發(fā)現(xiàn)很多實(shí)驗(yàn)類的文章,做了很多內(nèi)容,但是只發(fā)了2-3分,所以今天想和大家一起學(xué)習(xí)2021年1月發(fā)表于Molecular Therapy Nucleic Acid的ceRNA的腫瘤生信文章,看看這篇純生信的文章是如何做到7+的水平的。
文章題目
Comprehensive analysis to identify DLEU2L/TAOK1 axis as a prognostic biomarker in hepatocellular carcinoma
期刊簡(jiǎn)介
題目:Comprehensive analysis to identify DLEU2L/TAOK1 axis as a prognostic biomarker in hepatocellular carcinoma疾病:肝細(xì)胞肝癌(hepatocellular carcinoma,HCC)數(shù)據(jù)來(lái)源:TCGA-LIHC分析策略:差異表達(dá) + 功能聚類 + 臨床意義 + 交互網(wǎng)絡(luò) + 甲基化分析 + 免疫分析(https://www.xiantao.love/products)◆ Metascape數(shù)據(jù)庫(kù) (https://www.proteinatlas.org/)◆ cBioPortal數(shù)據(jù)庫(kù) (http://www.cbioportal.org/)◆ LNCipedia數(shù)據(jù)庫(kù)(http://www.csbio.sjtu.edu.cn/bioinf/lncLocator/)◆ TarBase數(shù)據(jù)庫(kù)(http://microrna.gr/tarbase/)◆ TargetScan數(shù)據(jù)庫(kù)(http://www.targetscan.org/vert_71/)(http://ualcan.path.uab.edu/)◆ DiseaseMeth version 2.0數(shù)據(jù)庫(kù) (http://bio-bigdata.hrbmu.edu.cn/diseasemeth/)◆ MEXPRESS數(shù)據(jù)庫(kù)(https://cistrome.shinyapps.io/timer/)總體來(lái)看,作者先從TCGA數(shù)據(jù)庫(kù)中挑出HCC(肝細(xì)胞肝癌)的樣本,并對(duì)腫瘤vs正常以及PTEN高低表達(dá)進(jìn)行差異分析,篩選出差異表達(dá)的lncRNA、miRNA、mRNA(圖2和圖3),構(gòu)建ceRNA調(diào)控網(wǎng)絡(luò)(圖4),并對(duì)此ceRNA調(diào)控網(wǎng)絡(luò)進(jìn)行富集分析(圖4)、生存分析(圖6)、亞細(xì)胞定位分析(圖7)、分子相關(guān)性分析(圖7)、甲基化分析(圖8)、免疫分析(圖9)等,涉及到差異表達(dá)(挑),功能聚類(圈),交互網(wǎng)絡(luò)(聯(lián)),臨床意義(靠)的各個(gè)方面,內(nèi)容豐富飽滿,非常值得學(xué)習(xí)借鑒。詳細(xì)解讀如下 ▼本文一共9個(gè)主圖,6個(gè)附表,7個(gè)附圖,很多附圖表和主圖的繪制方法類似,就不再重復(fù),這里只復(fù)現(xiàn)了主圖和有代表性的附圖表,現(xiàn)在就開(kāi)始吧。流程圖用PPT、思維導(dǎo)圖軟件、photoshop等都能實(shí)現(xiàn),這里不再贅述。圖2、PTEN在人類肝細(xì)胞癌(HCC)中的抑癌作用▼進(jìn)入HPA數(shù)據(jù)庫(kù):https://www.proteinatlas.org/往下拉,就能看見(jiàn)【RNA EXPRESSION OVERVIEW】,截圖保存即可。▼(注:作者這里犯了個(gè)小錯(cuò)誤,此圖是正常組織的PTEN表達(dá)情況,而被作者標(biāo)注成了pan-cancer了。)點(diǎn)擊頁(yè)面上方的【PATHOLOGY】▼(注:作者這里也標(biāo)注錯(cuò)了,附圖1應(yīng)該是PTEN在泛癌中的表達(dá))
仙桃學(xué)術(shù)的生信工具不僅能一鍵完成此圖,還有非配對(duì)樣本和配對(duì)樣本的對(duì)比,一起來(lái)看看吧~進(jìn)入仙桃學(xué)術(shù)生信工具:https://www.xiantao.love/products(注:免費(fèi)版和基礎(chǔ)版都可以進(jìn)行統(tǒng)計(jì)和可視化,由于高級(jí)版功能最全,這里選擇高級(jí)版作為范例)【分析工具】 → 【表達(dá)差異(挑)】 → 【非配對(duì)樣本】 → 【泛癌】 → 輸入分子【PTEN】 → 調(diào)整圖片顏色和大小 → 【確認(rèn)】▼這里就可以看到PTEN在33種腫瘤的非配對(duì)樣本中的表達(dá)情況了。此時(shí)即“保存結(jié)果”到云端的歷史記錄,也可用其他格式保存到電腦中。▼(小貼士:建議后續(xù)需要拼圖的圖片均選擇“保存結(jié)果”,這樣可將保存的結(jié)果直接在“拼圖工具”中進(jìn)行拼圖,省去了后面上傳圖片的步驟,咱們能偷懶就盡量偷懶,把時(shí)間花在更必要的地方,對(duì)吧~)【配對(duì)樣本】 → 調(diào)整圖片顏色和大小 → 【確認(rèn)】▼(小貼士:現(xiàn)在仙桃學(xué)術(shù)的記憶力變好的喲,上次搜索的內(nèi)容,比如【泛癌】、【PTEN】都記在仙桃的小腦袋瓜里,下次檢索的時(shí)候,只需要再看看是不是自己需要的疾病和分子,更換分析方法就好啦~ 懶癌星人的福音哈哈~)圖2B HPA數(shù)據(jù)庫(kù)中PTEN的免疫組化圖 ▼依然在HPA數(shù)據(jù)庫(kù)中,選擇【TISSUE】▼挑一個(gè)和文章中類似的圖片,點(diǎn)擊 ▼覺(jué)得合適,鼠標(biāo)右鍵,【圖片另存為】▼換個(gè)圖片,繼續(xù)【圖片另存為】,完成后可點(diǎn)擊左上角的x把圖片關(guān)閉。▼腫瘤樣本用類似的方法,【PATHOLOGY】 → 【CANCER】→ 【LIVER CANCER】▼同樣選擇圖片,點(diǎn)擊進(jìn)入后【圖片另存為】即可▼圖2C PTEN高低表達(dá)的Kaplan-Meier生存曲線▼仍然可在仙桃學(xué)術(shù)生信工具(https://www.xiantao.love/products)中完成。【臨床意義(靠)】 → 調(diào)整預(yù)后參數(shù) → 【確認(rèn)】 → 【保存結(jié)果】或【下載圖片】▼圖2D cBioPortal的OncoPrint圖顯示TCGA-HCC中PTEN基因組改變的分布 ▼進(jìn)入cBioPortal主頁(yè)(http://www.cbioportal.org/)選擇【Liver】 → 找到【Liver Hepatocellular Carcinoma】 → 點(diǎn)擊【Query By Gene】▼(小貼士:這里有很多【Liver Hepatocellular Carcinoma】,可以根據(jù)需要選擇一個(gè)或多個(gè)研究數(shù)據(jù),這里根據(jù)原文選擇了TCGA數(shù)據(jù),一般來(lái)說(shuō),選擇CNS級(jí)的數(shù)據(jù)更可靠哦?)選擇【Mutations】和【Putative copy-number alterations from GISTIC】 → 輸入目的基因【PTEN】 → 【Submit Query】▼出現(xiàn)的圖片【Download】就可以了 ▼圖2E cBioPortal中PTEN拷貝數(shù)與mRNA表達(dá)之間的關(guān)聯(lián) ▼接著上一步,【Plots】 → 【Download】▼圖2F cBioPortal中PTEN拷貝數(shù)與mRNA表達(dá)之間的相關(guān)圖▼接著上一步,選擇【Log2 copy-number values】→ 取消【Mutation Type】和【Copy Number】前的選擇 → 在【Show Regression Line】前打勾 → 【Download】▼圖1的所有圖片都搞定了,現(xiàn)在可以來(lái)拼圖了。還是在仙桃學(xué)術(shù)的生信工具(https://www.xiantao.love/products)點(diǎn)擊【基礎(chǔ)繪圖】 → 點(diǎn)擊【上傳圖片】 → 選擇圖片并上傳 → 【確認(rèn)】 →【保存結(jié)果】至云端。除了在仙桃中完成并保存的圖片,其他圖片都逐一上傳。▼將所有圖片都上傳并保存至云端以后,打開(kāi)【拼圖工具】 → 拖拽圖片至空白處 → 調(diào)整圖片大小和位置 → 調(diào)整【ABC標(biāo)注】格式。▼這就是完成拼圖的結(jié)果了,全部自動(dòng)標(biāo)注好了ABCD呢?▼圖3 HCC樣本中PTEN高低表達(dá)之間的差異lncRNA、DEmiRNA、DEmRNA的火山圖和熱圖▼在仙桃學(xué)術(shù)中【生信工具】 → 【分析工具】 → 【表達(dá)差異(挑)】 → 【單基因差異分析】 → 選擇【肝細(xì)胞肝癌】 → 分子輸入【PTEN】 → 【確認(rèn)】 ▼(小貼士:此分析所需時(shí)間略長(zhǎng),請(qǐng)耐心等待喲? 待會(huì)兒你就會(huì)發(fā)現(xiàn),等待非常值得?)在【歷史記錄】中可以看到分析的狀態(tài)仍然是【執(zhí)行中】▼待狀態(tài)變?yōu)椤就瓿伞繒r(shí),即可下載結(jié)果了。這里我們需要【Excel表格下載】和【差異lncRNA】▼【表達(dá)差異(挑)】 → 【火山圖】 → 上傳剛剛下載的【差異lncRNA】 → 選擇【基本參數(shù)】(文章中用的是logFC >0.5, P<0.05) → 輸入標(biāo)題【lncRNA】→ 【確認(rèn)】 → 【保存結(jié)果】或下載圖片▼(小貼士:其實(shí)火山圖的示例數(shù)據(jù)中只有【gene_name】、【logFC】、【adjP】,不小心發(fā)現(xiàn)其實(shí)可以將上一步下載的結(jié)果直接上傳,不用麻煩的整理數(shù)據(jù),就迫不及待的把這個(gè)偷懶的小招妙告訴你萌啦~)這里就需要打開(kāi)上一步下載的Excel表格了。點(diǎn)擊【gene_biotype】旁邊的小三角 → 選擇【miRNA】 → 【確定】▼這樣就將所有的miRNA篩選出來(lái)了,將所有篩選出的數(shù)據(jù)復(fù)制粘貼到一個(gè)新的Excel文件,取名“miRNA”,保存。▼用同樣的方法篩選【gene_biotype】為【protein_coding】的行,保存為“mRNA”文件。▼按照l(shuí)ncRNA的方法,分別上傳文件,就能得到相應(yīng)的火山圖了。(小貼士:其實(shí)用篩選miRNA和mRNA的方法來(lái)篩選lncRNA,得到的結(jié)果和直接下載的結(jié)果是一模一樣的,大家有興趣可以嘗試一下~)圖3D-E 15個(gè)差異最大的lncRNA、miRNA、mRNA的熱圖 ▼打開(kāi)保存好的差異miRNA的Excel文件,新建一列【abslogFC】 → 下一行寫公式【=abs()】 → 用鼠標(biāo)點(diǎn)一下【log2FoldChange】下的第一個(gè)數(shù)字 → 按回車鍵 ▼把鼠標(biāo)放在這個(gè)數(shù)字的右下方的綠點(diǎn)處,等鼠標(biāo)從╬變成+,雙擊鼠標(biāo) ▼【abslogFC】這一列就自動(dòng)算出所有【log2FoldChange】的絕對(duì)值了▼【篩選】 → 【pvalue】旁邊的小三角 → 【數(shù)字篩選】 → 【小于】 ▼(小貼士:一般選擇【padj】,就是校正后的p值,但因此數(shù)據(jù)【padj】缺失值較多,所以選擇了【pvalue】,所以具體情況要具體分析哦~)選中【abslogFC】列 → 【篩選】 → 【降序】 ▼【擴(kuò)展選定區(qū)域】 → 【排序】 ▼這樣,就選出了P<0.05的行,并且按照l(shuí)ogFC的絕對(duì)值從大到小進(jìn)行了排列?,F(xiàn)在只用選中前15個(gè)基因名,復(fù)制就好了▼進(jìn)入仙桃學(xué)術(shù)生信分析工具 【交互網(wǎng)絡(luò)(聯(lián))】 → 【單基因共表達(dá)】 → 選擇【肝細(xì)胞肝癌】 → 輸入目的分子【PTEN】 → 【標(biāo)題文本】中輸入【miRNA】 → 將上一步篩選出的相關(guān)基因粘貼至【分子列表】 → 【確認(rèn)】 → 【保存結(jié)果】或【下載結(jié)果】▼(小貼士:如果直接從TCGA數(shù)據(jù)庫(kù)下載數(shù)據(jù)畫熱圖,需要經(jīng)過(guò)數(shù)據(jù)下載、合并、清洗、基因名稱轉(zhuǎn)換、尋找相關(guān)基因、排序、數(shù)據(jù)整理、繪制熱圖等復(fù)雜的步驟和程序,而在仙桃學(xué)術(shù)不僅能輕松搞定,還能獲取更加豐富的信息哦~)用同樣的方法畫出其他圖片,并拼圖,即可得到以下結(jié)果▼圖4 lnRNA-miRNA-mRNA調(diào)控網(wǎng)絡(luò)的構(gòu)建和功能富集分析▼此圖主要是在Metascape數(shù)據(jù)庫(kù)(http://metascape.org/)中完成的。(小貼士:雖然仙桃學(xué)術(shù)也能做相應(yīng)分析,但是目前只能分析700個(gè)基因,對(duì)于此次分析有點(diǎn)容量不足。仙桃學(xué)術(shù)的技術(shù)小哥哥無(wú)所不能,所以大家有什么需求,直接在本文下方或者公眾號(hào)里許愿,大家的呼聲高了,愿望就能早點(diǎn)實(shí)現(xiàn)啦~ 順便也給技術(shù)小哥哥一點(diǎn)壓力,哈哈哈哈~)將所有的差異lncRNA+miRNA+mRNA名字都粘貼到【list】 → 【Submit】 → 選擇【H.sapiens】(代表人類) → 【Expression Analysis】 → 等待一段時(shí)間,直到下方100分 →點(diǎn)擊【Analysis Report Page】▼(小貼士:這里可以上傳文件的,也許是網(wǎng)速原因,多次嘗試上傳文件都沒(méi)有成功,所以最終選擇上傳list,網(wǎng)速好的小伙伴們也可以試試直接上傳文件哦~)立刻就出現(xiàn)圖4C了,點(diǎn)擊【PDF】保存 ▼圖5 TCGA-HCC數(shù)據(jù)集中ceRNA調(diào)控網(wǎng)絡(luò)的13種Hub-RNA表達(dá)模式的分布▼【表達(dá)差異(挑)】 → 【非配對(duì)樣本】 → 【TCGA-LIHC】 → 【點(diǎn)圖】 → 輸入目的分子,如【DLEU2L】 → 【統(tǒng)計(jì)分析】選擇【p=科學(xué)計(jì)數(shù)】 → 【確認(rèn)】 → 【保存結(jié)果】或下載 ▼每個(gè)小圖的做法都類似,只需更改目的分子的名字就好了。圖6 ceRNA調(diào)控網(wǎng)絡(luò)中的生存率分析▼每個(gè)小圖的做法也都類似,只需更改目的分子的名字就好了。【分析工具】 → 【臨床意義(靠)】 → 【KM曲線圖】 → 【TCGA-LIHC】 → 輸入目的分子,如【DLEU2L】 → 【確認(rèn)】 → 【保存結(jié)果】或下載 ▼圖7 ceRNA網(wǎng)絡(luò)的構(gòu)建和相關(guān)性分析▼圖7A 三種lncRNA(DLEU2L,F(xiàn)AM99A和ARRDC1-AS1)的細(xì)胞定位▼進(jìn)入LNCipedia(https://lncipedia.org/)主頁(yè) → 輸入目的分子,如【DLEU2L】 → 搜索 ▼接下來(lái)就可以查詢lncRNA的細(xì)胞定位了。進(jìn)入lncLocator(http://www.csbio.sjtu.edu.cn/bioinf/lncLocator/),將剛剛復(fù)制的序列粘貼進(jìn)來(lái) → 【submit】 ▼頁(yè)面最下方即可得到lncRNA在細(xì)胞中的分布比例 ▼將數(shù)據(jù)粘貼進(jìn)Excel表格,插入圖表即可。▼圖7C 用TarBase預(yù)測(cè)DLEU2L與miR-99a-5p和miR-100-5p的靶位點(diǎn)之間的堿基配對(duì),用TargetScan預(yù)測(cè)TAOK1 3'UTR與miR-99a-5p和miR-100-5p的靶位點(diǎn)之間的堿基配對(duì)▼TarBase數(shù)據(jù)庫(kù)(http://microrna.gr/tarbase/) → 輸入目的分子,如【DLEU2L】 → 選擇【Homo sapiens】 → 【Apply】即可得到與DLEU2L結(jié)合的miRNA分子▼TargetScan數(shù)據(jù)庫(kù)(http://www.targetscan.org/vert_71/)選擇【Human】 → 輸入目的分子,如【TAOK1】 → 【Submit】▼點(diǎn)擊【miR-99-5p/100-5p】▼找到【Human】 → 下方即為【TAOK1】與miRNA的結(jié)合位點(diǎn)▼圖7D 肝癌中四個(gè)預(yù)測(cè)性RNA之間及其與PTEN的相關(guān)性分析▼回到仙桃學(xué)術(shù)生信工具(https://www.xiantao.love/products) → 【交互網(wǎng)絡(luò)(聯(lián))】 → 【散點(diǎn)圖】 → 選擇【肝細(xì)胞肝癌】 → 基因A輸入【PTEN】 → 基因B輸入【DLEU2L】 → 【確認(rèn)】 → 【保存結(jié)果】▼好吧,圖8A還沒(méi)有找到在線的工具可以完成,只能用R語(yǔ)言了,希望仙桃學(xué)術(shù)的技術(shù)小哥哥能早點(diǎn)搞定~圖8B 使用UALCAN評(píng)估TAOK1甲基化▼進(jìn)入U(xiǎn)ALCAN數(shù)據(jù)庫(kù)(http://ualcan.path.uab.edu/) → 【TCGA analysis】▼輸入【TAOK1】 → 選擇【Liver hepatocellular carcinoma】 → 【Explore】▼圖8C 使用DiseaseMeth 2.0版評(píng)估甲基化▼DiseaseMeth version 2.0 (http://bio-bigdata.hrbmu.edu.cn/diseasemeth/) → 【Analyze】▼選擇【Liver hepatocellular carcinoma[LIHC]】 → 輸入【TAOK1】 → 選擇【Array-based technology】 → 【Analysis】▼選擇【NM-025142】 → 【Analysis】▼選擇【chr17:277_5942-27718446】 → 【Analysis】▼圖8D MEXPRESS數(shù)據(jù)庫(kù)中顯示TAOK1的DNA序列與基因表達(dá)的甲基化位點(diǎn)▼MEXPRESS數(shù)據(jù)庫(kù)(https://mexpress.be) → 輸入【TAOK1】 → 選擇【LIHC】 → 【PLOT】 → 出現(xiàn)圖片后【Download】即可 ▼圖9 肝癌組織中TAOK1表達(dá)與免疫浸潤(rùn)的相關(guān)性分析▼圖9A HCC中TAOK1基因拷貝數(shù)與免疫細(xì)胞浸潤(rùn)水平之間的關(guān)聯(lián)▼TIMER數(shù)據(jù)庫(kù)(https://cistrome.shinyapps.io/timer/) → 【SCNA】 → 選擇【LIHC】 → 輸入【TAOK1】 → 【Submit】 → 出現(xiàn)圖片后下載即可 ▼圖9B TAOK1表達(dá)與HCC免疫浸潤(rùn)水平的相關(guān)性▼TIMER數(shù)據(jù)庫(kù) → 【Gene】 → 輸入【TAOK1】 → 選擇【LIHC】 → 【Submit】 → 出現(xiàn)圖片后下載即可 ▼TIMER數(shù)據(jù)庫(kù) → 【Survival】 → 選擇【LIHC】 → 輸入【TAOK1】 → 【Plot KM Curve】 → 出現(xiàn)圖片后下載即可 ▼探索基因間相互作用和功能,除了string還有更友好的它!絕了!9+純生信文章,我用15分鐘零代碼教你復(fù)現(xiàn)!老底兒都沒(méi)了(附詳細(xì)操作教程)
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。