九色国产,午夜在线视频,新黄色网址,九九色综合,天天做夜夜做久久做狠狠,天天躁夜夜躁狠狠躁2021a,久久不卡一区二区三区

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
R數(shù)據(jù)分析:孟德爾隨機(jī)化分析文獻(xiàn)解析和實(shí)例操練
文章的題目是A bidirectional Mendelian randomization study supports causal effects of kidney function on blood pressure,這篇文章用到的統(tǒng)計(jì)技巧叫做Two-sample MR----兩樣本孟德爾隨機(jī)分析。我還查閱了別的孟德爾隨機(jī)化的文獻(xiàn),這個(gè)Two-sample MR的分析其實(shí)是非常常用的。

Two-sample MR分析的一般步驟

第一步是找工具變量,我們要的是基因作為工具變量這些個(gè)基因都是從別人的研究中挑出來的,所有的基因研究有個(gè)專門的庫叫做genome wide association studies (GWAS)。我們需要做的就是從這個(gè)庫中挑出來我們自己需要的和我們暴露相關(guān)的基因變量SNPs。這是第一步。
第二步就是估計(jì)我們的工具變量對(duì)結(jié)局的作用,工具變量對(duì)結(jié)局的作用也是從所有的研究中估計(jì)出來的整體效應(yīng),這樣可以拒絕單個(gè)研究的偏倚。
第三步就是合并多個(gè)SNP的效應(yīng)量,這個(gè)效應(yīng)量是我們得到暴露和結(jié)局因果效應(yīng)的前提。
第四步就是用合并后的數(shù)據(jù)進(jìn)行孟德爾隨機(jī)化分析和相應(yīng)的敏感性分析。
做分析的整個(gè)流程就在下面的圖中啦:

總體來看就是在孟德爾隨機(jī)化研究中我們的工具變量可以不需要你收集,工具變量的效應(yīng)也不需要你計(jì)算,這些都只需要你在GWAS挖掘合并就行。就是說做孟德爾隨機(jī)化研究是不需要你有原始數(shù)據(jù)的。
我們把上面的步驟具體在剛剛提到的文獻(xiàn)中走一遍:
這篇文獻(xiàn)是要研究高血壓和腎功能的因果方向的,就是到底是高血壓導(dǎo)致腎功能下降,還是腎功能下降導(dǎo)致的高血壓,具體地就是研究eGFRcr和BP的因果方向。
首先作者從別人的基因研究中找自己研究變量的工具變量,別人的研究的情況如下表:注意下表是包含一個(gè)聯(lián)盟的很多個(gè)研究的(腎功能的工具變量是從CKDGen Consortium找來的,血壓的工具變量是UKB-ICBP中找來的),是需要進(jìn)行meta整合的:

通過meta分析作者就篩選出了兩個(gè)變量可能的工具變量,因?yàn)槊總€(gè)變量的工具變量其實(shí)是比較多的,為了保證同一個(gè)變量工具變量間的獨(dú)立性,作者有做一個(gè)叫LD clumping的操作:
To ensure independence among genetic instruments, we applied LD clumping60 with a clumping window of 10 MB and an r2 cutoff of 0.001 (default of the ld_clumpfunction)
作者有把篩出來的變量的暴露和結(jié)局的工具變量展示在文獻(xiàn)中(但是放在補(bǔ)充材料中的,我并沒有能找到,欸)
然后就到第二步和第三步,估計(jì)工具變量對(duì)暴露和結(jié)局的作用,這個(gè)時(shí)候要考慮工具變量一定不能直接影響結(jié)局(叫做pleiotropy),所以作者會(huì)用好幾個(gè)算法inverse variance weighted method, mendelian randomisation-Egger (MR-Egger) method, weighted median method, and weighted mode based estimation來估計(jì)SNP的作用,并將多個(gè)SNP的效應(yīng)合并,用到的是harmonise_data這個(gè)函數(shù)。最后得到一個(gè)總的合并后的效應(yīng),這個(gè)效應(yīng)被認(rèn)為是比較穩(wěn)健的:
We applied four complementary methods of two sample mendelian randomisation (inverse variance weighted method, mendelian randomisation-Egger (MR-Egger) method, weighted median method, and weighted mode based estimation), which make different assumptions about horizontal pleiotropy. A consistent effect across the four methods is less likely to be a false positive.
有了合并后的工具變量對(duì)結(jié)局的效應(yīng),最后一步就是mr分析,就是估計(jì)暴露與結(jié)局的直接因果效應(yīng)。
整個(gè)文獻(xiàn)就是這么回事,正文中呈現(xiàn)出來的圖表包括下面兩個(gè),一個(gè)是腎功能對(duì)血壓的作用的森林圖和效應(yīng)的置信區(qū)間和p值,另一個(gè)是血壓對(duì)腎功能的作用的森林圖和效應(yīng)的置信區(qū)間和p值:


根據(jù)森林圖和相應(yīng)的統(tǒng)計(jì)指標(biāo),最終作者得到腎功能是影響血壓的原因,而非相反。整個(gè)文獻(xiàn)就完啦,這個(gè)就是一個(gè)完整的孟德爾隨機(jī)化研究的統(tǒng)計(jì)呈現(xiàn)過程。

Two-sampleMR分析實(shí)操
接下來給大家寫如何做出文獻(xiàn)中的結(jié)果:
Two sample Mendelian randomisation (2SMR) is a method to estimate the causal effect of an exposure on an outcome using only summary statistics from genome wide association studies (GWAS).
具體地,作者使用的R包是'TwoSampleMR’。
使用TwoSampleMR的基本流程包括4步:
  1. 選擇工具變量
  2. 從GWAS數(shù)據(jù)庫提取工具變量
  3. 合并效應(yīng)量
  4. 做MR分析,敏感性分析,畫圖,出報(bào)告
在分析中我們要使用SNPs來作為工具變量:
Mendelian randomization is a method to assess the causal effect of an exposure on an outcome using an instrument, defined by one or more SNPs, as a proxy for the exposure.
這個(gè)工具變量怎么來呢,有人已經(jīng)把所用的可能用到的SNPs總結(jié)好了放在了R包里,我們直接用就行,從GWAS中獲取,我們需要在GWAS中找到暴露相關(guān)的工具變量和結(jié)局相關(guān)的工具變量從而形成兩個(gè)樣本,相應(yīng)的分析跑兩次,所以一般文獻(xiàn)中的分析方法就叫做two-sample Mendelian randomization
Methodological advances mean that Mendelian randomization can be implemented using summary statistics from GWAS, without individual level data. This requires SNP-exposure associations and SNP-outcome associations obtained from separate datasets and is known as two-sample Mendelian randomization
這里又有許多術(shù)語需要給大家做做鋪墊:
  1. 孟德爾隨機(jī)化:Mendelian randomization is a method to assess the causal effect of an exposure on an outcome using an instrument, defined by one or more single nucleotide polymorphisms, as a proxy for exposure.(SNP就是工具變量)
  2. Genome-wide association study (GWAS):Genome-wide association studies identify the genetic variants that are associated with a given phenotype.和暴露(表型)相關(guān)的基因都是從GWAS中找的
  3. Heterogeneity:Heterogeneity is defined as the variation in the causal estimate across SNPs.這個(gè)是不同SNP效應(yīng)的異質(zhì)性,所以多個(gè)SNP的效應(yīng)是需要合并的
  4. 其實(shí)還有好多好多(大家去看文末的文獻(xiàn)呀),感覺寫不完。。。直接上例子   吧

實(shí)例解析
我現(xiàn)在想通過孟德爾隨機(jī)化研究血壓和冠心病的關(guān)系,首先我們得接入孟德爾隨機(jī)基礎(chǔ)庫MR-Base這個(gè)數(shù)據(jù)庫,找到相應(yīng)的結(jié)局(即血壓和冠心病)的相關(guān)基因,代碼如下:
ao <- available_outcomes()
exposure_dat <- extract_instruments(c('ukb-a-360'))
outcome_dat <- extract_outcome_data(exposure_dat$SNP, c('7'),
proxies = 1, rsq = 0.8, align_alleles = 1,
palindromes = 1, maf_threshold = 0.3)
運(yùn)行上面的代碼然后你去查看對(duì)象exposure_dat或者outcome_dat就會(huì)看到相關(guān)基因研究的基本特征,給大家截個(gè)圖吧:

然后計(jì)算基因?qū)Y(jié)局的合并效應(yīng)量,代碼如下:
dat <- harmonise_data(exposure_dat, outcome_dat, action = 2)
最后一步就是進(jìn)行mr分析:
mr_results <- mr(dat)
運(yùn)行所有的代碼后我們就可以得到不同算法模型下我們的結(jié)果如下圖兩圖:

文獻(xiàn)中的結(jié)果

我跑出來的結(jié)果
可以看到上面的圖是文獻(xiàn)中的,底下的圖是我自己復(fù)現(xiàn)出來的,一模一樣哦。可以看出來血壓是對(duì)冠心病有因果影響的,我們還可以得到相應(yīng)系數(shù)的置信區(qū)間:
generate_odds_ratios(mr_results)


同時(shí)因?yàn)槲覀兪沁x了很多個(gè)SNP進(jìn)行的效應(yīng)估計(jì),我們可以出整個(gè)SNP效應(yīng)的森林圖和漏斗圖,漏斗圖可以幫我們看SNP的異質(zhì)性,我們還可以用Cochran’s Q and I2統(tǒng)計(jì)量檢驗(yàn)不同SNP的異質(zhì)性,然后選擇正確的方法對(duì)各個(gè)SNP的效應(yīng)進(jìn)行合并得到總效應(yīng)




從森林圖就可以看到,整個(gè)血壓的工具變量對(duì)腎功能的作用也是顯著的,同時(shí)我們可以出散點(diǎn)圖直接看出來血壓對(duì)腎功能的系數(shù),如下:

上圖就是不同參數(shù)估計(jì)方法下面估計(jì)出來的暴露(血壓)對(duì)結(jié)局(腎功能)的因果效應(yīng),這個(gè)圖的縱軸是工具變量對(duì)結(jié)局的影響效應(yīng),橫軸是工具變量對(duì)暴露的因果效應(yīng),兩個(gè)效應(yīng)做比值就是暴露對(duì)結(jié)局的效應(yīng),也就是圖中線的斜率,也可以看出來這個(gè)線不同的算法估計(jì)出來是有些許差異的,但總體是斜向上的,就意味著暴露(血壓)對(duì)結(jié)局(冠心?。┦怯兄虻囊蚬P(guān)系的。
然后再用同樣的方法做一遍冠心病對(duì)血壓的因果關(guān)系的分析(流程完全一樣就不重復(fù)了),做完之后發(fā)現(xiàn)冠心病對(duì)血壓其實(shí)是沒有因果作用的,這樣我們就知道了其實(shí)是血壓導(dǎo)致了冠心病而非冠心病導(dǎo)致了血壓升高,這樣一個(gè)完整的孟德爾隨機(jī)化研究就完成了。
可以看到一個(gè)孟德爾隨機(jī)化研究好像也不難哦。好啦,今天就到這兒吧,今天有粉絲在通話中鼓勵(lì)我繼續(xù)(趕緊)寫公眾號(hào)文章,有被感動(dòng)到,所以特更一期,哈哈。

小結(jié)
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
孟德爾隨機(jī)化法(Mendelian randomization method)
今天我們來聊一聊孟德爾隨機(jī)化
花10分鐘就能全面了解孟德爾隨機(jī)化
一種新的孟德爾隨機(jī)化方法用于推斷性狀及疾病之間的因果關(guān)系
孟德爾隨機(jī)化--帶文獻(xiàn)復(fù)現(xiàn)的實(shí)操(上篇)
MR | 第10期. 孟德爾隨機(jī)化主要分析方法匯總
更多類似文章 >>
生活服務(wù)
熱點(diǎn)新聞
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服