文章的題目是A bidirectional Mendelian randomization study supports causal effects of kidney function on blood pressure，這篇文章用到的統(tǒng)計(jì)技巧叫做Two-sample MR----兩樣本孟德爾隨機(jī)分析。我還查閱了別的孟德爾隨機(jī)化的文獻(xiàn)，這個(gè)Two-sample MR的分析其實(shí)是非常常用的。

Two-sample MR分析的一般步驟

第一步是找工具變量，我們要的是基因作為工具變量這些個(gè)基因都是從別人的研究中挑出來的，所有的基因研究有個(gè)專門的庫叫做genome wide association studies (GWAS)。我們需要做的就是從這個(gè)庫中挑出來我們自己需要的和我們暴露相關(guān)的基因變量SNPs。這是第一步。

第二步就是估計(jì)我們的工具變量對(duì)結(jié)局的作用，工具變量對(duì)結(jié)局的作用也是從所有的研究中估計(jì)出來的整體效應(yīng)，這樣可以拒絕單個(gè)研究的偏倚。

第三步就是合并多個(gè)SNP的效應(yīng)量，這個(gè)效應(yīng)量是我們得到暴露和結(jié)局因果效應(yīng)的前提。

第四步就是用合并后的數(shù)據(jù)進(jìn)行孟德爾隨機(jī)化分析和相應(yīng)的敏感性分析。

做分析的整個(gè)流程就在下面的圖中啦：

總體來看就是在孟德爾隨機(jī)化研究中我們的工具變量可以不需要你收集，工具變量的效應(yīng)也不需要你計(jì)算，這些都只需要你在GWAS挖掘合并就行。就是說做孟德爾隨機(jī)化研究是不需要你有原始數(shù)據(jù)的。

我們把上面的步驟具體在剛剛提到的文獻(xiàn)中走一遍：

這篇文獻(xiàn)是要研究高血壓和腎功能的因果方向的，就是到底是高血壓導(dǎo)致腎功能下降，還是腎功能下降導(dǎo)致的高血壓，具體地就是研究eGFRcr和BP的因果方向。

首先作者從別人的基因研究中找自己研究變量的工具變量，別人的研究的情況如下表：注意下表是包含一個(gè)聯(lián)盟的很多個(gè)研究的(腎功能的工具變量是從CKDGen Consortium找來的，血壓的工具變量是UKB-ICBP中找來的)，是需要進(jìn)行meta整合的：

通過meta分析作者就篩選出了兩個(gè)變量可能的工具變量，因?yàn)槊總€(gè)變量的工具變量其實(shí)是比較多的，為了保證同一個(gè)變量工具變量間的獨(dú)立性，作者有做一個(gè)叫LD clumping的操作：

To ensure independence among genetic instruments, we applied LD clumping60 with a clumping window of 10 MB and an r2 cutoff of 0.001 (default of the ld_clumpfunction)

作者有把篩出來的變量的暴露和結(jié)局的工具變量展示在文獻(xiàn)中（但是放在補(bǔ)充材料中的，我并沒有能找到，欸）

然后就到第二步和第三步，估計(jì)工具變量對(duì)暴露和結(jié)局的作用，這個(gè)時(shí)候要考慮工具變量一定不能直接影響結(jié)局（叫做pleiotropy），所以作者會(huì)用好幾個(gè)算法（inverse variance weighted method, mendelian randomisation-Egger (MR-Egger) method, weighted median method, and weighted mode based estimation）來估計(jì)SNP的作用，并將多個(gè)SNP的效應(yīng)合并，用到的是harmonise_data這個(gè)函數(shù)。最后得到一個(gè)總的合并后的效應(yīng)，這個(gè)效應(yīng)被認(rèn)為是比較穩(wěn)健的：

We applied four complementary methods of two sample mendelian randomisation (inverse variance weighted method, mendelian randomisation-Egger (MR-Egger) method, weighted median method, and weighted mode based estimation), which make different assumptions about horizontal pleiotropy. A consistent effect across the four methods is less likely to be a false positive.

有了合并后的工具變量對(duì)結(jié)局的效應(yīng)，最后一步就是mr分析，就是估計(jì)暴露與結(jié)局的直接因果效應(yīng)。

整個(gè)文獻(xiàn)就是這么回事，正文中呈現(xiàn)出來的圖表包括下面兩個(gè)，一個(gè)是腎功能對(duì)血壓的作用的森林圖和效應(yīng)的置信區(qū)間和p值，另一個(gè)是血壓對(duì)腎功能的作用的森林圖和效應(yīng)的置信區(qū)間和p值：

根據(jù)森林圖和相應(yīng)的統(tǒng)計(jì)指標(biāo)，最終作者得到腎功能是影響血壓的原因，而非相反。整個(gè)文獻(xiàn)就完啦，這個(gè)就是一個(gè)完整的孟德爾隨機(jī)化研究的統(tǒng)計(jì)呈現(xiàn)過程。

Two-sampleMR分析實(shí)操

接下來給大家寫如何做出文獻(xiàn)中的結(jié)果：

Two sample Mendelian randomisation (2SMR) is a method to estimate the causal effect of an exposure on an outcome using only summary statistics from genome wide association studies (GWAS).

具體地，作者使用的R包是'TwoSampleMR’。

使用TwoSampleMR的基本流程包括4步：

選擇工具變量
從GWAS數(shù)據(jù)庫提取工具變量
合并效應(yīng)量
做MR分析，敏感性分析，畫圖，出報(bào)告

在分析中我們要使用SNPs來作為工具變量：

Mendelian randomization is a method to assess the causal effect of an exposure on an outcome using an instrument, defined by one or more SNPs, as a proxy for the exposure.

這個(gè)工具變量怎么來呢，有人已經(jīng)把所用的可能用到的SNPs總結(jié)好了放在了R包里，我們直接用就行，從GWAS中獲取，我們需要在GWAS中找到暴露相關(guān)的工具變量和結(jié)局相關(guān)的工具變量從而形成兩個(gè)樣本，相應(yīng)的分析跑兩次，所以一般文獻(xiàn)中的分析方法就叫做two-sample Mendelian randomization

Methodological advances mean that Mendelian randomization can be implemented using summary statistics from GWAS, without individual level data. This requires SNP-exposure associations and SNP-outcome associations obtained from separate datasets and is known as two-sample Mendelian randomization

這里又有許多術(shù)語需要給大家做做鋪墊：

孟德爾隨機(jī)化：Mendelian randomization is a method to assess the causal effect of an exposure on an outcome using an instrument, defined by one or more single nucleotide polymorphisms, as a proxy for exposure.（SNP就是工具變量）
Genome-wide association study (GWAS)：Genome-wide association studies identify the genetic variants that are associated with a given phenotype.和暴露（表型）相關(guān)的基因都是從GWAS中找的
Heterogeneity：Heterogeneity is defined as the variation in the causal estimate across SNPs.這個(gè)是不同SNP效應(yīng)的異質(zhì)性，所以多個(gè)SNP的效應(yīng)是需要合并的
其實(shí)還有好多好多（大家去看文末的文獻(xiàn)呀），感覺寫不完。。。直接上例子吧

實(shí)例解析

我現(xiàn)在想通過孟德爾隨機(jī)化研究血壓和冠心病的關(guān)系，首先我們得接入孟德爾隨機(jī)基礎(chǔ)庫MR-Base這個(gè)數(shù)據(jù)庫，找到相應(yīng)的結(jié)局（即血壓和冠心病）的相關(guān)基因，代碼如下：

ao <- available_outcomes()
exposure_dat <- extract_instruments(c('ukb-a-360'))
outcome_dat <- extract_outcome_data(exposure_dat$SNP, c('7'), 
 proxies = 1, rsq = 0.8, align_alleles = 1, 
 palindromes = 1, maf_threshold = 0.3)

運(yùn)行上面的代碼然后你去查看對(duì)象exposure_dat或者outcome_dat就會(huì)看到相關(guān)基因研究的基本特征，給大家截個(gè)圖吧：

然后計(jì)算基因?qū)Y(jié)局的合并效應(yīng)量，代碼如下：

dat <- harmonise_data(exposure_dat, outcome_dat, action = 2)

最后一步就是進(jìn)行mr分析：

mr_results <- mr(dat)

運(yùn)行所有的代碼后我們就可以得到不同算法模型下我們的結(jié)果如下圖兩圖：

文獻(xiàn)中的結(jié)果

我跑出來的結(jié)果

可以看到上面的圖是文獻(xiàn)中的，底下的圖是我自己復(fù)現(xiàn)出來的，一模一樣哦。可以看出來血壓是對(duì)冠心病有因果影響的，我們還可以得到相應(yīng)系數(shù)的置信區(qū)間：

generate_odds_ratios(mr_results)

同時(shí)因?yàn)槲覀兪沁x了很多個(gè)SNP進(jìn)行的效應(yīng)估計(jì)，我們可以出整個(gè)SNP效應(yīng)的森林圖和漏斗圖，漏斗圖可以幫我們看SNP的異質(zhì)性，我們還可以用Cochran’s Q and I2統(tǒng)計(jì)量檢驗(yàn)不同SNP的異質(zhì)性，然后選擇正確的方法對(duì)各個(gè)SNP的效應(yīng)進(jìn)行合并得到總效應(yīng)：

從森林圖就可以看到，整個(gè)血壓的工具變量對(duì)腎功能的作用也是顯著的，同時(shí)我們可以出散點(diǎn)圖直接看出來血壓對(duì)腎功能的系數(shù)，如下：

上圖就是不同參數(shù)估計(jì)方法下面估計(jì)出來的暴露（血壓）對(duì)結(jié)局（腎功能）的因果效應(yīng)，這個(gè)圖的縱軸是工具變量對(duì)結(jié)局的影響效應(yīng)，橫軸是工具變量對(duì)暴露的因果效應(yīng)，兩個(gè)效應(yīng)做比值就是暴露對(duì)結(jié)局的效應(yīng)，也就是圖中線的斜率，也可以看出來這個(gè)線不同的算法估計(jì)出來是有些許差異的，但總體是斜向上的，就意味著暴露（血壓）對(duì)結(jié)局（冠心?。┦怯兄虻囊蚬P(guān)系的。

然后再用同樣的方法做一遍冠心病對(duì)血壓的因果關(guān)系的分析（流程完全一樣就不重復(fù)了），做完之后發(fā)現(xiàn)冠心病對(duì)血壓其實(shí)是沒有因果作用的，這樣我們就知道了其實(shí)是血壓導(dǎo)致了冠心病而非冠心病導(dǎo)致了血壓升高，這樣一個(gè)完整的孟德爾隨機(jī)化研究就完成了。

可以看到一個(gè)孟德爾隨機(jī)化研究好像也不難哦。好啦，今天就到這兒吧，今天有粉絲在通話中鼓勵(lì)我繼續(xù)（趕緊）寫公眾號(hào)文章，有被感動(dòng)到，所以特更一期，哈哈。

小結(jié)

本站僅提供存儲(chǔ)服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊舉報(bào)。

九色国产,午夜在线视频,新黄色网址,九九色综合,天天做夜夜做久久做狠狠,天天躁夜夜躁狠狠躁2021a,久久不卡一区二区三区

Two-sample MR分析的一般步驟