該文結(jié)合已發(fā)表的研究論文,從研究設(shè)計、統(tǒng)計分析與結(jié)果報告3方面涉及的統(tǒng)計學問題入手,進行逐條解讀,以闡明醫(yī)學論文應達到的統(tǒng)計報告要求。之前小咖分享了研究設(shè)計部分(一表總結(jié):醫(yī)學期刊的統(tǒng)計報告要求),今天我們繼續(xù)分享統(tǒng)計分析和結(jié)果報告要求。
統(tǒng)計分析
1、缺失值的處理:
缺失值是人群研究中不可避免的問題,其處理方式的差異可能在不同程度上引入偏倚,因此,詳細報告數(shù)據(jù)清理過程中缺失值的處理方法有助于讀者對潛在偏倚風險進行評價。
例如,瑞舒伐他汀試驗在統(tǒng)計分析部分詳細說明了缺失值的填補策略,包括:將二分類結(jié)局中的缺失值視為未發(fā)生事件;將生物標志物和心電圖測量中的缺失值進行多重填補(multiple imputation);為了證明缺失值處理的合理性和填補結(jié)果的穩(wěn)定性,研究還比較了多重填補與完整數(shù)據(jù)(complete-case)分析的結(jié)果。
2、數(shù)據(jù)的預處理:
實施統(tǒng)計分析之前往往需要將原始數(shù)據(jù)進行預處理,如:對連續(xù)變量進行函數(shù)轉(zhuǎn)換使其更接近正態(tài)分布,基于原始數(shù)據(jù)構(gòu)建衍生變量,將連續(xù)變量拆分為分類變量或?qū)⒎诸愖兞康牟煌悇e進行合并等。醫(yī)學論文應報告處理原始數(shù)據(jù)的方法及依據(jù),瑞舒伐他汀試驗即在統(tǒng)計分析部分描述了對血液生物標志物的對數(shù)轉(zhuǎn)換。
3、變量分布特征描述:
確定統(tǒng)計分析使用的變量,并針對每一個變量的分布特征進行描述,是決定研究選用何種統(tǒng)計分析方法的基礎(chǔ)。醫(yī)學期刊雖然普遍對此提出要求,但作者往往套用常用方法,如:連續(xù)變量符合正態(tài)分布時,采用均數(shù)(標準差)描述,否則采用中位數(shù)(四分位間距)描述;分類變量采用頻數(shù)(百分比)描述等。
事實上,應根據(jù)研究設(shè)計類型、統(tǒng)計分析目的和數(shù)據(jù)特征選擇恰當?shù)拿枋龇椒?/strong>。例如,CKB選擇采用年齡、性別和地區(qū)校正的均值和率來描述人群分布特征,而非簡單的報告連續(xù)變量的均數(shù)和分類變量的構(gòu)成比。
4、主要分析(primary analysis):
指針對研究結(jié)局的統(tǒng)計分析,是研究論文的核心證據(jù)。因此,醫(yī)學論文應詳細描述主要分析的實施過程和適用性。
在試驗性研究中,應明確統(tǒng)計分析數(shù)據(jù)集、試驗效應指標、相對或絕對風險及其置信區(qū)間的計算方法、以及假設(shè)檢驗的方法。
例如,瑞舒伐他汀試驗采用意向性分析(intention to treat)數(shù)據(jù)集,通過計算OR值及其95%CI來評價術(shù)后房顫發(fā)生風險在試驗組與對照組間的差異,置信區(qū)間包含1說明研究結(jié)果不拒絕原假設(shè),即兩組的術(shù)后房顫發(fā)生風險相等;考慮到重復測量的需要,采用協(xié)方差分析比較兩組術(shù)后6~120 h肌鈣蛋白Ⅰ釋放曲線下面積的對數(shù),并計算其均值的絕對差異及其95%CI來評價圍術(shù)期心肌損傷情況在試驗組與對照組間的差異,置信區(qū)間包含0說明研究結(jié)果不拒絕原假設(shè),即兩組的圍術(shù)期心肌損傷情況相同。
在觀察性研究中,通常采用多因素統(tǒng)計模型來控制混雜,此時應明確定義因變量、自變量及潛在的混雜變量或效應修正因子,描述變量轉(zhuǎn)換的方法和變量篩選的過程,并預先說明論文報告哪一種統(tǒng)計模型的結(jié)果。如果采用讀者并不熟悉的統(tǒng)計分析方法,還應詳細介紹該統(tǒng)計分析方法的原理。
例如,CKB采用Cox比例風險回歸模型分析水果攝入與心血管事件之間的關(guān)聯(lián),因變量為心血管事件,包括心血管死亡、主要冠狀動脈事件、出血性卒中、缺血性卒中、其他缺血性心臟病和其他腦血管??;
自變量為水果攝入頻率,即每天、4~6 d/周、1~3 d/周、每月、極少或從不;分層變量為年齡、性別和地區(qū);同時模型調(diào)整了基線的混雜變量;
為了幫助多個暴露類別之間的比較,研究采用浮動絕對風險的方法(floating-absolute-risk method)估計危險比的變異程度,并與傳統(tǒng)的不浮動絕對風險的方法進行比較。
5、其他分析:
如果研究在主要分析之外,還進行了其他輔助分析(ancillary analysis),如敏感性分析(sensitivity analysis)或亞組分析(subgroup analysis),應在統(tǒng)計分析部分給予充分說明。
如果是事后分析(post-hoc analysis),應考慮潛在的Ⅰ類錯誤膨脹問題。例如,瑞舒伐他汀試驗在主要分析的基礎(chǔ)上,根據(jù)基線年齡(≤60歲或>60歲)、性別、他汀用藥史(是或否)等變量分亞組比較主要結(jié)局指標在試驗組與對照組間的差異。但是,由于該亞組分析在研究設(shè)計時已預先設(shè)定(pre-specify),因此無需對顯著性水平進行調(diào)整。
6、多重比較:
除了常規(guī)使用的統(tǒng)計分析方法外,作者還應特別注意多重比較的問題。
例如,瑞舒伐他汀試驗設(shè)置了兩個平行的主要結(jié)局指標:術(shù)后房顫和圍術(shù)期心肌損傷,原則上應調(diào)整顯著性水平以控制總體Ⅰ類錯誤概率。然而,由于研究假設(shè)兩個主要結(jié)局指標同時達到組間差異有統(tǒng)計學意義才算試驗陽性,且在估算樣本量時已對此給予了充分考慮,因此無需考慮多重檢驗的問題(without allowance for multiple testing)。
7、Ⅰ類錯誤概率與統(tǒng)計軟件:
醫(yī)學論文應對統(tǒng)計檢驗的Ⅰ類錯誤概率(單/雙側(cè))及統(tǒng)計軟件進行說明。例如,兩部分數(shù)據(jù)分別采用SAS 9.3和Stata 13.0軟件進行分析,所有檢測均為雙側(cè)檢驗,P<0.05為差異有統(tǒng)計學意義。
結(jié)果報告
1、研究對象的納入流程:
醫(yī)學期刊推薦使用研究對象流程圖來描述研究對象的納入流程、研究實施過程中的失訪或無應答、以及最終的統(tǒng)計分析數(shù)據(jù)集等信息,見圖 1。研究對象流程圖的展示可以為研究對象是否存在選擇偏倚、研究結(jié)果的可外推范圍等提供重要證據(jù)。
圖1 瑞舒伐他汀試驗的研究對象流程圖
注:a患者可能被多種原因排除;b接受手術(shù)患者的百分比;所有生化測量的缺失值百分比范圍為5.0%~7.5%,除了sCD40L(17.5%)
2、基線數(shù)據(jù)比較:
醫(yī)學期刊通常要求分組報告基線變量的分布特征,但在組間比較時可以不做假設(shè)檢驗,不標注P值,見表 2。因為,在大樣本研究中,絕對差異的微小改變都可能造成統(tǒng)計學顯著,而該差異本身并不一定具有臨床意義。另一方面,在樣本量較小的隨機對照試驗中,即便采用了嚴格的隨機分組策略,仍會有個別變量無法達到組間可比,此時,如果預先對基線數(shù)據(jù)進行組間比較,作者可能會選擇性不報告組間差異有統(tǒng)計學意義的變量,而導致選擇性報告偏倚。
表2. 瑞舒伐他汀試驗的研究對象基線特征(節(jié)選)
3、效應估計與置信區(qū)間:
醫(yī)學論文在報告統(tǒng)計結(jié)果時不應僅依賴于P值,還應給出量化的效應估計結(jié)果,同時評價其測量誤差或不確定性,如報告95%CI(如有必要,可根據(jù)顯著性水平對置信系數(shù)進行調(diào)整。因為P值無法反映關(guān)于效應大小和估計精度的重要信息,只能說明統(tǒng)計學意義,而損失對臨床意義的表達。
SAMPL指南建議研究者給出臨床意義的最小界值,以幫助讀者根據(jù)點估計及置信區(qū)間判斷研究的臨床意義。中華流行病學雜志則提出,當P值小于Ⅰ類錯誤概率時,應說“組間差異有統(tǒng)計學意義”,而不應說“組間有顯著性差異”。例如,CKB在評價研究因素對結(jié)局的發(fā)生風險時,報告了危險比及其95%CI。
4、結(jié)果與方法一一對應:
醫(yī)學論文應保證研究結(jié)果與方法一一對應,如:在方法中介紹了基線的統(tǒng)計描述與組間比較的具體方法,應在結(jié)果中對基線數(shù)據(jù)進行相應的描述與比較;在方法中說明了研究的主要分析方法,應在結(jié)果中對主要結(jié)局指標的估計或假設(shè)檢驗結(jié)果進行報告;在方法中提出了其他分析,包括敏感性分析、亞組分析等,應在結(jié)果中羅列出相應內(nèi)容。
例如,瑞舒伐他汀試驗在方法部分說明研究將對主要結(jié)局指標、次要結(jié)局指標分別進行組間比較,并對主要結(jié)局指標進行亞組分析;在結(jié)果部分則依次報告了相應結(jié)果。
5、傷害:
需要注意的是,無論是試驗性研究還是觀察性研究,都有可能存在傷害研究對象的風險。醫(yī)學論文應如實報告研究過程中發(fā)生的傷害。
例如,噻托溴銨試驗報告了試驗組與對照組的不良事件發(fā)生情況:除了輕度不良事件(如口咽不適)外,其他不良事件、嚴重不良事件和死亡發(fā)生率的組間差異均無統(tǒng)計學意義。
6、P值的報告規(guī)范及保留小數(shù)位數(shù):
不同醫(yī)學期刊對P值的報告規(guī)范有不同要求。例如,NEJM規(guī)定,除非研究設(shè)計需要進行單側(cè)檢驗,如非劣效性試驗,其他報告的P值均應為雙側(cè)。P值大于0.01應報告小數(shù)點后兩位;P值在0.01到0.001之間應報告小數(shù)點后三位;P值小于0.001應報告為P<0.001。在分層分析中,只需報告層間比較差異有統(tǒng)計學意義的P值,而不需報告所有層間兩兩比較的P值。
CMJ(Engl)規(guī)定,應使用大寫斜體,并報告P值的精確值(如果P值在0.001~0.05之間時)。中華醫(yī)學雜志規(guī)定,應盡可能給出具體的P值。中華流行病學雜志規(guī)定,應給出P值的實際數(shù)值,并保留3位小數(shù)。在使用不等式表示P值時,選用P>0.05、P<0.05和P<0.01即可滿足需求,無須細分P<0.001或P<0.000 1。
可以看出,目前醫(yī)學期刊對P值的報告尚無統(tǒng)一規(guī)范,導致一些研究僅給出P值與顯著性水平之間的不等關(guān)系,而不體現(xiàn)量化的數(shù)值(如P>0.05);一些研究則盲目追求P值的精度,而保留不必要的小數(shù)位數(shù)(如P=0.0357)。
7、統(tǒng)計表規(guī)范:
統(tǒng)計表可以簡明、高效地展示研究的關(guān)鍵信息。ICMJE對統(tǒng)計表的要求包括:依照正文的引用順序連續(xù)編碼,并確保每個表都在正文中被引用;設(shè)置簡短清晰的表標題,使讀者可以直接理解表中內(nèi)容而無需閱讀上下文;設(shè)置簡短清晰的縱標目與橫標目,并在腳注中解釋標目涉及的細節(jié)問題;在腳注中解釋所有表中的非標準縮寫,同時明確變異特征,如標準差或標準誤;如果表中用到其他來源的已發(fā)表或未發(fā)表的數(shù)據(jù),應獲取許可并充分引用,見表 2。
8、統(tǒng)計圖規(guī)范:
統(tǒng)計表用于展示數(shù)據(jù)的精確數(shù)值,而統(tǒng)計圖則提供對數(shù)據(jù)的全面評估。ICMJE對統(tǒng)計圖的要求包括:依照正文的引用順序連續(xù)編碼,并確保每張圖都在正文中被引用;如果圖片已經(jīng)發(fā)表,應獲取許可并充分引用;如果存在符號、箭頭、數(shù)字或字母用于標記圖片,需在圖例中逐一解釋,見圖 1。不同雜志還會對圖片的格式和大小進行進一步要求。統(tǒng)計圖表達方式的創(chuàng)新有助于讀者快速掌握研究的核心結(jié)果。
9、圖表內(nèi)容不重復:
醫(yī)學論文的圖表內(nèi)容不應重復,且不應在文中復述圖表中的所有數(shù)據(jù);應僅強調(diào)或總結(jié)最重要的結(jié)果。
例如,瑞舒伐他汀試驗在結(jié)果部分依次用圖表展示了基線、主要結(jié)局指標及亞組分析、共同主要結(jié)局指標和次要結(jié)局指標的相關(guān)內(nèi)容。
總結(jié)
本文從研究設(shè)計、統(tǒng)計分析、結(jié)果報告3方面涉及的統(tǒng)計學問題入手,對醫(yī)學期刊的統(tǒng)計報告條目及內(nèi)容進行歸納,并借助試驗性研究和觀察性研究論文,對其進行逐條解讀,以闡明醫(yī)學論文統(tǒng)計報告應達到的基本要求。
本文發(fā)現(xiàn),英文醫(yī)學期刊普遍參考ICMJE提出的“醫(yī)學期刊學術(shù)著作實施、報告、編輯和發(fā)表建議”及EQUATOR協(xié)作網(wǎng)發(fā)布的針對多種研究設(shè)計類型的報告聲明等規(guī)范性文件,對于醫(yī)學研究的統(tǒng)計報告已有詳細規(guī)定。
而中文醫(yī)學期刊通常采用編輯部自行刊發(fā)的對統(tǒng)計學方 法的要求,雖然對統(tǒng)計分析的格式和內(nèi)容有具體說明,但并不充分,建議根據(jù)國際規(guī)范完善現(xiàn)行的統(tǒng)計報告要求。
需要注意的是,本文介紹的統(tǒng)計報告條目是不同研究設(shè)計類型均可能涉及的共性問題,當研究者在進行論文撰寫時,應根據(jù)自身的研究設(shè)計類型、研究目的與學術(shù)期刊要求選擇參考適用的條目,而非逐一報告。本文有望幫助研究者了解醫(yī)學研究的統(tǒng)計報告要求,從而切實提高醫(yī)學論文的統(tǒng)計報告質(zhì)量。
內(nèi)容來源:嚴若華,彭曉霞. 醫(yī)學期刊統(tǒng)計報告要求的詳述與解讀[J]. 中華流行病學雜志, 2019, 40(1): 99-105.
聯(lián)系客服