2017年4月,The International Journal of Occupational and Environmental Medicine(The IJOEM)雜志的主編Farrokh Habibzadeh教授發(fā)表了一篇名為《Statistical Data Editing in Scientific Articles》的文章[1],針對在論文中進(jìn)行數(shù)據(jù)編輯時常犯的錯誤和需要注意的地方,進(jìn)行了詳細(xì)的說明,讓我們來一起看看Editor怎么說。
一、統(tǒng)計方法描述
一般情況下,在論文方法(Method)的最后一部分,要求作者對統(tǒng)計分析方法進(jìn)行詳細(xì)的描述。通常包括幾個內(nèi)容:
1、數(shù)據(jù)分析所使用的軟件及其版本、所屬公司、公司所屬地等信息。例如:The data were analysed by SPSS version 24.0 for Windows (SPSS Inc., Chicago, IL, USA).
2、數(shù)據(jù)結(jié)果的呈現(xiàn)和描述形式。例如:Continuous variables with normal distribution were presents as mean±standard deviation (SD); non-normal variables were reported as median (interquartile range).
3、數(shù)據(jù)分析時所用到的統(tǒng)計檢驗(yàn)方法。例如:Mean of two continuous normally distributed variables were compared by independent samples Student's test.
4、設(shè)定的假設(shè)檢驗(yàn)水準(zhǔn)。例如:A value of P<0.05 was considered significant.
注意:在統(tǒng)計方法描述部分,有些作者不管什么類型的研究論文,都復(fù)制粘貼使用同一個固定的描述模板,這樣很容易被Editor發(fā)現(xiàn),統(tǒng)計方法必須要根據(jù)自己數(shù)據(jù)的實(shí)際情況,以及真正所使用到的統(tǒng)計方法來進(jìn)行介紹,萬不可張冠李戴。
二、數(shù)據(jù)的精確度
有些作者在結(jié)果描述中太過于追求數(shù)據(jù)的精度,例如一篇文章中這樣描述:The mean work experience of studied participants was 20.365 (SD, 4.35) years。
其中有2個問題:首先,均數(shù)和標(biāo)準(zhǔn)差的小數(shù)位數(shù)在呈現(xiàn)時沒有保持一致;其次,工作經(jīng)驗(yàn)的均值精確到了3位小數(shù),這就意味著在對工作經(jīng)驗(yàn)這個變量進(jìn)行調(diào)查時,精確到了以“小時”為單位,而在實(shí)際的調(diào)查過程中一般最多精確到以“月”為單位,因此建議此處的描述修改為20.4 (SD, 4.4) years。
一般情況下,在描述均值、標(biāo)準(zhǔn)差、中位數(shù)、四分位間距等指標(biāo)時,建議小數(shù)位數(shù)不要超過原始測量數(shù)據(jù)的小數(shù)位數(shù)。
對于百分位數(shù)的描述,當(dāng)分母小于100時,一般建議百分位數(shù)不保留小數(shù),而當(dāng)分母小于20時,就不再建議使用百分比來進(jìn)行描述了。例如:Of 15 patients studied, 26.67% presented with fever,此處百分位數(shù)計算的分母為15<20,因此建議修改為:4 of 15 patients presented with fever。
但有時在不易獲得分母具體數(shù)值的情況下,可以根據(jù)百分?jǐn)?shù)和絕對數(shù)的大小來進(jìn)行輔助判斷。當(dāng)百分?jǐn)?shù)大于絕對數(shù)時,提示分母小于100,此時百分位數(shù)可以不用保留小數(shù)。例如:“31 (42.47%) patients……”,此時百分?jǐn)?shù)42.47%大于絕對數(shù)31,提示分母小于100 (實(shí)際上分母為73),則此處建議修改為:“31 (42%) patients……”。
三、常用的統(tǒng)計描述指標(biāo)
對于正態(tài)分布的資料,一般采用均值 (Mean) 和標(biāo)準(zhǔn)差 (Standard Deviation, SD) 來描述數(shù)據(jù)的集中趨勢和離散情況,而對于非正態(tài)分布的資料,常用中位數(shù) (Median) 和四分位間距 (Interquartile Range, IQR) 來描述數(shù)據(jù)的集中趨勢和離散情況,這就要求要首先對數(shù)據(jù)資料的分布特點(diǎn)進(jìn)行檢驗(yàn)。
但是在多數(shù)論文中,作者并未直接給出正態(tài)性檢驗(yàn)的結(jié)果。在無法獲得原始數(shù)據(jù)的情況下,我們可以根據(jù)標(biāo)準(zhǔn)差和均值的大小進(jìn)行初步判斷。若標(biāo)準(zhǔn)差超過均值的一半,則提示數(shù)據(jù)很有可能是非正態(tài)分布,可以參考前期推送的有關(guān)數(shù)據(jù)
正態(tài)性檢驗(yàn)的內(nèi)容進(jìn)行學(xué)習(xí)。
由于標(biāo)準(zhǔn)誤 (Standard Error of Mean, SEM) 比標(biāo)準(zhǔn)差小,有些作者為了掩蓋數(shù)據(jù)非正態(tài)分布的特點(diǎn),錯誤地將標(biāo)準(zhǔn)誤作為描述數(shù)據(jù)離散趨勢的一個指標(biāo)。但實(shí)際上,標(biāo)準(zhǔn)誤反映的是均數(shù)抽樣誤差的大小,而非樣本資料的離散情況,此時用標(biāo)準(zhǔn)誤來衡量數(shù)據(jù)資料的離散趨勢是不正確的。
95%置信區(qū)間(95%CI),可以用均值±1.96*標(biāo)準(zhǔn)誤來進(jìn)行計算。一種情況,當(dāng)報告某種疾病的患病率時,建議同時報告其95%CI。例如:26 of 300 studied participants had brucellosis translating to a prevalence of 8.7% (95%CI, 5.5% to 11.9%)。根據(jù)95%CI的計算公式,數(shù)據(jù)資料的均值約等于95%CI上、下限的均值,如8.7%=(5.5% 11.9%)/2, 以此來幫助判斷結(jié)果是否一致。
另一種情況,多見于描述RR (Relative Risk) 值或者OR (Odds Ratio) 值時,需要報告其95%CI。例如:Smoking was associated with a higher incidence of lung cancer (OR, 2.6; 95%CI, 1.3 to 5.2)。此時RR或OR值的平方等于95%CI上、下限的乘積,如2.62=1.3*5.2,以此來幫助判斷結(jié)果是否一致。
四、診斷試驗(yàn)的結(jié)果報告
對于診斷試驗(yàn),通常在論文中需要描述的指標(biāo)包括靈敏度、特異度、陽性預(yù)測值、陰性預(yù)測值及其95%CI等。當(dāng)使用ROC (Receive Operating Characteristic) 曲線進(jìn)行分析時,則還需要報告曲線下面積及其95%CI、截斷值 (cut-off point)等信息。
五、測量單位
準(zhǔn)確描述測量單位也是非常重要的。例如常常在文章中見到類似的描述:Serum cholesterol levels was 5.22。缺失相應(yīng)的單位“mmol/L”,這種遺漏的情況在表格及圖的坐標(biāo)軸中也經(jīng)常出現(xiàn)。大多數(shù)學(xué)術(shù)雜志都推薦使用國際單位(SI),因此當(dāng)某個指標(biāo)有不同的計量單位時,也建議統(tǒng)一換算為國際單位。
六、P值
P值的描述在論文中也常出現(xiàn)各種問題,一些雜志僅要求在描述P值時給出其判斷標(biāo)準(zhǔn),例如:P<0.05, 或non-significant,而多數(shù)雜志則要求在論文中報告準(zhǔn)確的P值。一般情況下描述P值時建議不要超過3位小數(shù),例如P=0.0123,可修改為P=0.012。但有時P值很小,例如P=0.0000123,只若保留三位小數(shù),即P=0.000,此時建議將其描述為P<0.001。值得注意的是,只有當(dāng)進(jìn)行假設(shè)檢驗(yàn)時才需要提供P值。
此外,當(dāng)能夠同時獲取95%CI和P值時,一般建議僅報告95%CI即可,因?yàn)镻值僅提示假設(shè)檢驗(yàn)有無統(tǒng)計學(xué)顯著性,而95%CI還可以直觀的顯示效應(yīng)值的范圍。例如:Smoking was significantly associated with a higher incidence of lung cancer (OR, 2.6; P=0.04),建議修改為:Smoking was associated with a higher incidence of lung cancer (OR, 2.6; 95%CI, 1.3 to 5.2)。
對于P值的解釋一定要謹(jǐn)慎,在設(shè)定檢驗(yàn)水平α為0.05的情況下,特別是當(dāng)P值在臨界值附近時,例如P=0.049時認(rèn)為有統(tǒng)計學(xué)顯著性,而P=0.051則認(rèn)為無統(tǒng)計學(xué)顯著性,下結(jié)論的時候要謹(jǐn)防產(chǎn)生I類錯誤和II類錯誤,有可能會做出假陽性或假陰性的結(jié)論(參考前期推送的有關(guān)介紹
I類錯誤和II類錯誤的內(nèi)容)。
通常把這種情況描述為部分顯著性(partially significant)或邊緣顯著性(marginally significant)(可參考前期推送的有關(guān)
P值100種表達(dá)方法的內(nèi)容進(jìn)行描述)。如果沒有充分的證據(jù)證明該效應(yīng)值在人群中實(shí)際上存在顯著性,而陰性結(jié)果可能是由于抽樣誤差造成的,那么我們就應(yīng)該遵守游戲規(guī)則,當(dāng)設(shè)定α=0.05時,若假設(shè)檢驗(yàn)得出P≥0.05,即認(rèn)為無統(tǒng)計學(xué)顯著性,作者可以在論文的討論部分對其原因進(jìn)行詳細(xì)探討。
七、生存分析
Cox比例風(fēng)險模型(Cox proportional hazard model)以生存結(jié)局和生存時間為因變量,在校正多種混雜因素后,用來分析研究因素對于結(jié)局的影響。需要注意的是,Cox模型的基本假定是比例風(fēng)險假定(PH假定),只有在滿足PH假定的前提下,基于此模型的分析才是可靠有效的,然而對于該假定的檢驗(yàn)往往被研究人員所忽略。
檢驗(yàn)PH假定最簡單的方法就是觀察按照研究變量分組后的Kapla-Meier生存曲線,若生存曲線明顯交叉,則提示不滿足PH假定。具體可以參考前期推送的有關(guān)
PH假定檢驗(yàn)的內(nèi)容進(jìn)行學(xué)習(xí)。