九色国产,午夜在线视频,新黄色网址,九九色综合,天天做夜夜做久久做狠狠,天天躁夜夜躁狠狠躁2021a,久久不卡一区二区三区

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
預(yù)測模型第8期 | 連續(xù)變量該如何進(jìn)入模型?

連續(xù)變量納入模型

如果變量和結(jié)果之間的關(guān)系是線性的,則可以在回歸方程中包含連續(xù)變量。

如果沒有,可以將其轉(zhuǎn)換為二分變量或有序分類變量,然后將它們放入回歸方程中。回歸模型中包含連續(xù)變量時(shí),應(yīng)盡可能將原始的連續(xù)變量包含在回歸模型中,并考慮實(shí)際需要將連續(xù)變量根據(jù)一些規(guī)則進(jìn)行轉(zhuǎn)換,二分類分組、等距分組、根據(jù)臨床臨界值分組都是為了更好的專業(yè)解釋。

通過最優(yōu)截?cái)嘀捣治?,將連續(xù)變量轉(zhuǎn)化為分類變量,并將其作為啞變量引入回歸模型。在回歸模型中,連續(xù)變量可以以不同的方式表示。我們將列舉具體的例子說明。無論以何種方式呈現(xiàn),總的原則是更有利于專業(yè)的解釋和理解。

正態(tài)轉(zhuǎn)換

  • 對于正態(tài)分布的連續(xù)變量,這不是問題。然而,當(dāng)我們遇到不符合正態(tài)分布的數(shù)據(jù)時(shí),我們可以基于某種函數(shù)進(jìn)行轉(zhuǎn)換,然后這些數(shù)據(jù)將被正態(tài)化,并擬合回歸模型。原始數(shù)據(jù)可以根據(jù)自身的特點(diǎn),采用不同的函數(shù)進(jìn)行正態(tài)化處理,如平方根法、LnX法、Log10X法和(1/X)法等。如果對原始數(shù)據(jù)進(jìn)行了正態(tài)化處理,則應(yīng)解釋正態(tài)變換后的變量,而不是原始變量在回歸模型中的影響

  • 或者可以根據(jù)轉(zhuǎn)換中所使用的函數(shù)來評估原始自變量對原始因變量的影響。例如,作者在他們發(fā)表在JACC,2016(21)上的文章中進(jìn)行了正態(tài)性檢驗(yàn)。原文如下:用Kolmogorov-Smirnov檢驗(yàn)評定連續(xù)變量的正態(tài)性。正態(tài)性檢驗(yàn)方法包括利用數(shù)據(jù)分布參數(shù)(偏度值和峰度值)和數(shù)據(jù)分布圖(直方圖、P-P圖、Q-Q圖)。

  • 或應(yīng)用一些非參數(shù)檢驗(yàn)方法(Shapiro-Wilk檢驗(yàn)、Kolmogorov-Smirnov檢驗(yàn))來幫助評估數(shù)據(jù)的正態(tài)性分布。在他們的研究中,肌鈣蛋白I、NT-proBNP或Corin等變量符合正態(tài)分布。因此,作者用中位數(shù)(四分位數(shù)-三分位數(shù))來描述這些納入變量的基線特征。例如,肌鈣蛋白I的中位數(shù)是4.5(1.8–12.6)ng/mL。然后進(jìn)行多元線性回歸分析。

  • 原文表達(dá)如下:采用多元線性回歸分析來確定影響corin水平的因素。肌鈣蛋白I、NT-proBNP和corin首先通過Log10函數(shù)轉(zhuǎn)換進(jìn)行正態(tài)化處理,再將其納入多元線性回歸。接著進(jìn)行Cox回歸分析。雖然Cox回歸模型對自變量的類型沒有什么特殊要求,但為了與多元線性回歸模型中變量的納入形式保持一致,作者依然采用轉(zhuǎn)換后的變量形式帶入模型中分析。

對連續(xù)變量采用固定增量的形式進(jìn)行轉(zhuǎn)換

如果連續(xù)變量以其原始形式直接引入模型,則回歸參數(shù)被解釋為因每個(gè)單位變化而產(chǎn)生的因變量變化的影響。然而,有時(shí)這種變化的影響可能是微弱的。

因此,我們可以將連續(xù)的自變量按固定的區(qū)間,以等距分組的形式轉(zhuǎn)化為一個(gè)分類變量,然后將它們引入到模型中進(jìn)行分析,這一分組有助于患者更好地理解和應(yīng)用。

例如,我們納入年齡在31歲到80歲之間的患者。我們可以根據(jù)每10年的年齡間隔將其分為31-40歲、41-50歲、51-60歲、61-70歲、71-80歲。然后,將已設(shè)置的五個(gè)啞變量納入到模型中進(jìn)行分析。

但是,如果變量范圍很大,按照前面提到的方法進(jìn)行分組,會(huì)導(dǎo)致分組過多,啞變量過多,這在分析過程中是相當(dāng)冗余的。臨床解釋也會(huì)很困難。反之,數(shù)據(jù)變動(dòng)范圍很小,無法進(jìn)行更小單位的分組。

JACC文獻(xiàn)參考

那么,當(dāng)我們面對這兩種情況時(shí),我們應(yīng)該怎么做呢?在這里,我們可以參考發(fā)表在JACC,2016(19)的一篇文章。我們發(fā)現(xiàn),在模型中,作者使用了很多“per”單詞,如per 5% 改變、per 0.1 u 、per 100ml/min等,這是連續(xù)變量在每次變化中以固定增量的形式進(jìn)行轉(zhuǎn)換,這種轉(zhuǎn)換以“per+改變間距+單位”的形式呈現(xiàn)。我們將在本文中演示兩個(gè)示例。攝氧效率斜率(評價(jià)成人心肺功能儲(chǔ)備的新指標(biāo))的平均值為1655u,5%-95%的人群在846-2800U之間,這確實(shí)是一個(gè)很大的變化范圍。如果將原始數(shù)據(jù)放入模型中,每1u的變化引起HR的變化很小,這在臨床上是沒有意義的。如果將其轉(zhuǎn)換為分類變量,將出現(xiàn)許多組。因此,作者將原始數(shù)據(jù)每變化100u的形式納入模型中,發(fā)現(xiàn)當(dāng)每100u增加時(shí),研究人群的死亡風(fēng)險(xiǎn)將降低9%(HR=0.91,95%CI:0.89–0.93)。另一個(gè)例子是Peak RER。中位數(shù)為1.08 U,5%-95%的人群范圍是0.91-1.27U間。這是一個(gè)很小的范圍。如果將原始數(shù)據(jù)帶入模型中,每1u的變化將導(dǎo)致HR的變化很大。在臨床實(shí)踐中,1u的改變是非常罕見的,這種結(jié)果的實(shí)用性非常有限。因此,作者將每0.1U的變化納入模型中,Peak RER每增加0.1U單位,研究人群死亡風(fēng)險(xiǎn)降低6%(HR=0.94,95%CI:0.86-1.04),但無統(tǒng)計(jì)學(xué)意義。

那么我們具體怎么做這種轉(zhuǎn)換呢?

如果我們想把變量從每增加1個(gè)單位改為每增加100個(gè)單位,我們只需要將原始變量除以100,帶入模型中即可。同樣,如果我們想將研究因素每增加1個(gè)單位改變?yōu)槊吭黾?.1個(gè)單位,只需將原始數(shù)據(jù)乘以10,再納入模型中即可。

按改變每標(biāo)準(zhǔn)差(SD)的形式進(jìn)行轉(zhuǎn)換

在臨床研究中,我們還有另一種轉(zhuǎn)換方法:自變量按每標(biāo)準(zhǔn)差的形式進(jìn)行變化。讓我們看看2016年在JACC上發(fā)表的一篇文章。該模型中年齡和收縮壓按1個(gè)標(biāo)準(zhǔn)差增加的形式轉(zhuǎn)化。年齡每增加一個(gè)標(biāo)準(zhǔn)差,動(dòng)脈粥樣硬化性心臟?。ˋSCVD)的風(fēng)險(xiǎn)增加70%(HR=1.70,95%CI:1.32-2.19)。收縮壓(SBP)每增加一個(gè)標(biāo)準(zhǔn)差,ASCVD風(fēng)險(xiǎn)增加25%(HR=1.25,95%CI:1.05-1.49)。

本文將連續(xù)變量以每標(biāo)準(zhǔn)差遞增的形式引入到模型中。假設(shè)變量符合正態(tài)分布,平均值±SD區(qū)間下的面積為68.27%,平均值±1.96 SD區(qū)間下的面積為95%。平均值±2.58 SD區(qū)間下的面積為99%。我們可以看出,如果在4個(gè)標(biāo)準(zhǔn)差范圍內(nèi),大約95%的樣本將被覆蓋。因此,新的變量,特別是對于那些臨床上尚不清楚的罕見變量解釋,我們可以按每SD改變形式納入模型中。這可以引導(dǎo)患者根據(jù)自己的實(shí)際測量結(jié)果,判斷自己在人群分布水平的幾個(gè)標(biāo)準(zhǔn)差范圍內(nèi),進(jìn)而評估相應(yīng)的風(fēng)險(xiǎn)會(huì)發(fā)生多大的變化。

兩種轉(zhuǎn)換方式

(1)在建立回歸模型之前,需要對原始的連續(xù)變量進(jìn)行標(biāo)準(zhǔn)化處理,并將標(biāo)準(zhǔn)化后的自變量納入回歸模型。得到的回歸系數(shù)就是自變量每變化1個(gè)SD對因變量的影響。(注意:這里只對自變量進(jìn)行標(biāo)準(zhǔn)化處理)。(2)如果原始變量沒有標(biāo)準(zhǔn)化,也可以直接將原始變量帶入模型,得到未標(biāo)準(zhǔn)化的回歸系數(shù),然后再乘以該自變量的標(biāo)準(zhǔn)差,即標(biāo)準(zhǔn)化的回歸系數(shù)。這就是自變量每變化1個(gè)SD對因變量的影響。

參考文獻(xiàn)

Zhou ZR, Wang WW, Li Y, et al. In-depth mining of clinical data: the construction of clinical prediction model with R. Ann Transl Med. 2019;7(23):796. doi:10.21037/atm.2019.08.63

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
回歸模型中引入連續(xù)變量,還有哪些玩法?
調(diào)節(jié)效應(yīng)分析(自變量為連續(xù)變量)
對股票進(jìn)行回歸分析通常自變量和因變量選什么好?
互助問答第528期:關(guān)于中介變量的問題
多重線性回歸分析
統(tǒng)計(jì)學(xué)雜記 7: 這些重要概念混淆了后果十分嚴(yán)重!
更多類似文章 >>
生活服務(wù)
熱點(diǎn)新聞
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服