相信學醫(yī)的朋友都會有這樣的感受:突然收到來自親戚朋友的問候,同時被“順便”咨詢體檢發(fā)現的某處結節(jié),其中最常見的就是肺結節(jié)和甲狀腺結節(jié)。
這問題看似簡單,但其實并不那么容易回答。就比如甲狀腺結節(jié),很多人都有,但其中僅有約十分之一的結節(jié)是惡性的[1]。
目前對于結節(jié)良惡性的判斷(手術取得病理標本之前),大多依靠醫(yī)生臨床經驗和影像評估,換個人來閱片或者評估甚至可能會得出相左的結論。
對于甲狀腺結節(jié)來說,即使進行細針穿刺活檢(取少量細胞進行檢測,目前術前最常用也是最可靠的檢測手段[2]),也有大概三分之一的病例仍然無法得到確切的診斷[3]。
近日,來自西湖大學的郭天南和李子青團隊,聯(lián)合新加坡國家癌癥中心的Oi Lian Kon和Narayanan Gopalakrishna Iyer團隊,在《細胞發(fā)現》雜志發(fā)表重要研究成果[4]。
他們通過人工智能(AI)的方式對甲狀腺結節(jié)蛋白質組學進行分析,建立了用于診斷結節(jié)良惡性的神經網絡模型,準確率達到90%以上。在外部驗證隊列中,準確率也在85%以上。
這是全球首個基于蛋白質組學的甲狀腺結節(jié)良惡性診斷AI模型,具有很強的臨床轉化價值,其良好的準確性或可使相當一部分良性結節(jié)患者免于手術之苦。
文章首頁截圖
為了建立區(qū)分甲狀腺結節(jié)良惡性的AI模型,研究人員首先對來自新加坡總醫(yī)院578位病人的579個結節(jié)(共1724個福爾馬林固定石蠟包埋的組織樣本)進行質譜分析,獲得蛋白質組數據,并與其病理診斷相匹配,從而構建神經網絡模型。
研究的測試集來自于中國和新加坡12家醫(yī)院的回顧性福爾馬林固定石蠟包埋組織樣本數據(288個結節(jié)),和前瞻性隊列的細針穿刺活檢數據(294個結節(jié))。
研究設計流程圖
在先前的研究中,郭天南團隊已構建了甲狀腺特異性的蛋白質圖譜[5],通過統(tǒng)一流形逼近和投影(UMAP,一種數據降維算法)對數據進行可視化后,他們發(fā)現乳頭狀甲狀腺癌(PTC)與其他組織顯著分離,而正常樣本(N)與多結節(jié)性甲狀腺腫(MNG)混雜在一起,濾泡性甲狀腺腺瘤(FA)和濾泡性甲狀腺癌(FTC)也無法分離。
這表明雖然良惡性結節(jié)的蛋白質組是存在一定差異的(N、MNG和FA為良性,FTC和PTC為惡性),但無法通過蛋白質組學的常規(guī)分析而直接區(qū)分良惡性結節(jié)(如FA何FTC)。
甲狀腺良惡性結節(jié)無法通過蛋白質組學的常規(guī)分析而直接區(qū)分出來
緊接著,研究人員便想到通過神經網絡模型來對良惡性結節(jié)進行區(qū)分。
通過對579個結節(jié)樣本(40個N,203個MNG,137個FA,75個FTC和124個乳頭狀甲狀腺癌PTC)進行三次交叉驗證,最后選出了19個區(qū)分良惡性結節(jié)最準確的蛋白。
AI模型構建示意圖
篩選出的19個蛋白質的詳細資料
由于目前臨床中甲狀腺結節(jié)被過度治療,因此在構建模型時研究人員尤其關注模型診斷的特異性,同時保證較高的靈敏度。
相比于6個其他機器學習模型(SVM,LASSO,決策樹,MLP,隨機森林,Logistic回歸),以這19個選定的蛋白構建的AI預測模型具有最高的AUC(0.93)。
UMAP也顯示,通過這19種蛋白,可將良惡性結節(jié)較好地區(qū)分。
以19個選定的蛋白構建的AI預測模型具有良好的預測性能
隨后,研究人員在外部測試集中對該模型的預測性能進行驗證。
第一個測試集為288例福爾馬林固定石蠟包埋的組織樣本,其中144例為良性,其余144例為惡性。在該測試集中,AUC值可達到0.94,準確性為89%,敏感性和特異性分別為84%和94%。
第二個測試集為來自9家醫(yī)院的294例細針穿刺活檢數據,這一測試集的意義更為重大,因為本研究的初衷是開發(fā)在術前可用于預測結節(jié)良惡性的AI模型,而細針穿刺活檢則是術前最為普遍的檢測手段。在這一測試集中,AUC值同樣高達0.93,準確率為85%,敏感性和特異性分別為92%和71%。
此外,研究人員還進一步檢測了這個AI模型在不同Bethesda分類(甲狀腺細針穿刺細胞學活檢結果病理報告系統(tǒng))細針穿刺活檢樣本中的性能,結果顯示,對于Bethesda分類III和IV類的良惡性不確定的甲狀腺結節(jié),此AI模型的AUC值為0.89。
值得一提的是,細胞病理學家對Bethesda分類II、V和VI類樣本的總體診斷準確率為82%,而本模型對這些相同結節(jié)的診斷準確率為88%。
同時,研究人員還指出,這個AI模型對于直徑≥1 cm結節(jié)的預測準確率(87.7%)高于直徑<1 cm結節(jié)(75.8%)。這可能是由于小結節(jié)采樣的準確性較差的緣故。
對于淋巴細胞浸潤明顯的結節(jié),這個AI模型難以將其與惡性結節(jié)區(qū)分開(淋巴細胞浸潤性結節(jié)預測準確率為66%)。這可能是由于目前數據集所包括的淋巴細胞浸潤性樣本數量很少的緣故,從而導致了淋巴細胞性甲狀腺炎的診斷準確性。
總的來說,這個研究構建了首個基于蛋白質組學對甲狀腺結節(jié)良惡性進行預測的AI模型,僅通過19種蛋白,即可準確地區(qū)分甲狀腺結節(jié)的良惡性,同時還有較高的敏感性和特異性。
同時,該模型不僅適用于傳統(tǒng)的組織標本,對于甲狀腺細針穿刺活檢所取得的少量細胞蛋白,此模型同樣具有很好的預測效果。
這一點在臨床中尤為重要,對于細針穿刺活檢無法明確性質的結節(jié),通過這個模型進行良惡性判斷,將會減少相當多的良性結節(jié)病人做原本并不需要的手術,具有很強的臨床意義。
參考文獻:
1.Durante C, Grani G, Lamartina L, Filetti S, Mandel SJ, Cooper DS: The Diagnosis and Management of Thyroid Nodules: A Review. JAMA 2018, 319(9):914-924.
2.Faquin WC, Bongiovanni M, Sadow PM: Update in thyroid fine needle aspiration. Endocr Pathol 2011, 22(4):178-183.
3.Alexander EK, Kennedy GC, Baloch ZW, Cibas ES, Chudova D, Diggans J, Friedman L, Kloos RT, LiVolsi VA, Mandel SJ et al: Preoperative diagnosis of benign thyroid nodules with indeterminate cytology. N Engl J Med 2012, 367(8):705-715.
4.Sun Y, Selvarajan S, Zang Z, Liu W, Zhu Y, Zhang H, Chen W, Chen H, Li L, Cai X et al: Artificial intelligence defines protein-based classification of thyroid nodules. Cell Discov 2022, 8(1):85.
5.Sun Y, Li L, Zhou Y, Ge W, Wang H, Wu R, Liu W, Chen H, Xiao Q, Cai X et al: Stratification of follicular thyroid tumours using data-independent acquisition proteomics and a comprehensive thyroid tissue spectral library. Mol Oncol 2022, 16(8):1611-1624.
聯(lián)系客服