2023年3月31日,中山大學(xué)智能工程學(xué)院陳語謙教授團隊在Signal Transduction and Targeted Therapy (影響因子39.3) 期刊發(fā)表了題目為“TCMBank-the largest TCM database provides deep learning-based Chinese-Western medicine exclusion prediction”的論文,該研究建立世界最大的中醫(yī)藥數(shù)據(jù)庫TCMBank(https://TCMBank.CN/),該數(shù)據(jù)庫提供了9192種草藥,61,966種成分,15,179個靶標,32,529種疾病,及其它們之間的關(guān)聯(lián)信息。
網(wǎng)站主頁:https://TCMBank.CN/
TCMBank為用戶提供了一個方便的網(wǎng)站,讓用戶可以自由探索草藥、成分、基因靶標以及相關(guān)通路或疾病之間的關(guān)系。TCMBank 還提供了草藥中活性成分的以mol2格式存儲的3D結(jié)構(gòu)。研究人員可以在TCMBank的下載頁面訪問這些數(shù)據(jù),并很方便的用于中醫(yī)藥物的虛擬篩選。TCMBank從已有的中醫(yī)相關(guān)數(shù)據(jù)庫(TCMID、TCMSP、SymMap、TCM-ID、HERB和ETCM)和公開數(shù)據(jù)庫(OMIM, HGNC, MeSH, ENsembl, DO, HPO等)中添加了外部的交叉引用鏈接。為了保證TCMBank的可靠性,所有信息在更新到數(shù)據(jù)庫之前都必須經(jīng)過至少兩次人工驗證。
除此之外,作者針對中西藥之間可能發(fā)生的不良反應(yīng),設(shè)計了一個新穎算法的技術(shù)。中西藥之間的不良反應(yīng)會導(dǎo)致醫(yī)療費用增加,甚至死亡,這大大增加了藥物相互之間不良反應(yīng)帶來的醫(yī)療風(fēng)險。然而,基于人工智能預(yù)測的中西藥不良反應(yīng)缺乏現(xiàn)實世界中大量不良反應(yīng)標簽的中西藥數(shù)據(jù)庫。因此,作者在兩個現(xiàn)實世界的公共藥物相互作用(DDI)數(shù)據(jù)集上提出了兩個模型,3DGT-DDI和 SA-DDI, 來預(yù)測兩種藥物化合物之間的相互作用。經(jīng)過數(shù)據(jù)集的實驗已經(jīng)證明了3DGT-DDI 和 SA-DDI 在兩個公共 DDI 數(shù)據(jù)集上實現(xiàn)了最精確的預(yù)測性能。
隨后,作者將上述兩個模型的預(yù)測結(jié)果推廣到中西藥不良反應(yīng)的預(yù)測中。TCMBank 提供世界上最大的中醫(yī)藥和草藥的成分,靶標,疾病映射信息。受益于TCMBank的大數(shù)據(jù)驅(qū)動,作者利用DDI模型進行無監(jiān)督學(xué)習(xí),并預(yù)測中西藥的不良反應(yīng)作用的預(yù)測。假設(shè)中藥中的所有成分與西藥均不發(fā)生不良反應(yīng),則確定它們之間不存在相互排斥的反應(yīng)。如果中藥中的一種或多種成分與西藥發(fā)生不良反應(yīng),則存在可能產(chǎn)生不良反應(yīng)的風(fēng)險,然而這風(fēng)險也分等級,否則則容易產(chǎn)生任何藥物之間皆有不良反應(yīng)的警告,反而不是真實世界的事實。作者利用AI輔助的DDI預(yù)測模型獲得了中西醫(yī)可能的不良反應(yīng)風(fēng)險的預(yù)測結(jié)果。
圖2. 最大的中醫(yī)藥數(shù)據(jù)庫TCMBank的綜合分析。A. TCMBank與其他中醫(yī)藥數(shù)據(jù)庫的數(shù)據(jù)量對比,其中TCMBank的草藥、成分、疾病最為豐富。B. TCMBank網(wǎng)站的結(jié)構(gòu),包括導(dǎo)航欄、首頁、二級頁面、三級頁面。C. TCMBank中數(shù)據(jù)處理的框架示意圖。D. 基于圖神經(jīng)網(wǎng)絡(luò)的藥物官能團提取的自適應(yīng)子結(jié)構(gòu)感知模塊示意圖。E. 基于因果學(xué)習(xí)的中西藥互斥預(yù)測。(圖源自Signal Transduction and Targeted Therapy)。
原文鏈接:
https://pubmed.ncbi.nlm.nih.gov/36997527/
聯(lián)系客服