#智慧芽創(chuàng)新賦能大會(huì)洞察#9月16日,備受關(guān)注的“智慧芽2021創(chuàng)新賦能大會(huì)”在上海舉辦。大會(huì)邀請(qǐng)了超過40位行業(yè)重磅嘉賓就20多個(gè)熱門議題發(fā)表演講討論,這些思考中國科技創(chuàng)新的干貨內(nèi)容,今起整理成文,與大家共享。
在“智慧芽2021創(chuàng)新賦能大會(huì)”論壇上,中科院深理工計(jì)算機(jī)科學(xué)與控制工程學(xué)院、美國醫(yī)學(xué)與生物工程院院士潘毅深入分析了人工智能及大數(shù)據(jù)等技術(shù)在生物醫(yī)學(xué)領(lǐng)域應(yīng)用所面臨的挑戰(zhàn),并提出了應(yīng)對(duì)挑戰(zhàn)時(shí)需要提升的關(guān)鍵核心技術(shù)等。
以下為潘毅演講全文(文章根據(jù)演講整理,有刪減)
隨著人工智能技術(shù)的不斷發(fā)展,大數(shù)據(jù)越來越多地被應(yīng)用于醫(yī)療實(shí)踐中,如臨床決策、慢病干預(yù)、規(guī)范用藥、監(jiān)控預(yù)警等場(chǎng)景。值得注意的是,在控制應(yīng)對(duì)新冠疫情時(shí),不僅生物醫(yī)學(xué)起到了至關(guān)重要的作用,人工智能和大數(shù)據(jù)技術(shù)發(fā)揮的助益同樣不可忽視。
大數(shù)據(jù)平臺(tái)通過搜集分析手機(jī)信令數(shù)據(jù)、居民出行記錄等信息,可以對(duì)傳染病時(shí)空傳播過程進(jìn)行城市級(jí)別的高分辨率模擬與預(yù)測(cè),以及進(jìn)行本地家庭、社區(qū)人群中傳播效能、傳播規(guī)律和驅(qū)動(dòng)因素的研究等。同時(shí),AI提高了生物醫(yī)學(xué)行業(yè)的數(shù)據(jù)挖掘能力,助力研究新型冠狀病毒2019-nCoV動(dòng)物宿主朔源、和分子遺傳變異規(guī)律,以及加速新冠疫苗研發(fā)等??梢哉f,生物醫(yī)學(xué)已經(jīng)進(jìn)入了大數(shù)據(jù)時(shí)代。
生物醫(yī)學(xué)發(fā)展面臨的大數(shù)據(jù)挑戰(zhàn)
雖然人工智能應(yīng)用于生物醫(yī)學(xué)領(lǐng)域已逐漸成為行業(yè)前沿探索的方向,并且取得了許多突破性成果,但當(dāng)醫(yī)療數(shù)據(jù)的數(shù)量級(jí)升至“海量”時(shí),所面臨的挑戰(zhàn)也將出現(xiàn)幾何倍數(shù)的增長。
首先,在生物醫(yī)學(xué)實(shí)踐中,目前已存有海量的臨床、遺傳和行為學(xué)數(shù)據(jù),并且這些數(shù)據(jù)每日還在持續(xù)新增?,F(xiàn)今醫(yī)療大數(shù)據(jù)所涉及的資料規(guī)模,已經(jīng)巨大到無法通過目前主流的軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理,并整理成為幫助決策的資訊。因此,雖然上述數(shù)據(jù)蘊(yùn)藏著巨大的應(yīng)用價(jià)值,但如何高速有效地處理醫(yī)療大數(shù)據(jù),成為了人工智能領(lǐng)域計(jì)算機(jī)科學(xué)家必須克服的挑戰(zhàn)。
其次,醫(yī)療大數(shù)據(jù)與其他領(lǐng)域的數(shù)據(jù)相比,還有幾點(diǎn)會(huì)對(duì)數(shù)據(jù)獲取、處理產(chǎn)生阻礙的特征。如在醫(yī)療實(shí)踐中產(chǎn)生的數(shù)據(jù)的模態(tài)種類繁多,包括但不限于純數(shù)據(jù)、信號(hào)、圖像、文字、動(dòng)畫、語音、視頻等。此外,患者就診、疾病的病程以及疾病的檢查具有時(shí)序性,處理時(shí)必須注意先后順序。而上述數(shù)據(jù)還可能存在因人工記錄、數(shù)據(jù)偏差、人為原因或未確診所導(dǎo)致的數(shù)據(jù)殘缺或不確定性表述,以及在海量就診數(shù)據(jù)中產(chǎn)生的冗余甚至相互矛盾的信息等。因此,在使用這些數(shù)據(jù)前,計(jì)算機(jī)科學(xué)家必須運(yùn)用人工智能技術(shù)對(duì)其進(jìn)行篩選和標(biāo)準(zhǔn)化處理。
最后,人工智能在生物醫(yī)學(xué)領(lǐng)域的應(yīng)用還將面臨硬件與軟件的雙重考驗(yàn)。硬件上,人工智能時(shí)代是拼硬件的時(shí)代,存儲(chǔ)與處理海量數(shù)據(jù)都需要極大的算力支撐;而軟件則反映在計(jì)算機(jī)科學(xué)家身上,由于生物醫(yī)學(xué)的準(zhǔn)入門檻較高,他們不僅要對(duì)人工智能和大數(shù)據(jù)等領(lǐng)域的技能熟練掌握運(yùn)用,還必須對(duì)醫(yī)療大數(shù)據(jù)所涉及的生物醫(yī)學(xué)專業(yè)知識(shí)有著準(zhǔn)確深刻的理解。
簡(jiǎn)而言之,人工智能和大數(shù)據(jù)雖然已經(jīng)開始應(yīng)用于人類生命研究和健康管理的多個(gè)階段,但若想進(jìn)一步挖掘其潛藏的價(jià)值,還需跨越眾多挑戰(zhàn)。
第三代AI系統(tǒng)助力生物醫(yī)學(xué)大數(shù)據(jù)研究
第一代AI系統(tǒng)是知識(shí)驅(qū)動(dòng),即用機(jī)器來描述人類的知識(shí),但人的知識(shí)是有限的,基于現(xiàn)有的知識(shí)可能無法有效地發(fā)現(xiàn)細(xì)微的邏輯、未知的規(guī)律等。而第二代AI系統(tǒng)則是數(shù)據(jù)驅(qū)動(dòng),可以利用深度學(xué)習(xí)找到數(shù)據(jù)背后的函數(shù)關(guān)系,然而容易受到網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜程度的影響,出現(xiàn)欠擬合或過擬合現(xiàn)象。因此,將上述兩代AI系統(tǒng)進(jìn)行有機(jī)結(jié)合,形成了第三代AI系統(tǒng),在知識(shí)上擁有邏輯推理能力,可以舉一反三,同時(shí)在數(shù)據(jù)上擁有歸納能力,可以舉十反一。
在應(yīng)對(duì)上文所述的挑戰(zhàn)時(shí),第三代AI系統(tǒng)將憑借其技術(shù)優(yōu)勢(shì),從知識(shí)嵌入、多模態(tài)數(shù)據(jù)融合以及結(jié)果解釋等關(guān)鍵技術(shù)上進(jìn)行突破。
所謂“知識(shí)嵌入”是指通過數(shù)據(jù)增強(qiáng)、損失項(xiàng)正則化、知識(shí)圖譜等方式將先驗(yàn)知識(shí)注入人工智能,讓機(jī)器以類似人腦的方式學(xué)習(xí),減少必須的訓(xùn)練數(shù)據(jù)量以提升準(zhǔn)確率。以下圖為例,當(dāng)沒有先驗(yàn)知識(shí)注入時(shí),人工智能無法準(zhǔn)確識(shí)別人形,但當(dāng)注入”天是藍(lán)色、云是白色、人臉是黃色、樹是綠色“等基本的先驗(yàn)知識(shí)后,識(shí)別準(zhǔn)確率有了顯著提升。
而“多模態(tài)數(shù)據(jù)融合”是指將各類形式的數(shù)據(jù)信息,在融合處理后進(jìn)行綜合分析。以自閉癥檢測(cè)為例,將行為學(xué)、分析遺傳學(xué)、影像學(xué)等生物醫(yī)學(xué)大數(shù)據(jù)進(jìn)行分析處理,得到相關(guān)的人工智能基礎(chǔ)算法和共性技術(shù)。而后將行為學(xué)維度的自閉癥監(jiān)測(cè)、基因領(lǐng)域的疾病關(guān)聯(lián)分析以及MRI影像領(lǐng)域的人工智能分析的結(jié)果進(jìn)行有機(jī)結(jié)合,最終形成一套多模態(tài)融合分析技術(shù)和院外到院內(nèi)的逐級(jí)篩查策略。
第三項(xiàng)“結(jié)果解釋”技術(shù)則是指人工智能在生物醫(yī)學(xué)領(lǐng)域,不僅要能判斷是非對(duì)錯(cuò),還要找到背后的原因和邏輯。以蛋白質(zhì)相關(guān)的研究為例,未來通過人工智能,不僅可以知道什么條件可能決定哪種蛋白質(zhì)結(jié)構(gòu),也能知道什么條件會(huì)決定不可能的蛋白質(zhì)結(jié)構(gòu),以及蛋白質(zhì)結(jié)構(gòu)是由哪個(gè)氨基酸的變化所引起的等信息,由此減少生物實(shí)驗(yàn)的次數(shù),提升研究效率。
人工智能、大數(shù)據(jù)等技術(shù)將對(duì)生物醫(yī)學(xué)發(fā)展產(chǎn)生巨大影響,已逐漸成為行業(yè)共識(shí)。目前這些技術(shù)所引發(fā)的醫(yī)療突破,僅僅只是開始。未來,我們可以期待,在更多前沿技術(shù)的助力下,實(shí)現(xiàn)疾病預(yù)測(cè)、精準(zhǔn)醫(yī)療等創(chuàng)想。
聯(lián)系客服