NVIDIA年度盛會GTC2019在蘇州金雞湖畔緩緩落幕。舞臺上的黃仁勛今年沒有拿出過多的硬件,走上了少而精的路子。很明顯,NVIDIA將2019年中更多的時間與精力放在軟件開拓之上,已有的硬件已足夠強(qiáng)勁,NVIDIA希望能讓開發(fā)者們更高效地利用手上的武器。
在醫(yī)療領(lǐng)域,現(xiàn)階段的NVIDIA將自己定義為醫(yī)療AI開發(fā)者的助手,簡單地說,NVIDIA沒有直接參與醫(yī)療相關(guān)應(yīng)用的研發(fā),而是開發(fā)了一系列工具包,以供醫(yī)學(xué)AI開發(fā)者更好地利用數(shù)據(jù),
在這一方向,NVIDIA幾乎將所有的成果都放在了NVIDIA Clara平臺之中。從現(xiàn)有的應(yīng)用來看,這個平臺的主要功能為幫助醫(yī)學(xué)影像與基因組學(xué)的研究者解決數(shù)據(jù)和算力上的問題。
NVIDIA CLARA結(jié)構(gòu)
如何幫助醫(yī)療AI開發(fā)者獲取更多有效數(shù)據(jù)?
醫(yī)學(xué)影像是NVIDIA Clara的主要作用領(lǐng)域,其工具包的功能包括提供遷移學(xué)習(xí)、聯(lián)邦學(xué)習(xí)、實時影像等,這里主要介紹深度學(xué)習(xí)自動化、聯(lián)邦學(xué)習(xí)以及NVIDIA在PACS系統(tǒng)優(yōu)化上的工作。
1、深度學(xué)習(xí)自動化
深度學(xué)習(xí)剛剛興起時,人工智能企業(yè)能夠獲得的醫(yī)療數(shù)據(jù)遠(yuǎn)稱不上大數(shù)據(jù)。但隨著醫(yī)學(xué)AI企業(yè)逐漸入駐醫(yī)院,通過臨床和科研的方式,人工智能企業(yè)獲得了更多的脫敏數(shù)據(jù)。
問題也隨之而來,很多企業(yè)每日處理的影像數(shù)據(jù)可達(dá)數(shù)萬甚至十萬例,但要讓AI知曉自己的判斷是否正確,或是增加AI算法的精度,研究人員必須讓AI處理更多處理過的數(shù)據(jù)。
從現(xiàn)在的市場來看,一般AI企業(yè)選擇從醫(yī)院尋找剛畢業(yè)的研究生進(jìn)行勾畫,其成本在每組數(shù)據(jù)20-30元,實習(xí)生處理一組低層數(shù)據(jù)通常需要20-40分鐘,若要使勾畫更精細(xì),則需花費1-2小時時間。
這種數(shù)據(jù)獲取方式存在兩個重要問題,一時人工智能訓(xùn)練需要數(shù)據(jù)量大,企業(yè)很難找到足夠多的實習(xí)生進(jìn)行勾畫,成本也非常高昂;其次,影像的勾畫通常對工作人員的資歷要求較為嚴(yán)格,實習(xí)生常常會出現(xiàn)結(jié)節(jié)遺漏、勾畫錯誤等現(xiàn)象,通過這種方式獲得的數(shù)據(jù)對企業(yè)沒有太多價值。
從這一需求出發(fā),NVIDIA在Clara中植入了深度學(xué)習(xí)自動化的組件,開發(fā)者可直接使用這一組件對醫(yī)學(xué)影像進(jìn)行勾畫。
NVIDIA的實驗數(shù)據(jù)顯示,應(yīng)用這一工具包后,單個肺結(jié)節(jié)的時間可降至8-15分鐘,醫(yī)生的勾畫效率可提升4-8倍。此外,通過粗略計算,胰腺的勾畫速度可提升4倍,脾的勾畫速度可以提升10倍。
2、聯(lián)邦學(xué)習(xí)
NVIDIA的聯(lián)邦學(xué)習(xí)算法應(yīng)用領(lǐng)域非常寬泛,自動駕駛、醫(yī)療等場景均是聯(lián)邦學(xué)習(xí)應(yīng)用的重要場景。
醫(yī)療數(shù)據(jù)的安全性不言而喻,很多醫(yī)院即便允許開發(fā)者使用他們提供的脫敏數(shù)據(jù),也不允許數(shù)據(jù)離開醫(yī)院。這導(dǎo)致AI開發(fā)者每進(jìn)入一個醫(yī)院便能生成一個模型,但由于數(shù)據(jù)的不統(tǒng)一,導(dǎo)致不同模型的魯棒性非常差,難以應(yīng)用于臨床。
聯(lián)邦學(xué)習(xí)要解決的便是上述問題。雖然數(shù)據(jù)不能出院,但是模型可以出院,那么我們能否直接將模型融合起來呢?答案是可以的。聯(lián)邦學(xué)習(xí)算法的實質(zhì)便是將不同的模型融合,以實現(xiàn)在醫(yī)院不出院的情況下多個模型的統(tǒng)一。
在模型的融合過程中,NVIDIA采用了一種特殊的加密方式,確保各個模型中的數(shù)據(jù)不被泄漏。
通過一個13個用戶組的融合實驗,NVIDIA得到了上圖結(jié)果。圖中的紅線是使用一個深度學(xué)習(xí)模型生成的算法準(zhǔn)確率變化情況,綠線是聯(lián)邦學(xué)習(xí)下,13個模型融合后的算法準(zhǔn)確率變化情況,可以發(fā)現(xiàn)隨著數(shù)據(jù)的增加,兩條曲線高度重合,這個實驗一定程度上證明了聯(lián)邦學(xué)習(xí)的可用性。
不過,新的問題也在不斷出現(xiàn)。如果各個模型差異很大,那么聯(lián)邦學(xué)習(xí)如何自行“去粗取精”呢?“增量學(xué)習(xí)”將是NVIDIA下一步研究的重點內(nèi)容。
3、醫(yī)院部署
為了提高醫(yī)院PACS系統(tǒng)的效率,NVIDIA開發(fā)了一個PACS系統(tǒng)優(yōu)化組件,能夠讓原始圖片在轉(zhuǎn)化為DICOM格式前便經(jīng)過AI進(jìn)行增強(qiáng)、重建,以在PACS系統(tǒng)中生成更為高質(zhì)量的數(shù)據(jù)。Clara Deployment具體的結(jié)構(gòu)如下圖所示。
原始數(shù)據(jù)的影像增強(qiáng)的應(yīng)用很多,那么Clara Deployment有什么不同之處?一位影像科醫(yī)生告訴動脈網(wǎng)記者,NVIDIA和飛利浦的不同之處在于他們處理影像圖片的環(huán)節(jié)不同,飛利浦的影像處理系統(tǒng)作用于PACS Router之前,即是在影像生成時便進(jìn)行了增強(qiáng)處理,而Clara Deployment的處理較為滯后,不依賴于影像設(shè)備本身的圖像處理技術(shù)。
原始影像數(shù)據(jù)進(jìn)入PACS流程
解決基因組分析瓶頸:GPU加速GATK
自2003年首次對人類基因組進(jìn)行測序以來,整個基因組測序流程的成本就一直在下降,而且下降的速度遠(yuǎn)快于根據(jù)摩爾定律所預(yù)測的速度。從新生兒基因組測序到開展全國人口基因組計劃,該領(lǐng)域正在蓬勃發(fā)展,并且日趨個體化。
測序技術(shù)的進(jìn)步引發(fā)了基因組數(shù)據(jù)的爆炸式增長。序列數(shù)據(jù)總量每七個月增加一倍。這一驚人的速度可能會使得到2025年基因組學(xué)產(chǎn)生的數(shù)據(jù)量比其他大數(shù)據(jù)源(例如天文學(xué)、Twitter和 YouTube)數(shù)據(jù)量總和的10倍還多,達(dá)到兩位數(shù)的艾字節(jié)。
各種新的測序系統(tǒng),比如全球最大的基因組學(xué)研究集團(tuán)——華大集團(tuán)的DNBSEQ-T7等正在推動這項技術(shù)的廣泛應(yīng)用。該系統(tǒng)每天可以生成高達(dá)60個基因組,相當(dāng)于6TB字節(jié)的數(shù)據(jù)。
憑借華大集團(tuán)的流動池技術(shù)的發(fā)展以及一對NVIDIA V100 Tensor Core GPU所提供的加速,DNBSEQ-T7的測序速度提高了50倍,令其成為迄今為止吞吐量最高的基因組測序器。
但測序的加速工作遠(yuǎn)沒有結(jié)束,科學(xué)家在觀察更加微觀的世界時提出了新的需求。為了滿足這樣的需求,NVIDIA也在不斷探索。
本次GTC大會上發(fā)布的NVIDIA Parabricks基因組分析包便是為了讓人們更加了解分子世界。
Parabricks是一個CUDA加速的基因處理工具包,可用于發(fā)現(xiàn)變異,并能產(chǎn)生與行業(yè)標(biāo)準(zhǔn)GATK最佳時間流程一致的結(jié)果。運(yùn)用這個工具包,相關(guān)計算可提升30-50倍,并可利用深度學(xué)習(xí)進(jìn)行基因變異檢測。
NVIDIA Parabricks GPU加速的GATK
如今,華大基因已經(jīng)開始使用Parabricks。若借助若干GPU服務(wù)器,華大基因可以按其測序儀生成數(shù)據(jù)的速率來處理基因組。
總結(jié)
從整個GTC來看,NVIDIA對于醫(yī)學(xué)的投入不算多,許多應(yīng)用并非專門針對醫(yī)療進(jìn)行開發(fā),而是通過遷移的方式生成。
不過這并不妨礙NVIDIA為醫(yī)學(xué)人工智能發(fā)展提供動力。無論是聯(lián)邦學(xué)習(xí)、自動化深度學(xué)習(xí)還是基因處理加速,NVIDIA所解決的都是行業(yè)最基礎(chǔ)同時最需要解決的問題。
回顧整個大會與會后的采訪環(huán)節(jié),“The more you buy,the more you save”是黃仁勛說過的最多的一句話,但在醫(yī)學(xué)影像與分子領(lǐng)域,NVIDIA能夠帶來的,也許是“The more you buy,the more you see”。
對該公司感興趣的朋友請聯(lián)系融資助手小云:DongMai_Investent
*文中圖片由受訪企業(yè)提供。
文 | 趙泓維
微信 | qq850860074
添加時請注明:姓名-公司-職位
網(wǎng)站、公眾號等轉(zhuǎn)載請聯(lián)系授權(quán)
投稿請聯(lián)系微信:q19930797
★ 【首發(fā)】企鵝杏仁構(gòu)建醫(yī)療“城市模型”,大手筆收購25家診所 ★ 我們調(diào)研超過30家醫(yī)療AI影像企業(yè),2020年的產(chǎn)業(yè)發(fā)展方向在這里 ★ 我們調(diào)研超過30家醫(yī)療AI影像企業(yè),2020年的產(chǎn)業(yè)發(fā)展方向在這里 ★ 蓋茨基金會、BMS、武田、諾和諾德紛紛涉足,微生物藥已經(jīng)這么火了? ★ 在進(jìn)口替代大背景下,國產(chǎn)血管介入耗材如何提高市場話語權(quán)? ★ 3家上市,醫(yī)美頭部資產(chǎn)稀缺,企業(yè)尋求實在的業(yè)務(wù)增長和利潤曲線 ★ 產(chǎn)業(yè)迎來上市熱潮,7款國產(chǎn)重磅藥品接連獲批,創(chuàng)新藥回歸常態(tài)發(fā)展 ★ 互聯(lián)網(wǎng)醫(yī)院:政策明確,269家已建成、超100家新企業(yè)參與,生態(tài)逐漸完善
聯(lián)系客服