AI for Science:用人工智能催化一場(chǎng)新的“科學(xué)革命”
來(lái)源:36氪
AI發(fā)展七十余年,每一技術(shù)性突破都將給人類未來(lái)開辟新一種可能性。而它與科學(xué)研究的深度融合,則會(huì)裂變出無(wú)數(shù)或無(wú)窮種可能性。
萬(wàn)眾矚目下,今年10月,有著諾貝爾獎(jiǎng)“嫡傳”之稱的諾貝爾化學(xué)獎(jiǎng)終于揭曉,授予了對(duì)“鏈接化學(xué)和生物正交化學(xué)的發(fā)展作出了貢獻(xiàn)”的三位化學(xué)家,他們分別是美國(guó)化學(xué)家Carolyn R. Bertozzi、丹麥化學(xué)家Morten Meldal、美國(guó)化學(xué)家K. Barry Sharpless。
實(shí)際上,靴子落地前,關(guān)于這一獎(jiǎng)項(xiàng)到底花落誰(shuí)家引起了無(wú)數(shù)熱議。其中國(guó)際化學(xué)領(lǐng)域權(quán)威期刊《Chemical Reviews》就曾對(duì)該獎(jiǎng)獲得者進(jìn)行了讀者投票預(yù)測(cè),帶領(lǐng)DeepMind團(tuán)隊(duì)開發(fā)出能夠精準(zhǔn)預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的AlphaFold 2的John Jumper獲得了最高票數(shù)。
盡管由于“時(shí)間問題”,最終John Jumper并未折桂,但在此之前,John Jumper團(tuán)隊(duì)已成功拿到了另一個(gè)堪稱“豪華版諾貝爾獎(jiǎng)”、“科學(xué)界的奧斯卡”的獎(jiǎng)項(xiàng)——2023年生命科學(xué)突破獎(jiǎng)(Breakthrough Prize in Life Sciences),這是迄今科研領(lǐng)域里獎(jiǎng)金最高的生物學(xué)及醫(yī)學(xué)獎(jiǎng)項(xiàng)。
為何John Jumper及其領(lǐng)導(dǎo)開發(fā)的AlphaFold會(huì)收獲如此多的青睞?主要原因在于,AlphaFold的誕生解決了困擾生物學(xué)界半個(gè)多世紀(jì)的經(jīng)典難題,即1972年諾貝爾化學(xué)獎(jiǎng)得主Christian Anfinsen提出的蛋白折疊問題(Protein Folding Problem)——“蛋白質(zhì)的氨基酸序列應(yīng)該能完全決定其結(jié)構(gòu)”。
John Jumper團(tuán)隊(duì)開創(chuàng)性地利用人工智能技術(shù),終于破解了這一著名猜想,不僅讓蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的研究走入一個(gè)新階段,也將人們對(duì)“AI for Science(科學(xué)智能)”的關(guān)注推向高潮。
簡(jiǎn)單來(lái)說(shuō),AI for Science就是讓人工智能利用自身強(qiáng)大的數(shù)據(jù)歸納和分析能力去學(xué)習(xí)科學(xué)規(guī)律和原理,得出模型來(lái)解決實(shí)際的科研問題,特別是輔助科學(xué)家在不同的假設(shè)條件下進(jìn)行大量重復(fù)的驗(yàn)證和試錯(cuò),從而大大加速科研探索的進(jìn)程,如今這一方法已在多個(gè)前沿科學(xué)領(lǐng)域中取得了顯著的成果。
與大家此前耳熟能詳且觸手可及的人工智能應(yīng)用相比,AI for Science所涉及的生物制藥、能源、材料研發(fā)等科研領(lǐng)域盡管離大眾生活看似遙遠(yuǎn),但其背后的共同之處在于,利用人工智能來(lái)“解放”生產(chǎn)力——讓人們能夠從許多重復(fù)性、機(jī)械化的基礎(chǔ)工作中釋放出來(lái),在人工智能的輔助下進(jìn)行更高效的生產(chǎn)工作。這正是人工智能的價(jià)值和魅力所在。
AI for Science:用人工智能催化一場(chǎng)新的“科學(xué)革命”
讓我們回到AlphaFold,從解析蛋白質(zhì)的技術(shù)演進(jìn),來(lái)觀察AI的加入到底能給科研帶來(lái)怎樣的顛覆。
作為生命的物質(zhì)基礎(chǔ),蛋白質(zhì)與生命及各種生命活動(dòng)有著極其緊密的聯(lián)系,包括人體所有疾病的發(fā)生幾乎都與蛋白質(zhì)功能異常有關(guān)。換句話說(shuō),如果能人為地激發(fā)或抑制蛋白靶標(biāo),“控制”蛋白質(zhì)的結(jié)構(gòu)和功能,就能夠大大加速對(duì)疑難雜癥的靶向藥物和高效療法的研發(fā)。
在過去,生物學(xué)家們?cè)鴱V泛使用X射線衍射、冷凍電子顯微鏡等實(shí)驗(yàn)技術(shù)來(lái)破譯蛋白質(zhì)的三維結(jié)構(gòu),這類方法耗時(shí)長(zhǎng)且成本高。因此從1994年開始,多支科研團(tuán)隊(duì)在兩年一屆的國(guó)際蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)競(jìng)賽(CASP,Critical Assessment of protein Structure Prediction)上施展拳腳,并由此催生了I-TESSER、RaptorX、RoseTTAFold等蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)模型。
但是問題也隨之而來(lái),這些大部分用計(jì)算機(jī)基于理論預(yù)測(cè)的蛋白質(zhì)結(jié)構(gòu)模型,其實(shí)與實(shí)際觀測(cè)到的實(shí)驗(yàn)數(shù)據(jù)相去甚遠(yuǎn),正確率不足40%。其后續(xù)發(fā)展需要持續(xù)提高預(yù)測(cè)模型的精度,以無(wú)限縮小預(yù)測(cè)結(jié)構(gòu)和實(shí)驗(yàn)誤差。
不僅如此,從蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)推進(jìn)到藥物研發(fā)環(huán)節(jié),不同藥物設(shè)計(jì)方法的原理和應(yīng)用場(chǎng)景也有著極大差異。例如在制藥流程中,從前端的靶點(diǎn)發(fā)現(xiàn)、先導(dǎo)化合物的篩選優(yōu)化,再到后期ADMET預(yù)測(cè)、甚至臨床效果預(yù)測(cè)等多個(gè)環(huán)節(jié),都面臨著獨(dú)特的技術(shù)挑戰(zhàn)。在這個(gè)過程中,研究人員必須要進(jìn)行高通量的重復(fù)性實(shí)驗(yàn),甚至要花費(fèi)多年的時(shí)間,驗(yàn)證次數(shù)也高達(dá)數(shù)百萬(wàn)次。
而今,回看這個(gè)半世紀(jì)以來(lái)令無(wú)數(shù)學(xué)者著迷卻又難以跨越的難題,不過是科研領(lǐng)域延綿壁壘中的冰山一角。而成熟的AI技術(shù)與科研領(lǐng)域及多學(xué)科交叉融合誕生的“AI for Science”,無(wú)疑給這個(gè)難題以及人類在科學(xué)無(wú)人區(qū)的更多探索帶來(lái)了全新的可能性。
從2020年開始,AI for Science進(jìn)入了集中爆發(fā)的發(fā)展階段,其中就包括了AlphaFold項(xiàng)目,其最新成果——由DeepMind在2021年發(fā)布的AlphaFold 2,已能成功預(yù)測(cè)98.5%的人類蛋白質(zhì)三維結(jié)構(gòu),且預(yù)測(cè)結(jié)果與大部分蛋白質(zhì)的真實(shí)結(jié)構(gòu)只相差一個(gè)原子的寬度,可達(dá)到以往通過冷凍電子顯微鏡等復(fù)雜實(shí)驗(yàn)觀察預(yù)測(cè)的水平。
類似于生命科學(xué)領(lǐng)域,分子動(dòng)力學(xué)領(lǐng)域也出現(xiàn)了影響力同樣顯著的DeePMD-kit項(xiàng)目,其通過利用機(jī)器學(xué)習(xí)、高性能計(jì)算技術(shù)與物理建模相結(jié)合,能夠?qū)⒎肿觿?dòng)力學(xué)的極限提升至10億原子規(guī)模,同時(shí)保持高精度,大大解決了傳統(tǒng)分子動(dòng)力學(xué)中“快而不準(zhǔn)”、“準(zhǔn)而不快”的難題。
還有在氣象預(yù)測(cè)領(lǐng)域,基于新型算子學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型FourCastNet,能夠?qū)⑻鞖忸A(yù)報(bào)提速45000倍;在工業(yè)領(lǐng)域的流體、結(jié)構(gòu)等PDE方程求解方面,也已證實(shí)基于數(shù)據(jù)+物理機(jī)理融合的AI方法,是解決復(fù)雜高維物理問題的突破口……
一言以蔽之,無(wú)論是今年爆火的AI繪畫、AI對(duì)話模型ChatGPT等AI應(yīng)用,亦或是大量AI for Science領(lǐng)域的項(xiàng)目案例,都足以證明AI正在為各個(gè)行業(yè)、領(lǐng)域帶來(lái)了一場(chǎng)范式革新。但AI for Science更重要的意義在于,其對(duì)前沿科研所施加的加速作用,將對(duì)人類社會(huì)和經(jīng)濟(jì)發(fā)展有著更為基礎(chǔ),也更為深遠(yuǎn)的影響。
而且,AI for Science的應(yīng)用也不僅僅局限于依據(jù)已知科學(xué)原理來(lái)高效驗(yàn)證或試錯(cuò),它也讓更多科研人員能夠基于AI在更復(fù)雜的場(chǎng)景中做探索,結(jié)合數(shù)據(jù)反推復(fù)雜場(chǎng)景下更為準(zhǔn)確的物理規(guī)律。
毫不夸張地說(shuō),人工智能將成為科學(xué)家繼計(jì)算機(jī)之后的全新生產(chǎn)工具,同時(shí)也正在催化一場(chǎng)新的“科學(xué)革命”。
跨越落地壁壘,從深度學(xué)習(xí)框架出發(fā)
但從暢想回歸現(xiàn)實(shí),人工智能行業(yè)想要獲得長(zhǎng)足發(fā)展,真正成為人類新的生產(chǎn)工具,必然要跨過落地這道關(guān)卡。而AI for Science所具備的全面、深層次革新價(jià)值,亦讓它面臨遠(yuǎn)高于人們常見AI應(yīng)用的落地壁壘。
主要原因在于,AI for Science的落地應(yīng)用需要大量的工業(yè)場(chǎng)景數(shù)據(jù)支持,以及合理的科學(xué)機(jī)理等效,而且高維、海量的數(shù)據(jù)也對(duì)算力和內(nèi)存提出了更高的要求??偟膩?lái)看,目前AI for Science落地應(yīng)用的最大壁壘主要體現(xiàn)在數(shù)據(jù)、平臺(tái)技術(shù)、軟硬協(xié)同、領(lǐng)域求解能力和優(yōu)秀研發(fā)生態(tài)上。
從數(shù)據(jù)角度,工業(yè)場(chǎng)景的數(shù)據(jù)維度高、格式繁雜且存在孤島現(xiàn)象,同時(shí)由于隱私和法律上的一些限制,部分?jǐn)?shù)據(jù)很難實(shí)現(xiàn)公開共享。因此如何高效治理這些多特征、多來(lái)源的數(shù)據(jù),解決小樣本、零樣本數(shù)據(jù)建模,是當(dāng)前AI在科研領(lǐng)域落地的基礎(chǔ)。
從軟硬件協(xié)同角度,AI for Science的發(fā)展既離不開深度學(xué)習(xí)框架的支持,也無(wú)法脫離底層高性能硬件的支撐。一方面,AI for Science需要更加科學(xué)地求解真實(shí)物理問題,如高階PDE方程組的求解,以及數(shù)據(jù)+物理機(jī)理驅(qū)動(dòng)的模型開發(fā)。另一方面,傳統(tǒng)的科學(xué)計(jì)算中心已廣泛支持各類科研任務(wù),在其持續(xù)增加智能計(jì)算硬件能力的同時(shí),也需要科學(xué)計(jì)算/智算硬件與AI開發(fā)框架深度整合,支持各類新型AI for Science計(jì)算場(chǎng)景并達(dá)到性能領(lǐng)先。
從研發(fā)生態(tài)角度,AI for Science作為一個(gè)充分體現(xiàn)交叉學(xué)科的新興科研范式,涉及生物學(xué)、分子動(dòng)力學(xué)、計(jì)算流體力學(xué)、固體力學(xué)等學(xué)科,需要大量的跨領(lǐng)域科研人才,且不斷擴(kuò)展的開源生態(tài)庫(kù)要與傳統(tǒng)數(shù)據(jù)集模擬軟件、數(shù)據(jù)集打通,才能滿足研發(fā)人員對(duì)開發(fā)工具鏈的需求,逐步形成穩(wěn)定且優(yōu)質(zhì)的科研生態(tài)。
為了跨越這些壁壘,拉低AI for Science的應(yīng)用門檻,產(chǎn)、學(xué)、研各界的科學(xué)家、企業(yè)們都開始踏上了AI for Science的范式革新+普惠之路。
在深度學(xué)習(xí)框架領(lǐng)域,國(guó)外如TensorFlow、PyTorch、MXNet等AI框架,自誕生以來(lái)就一直在幫助眾多科學(xué)家和工程師進(jìn)行學(xué)術(shù)研究及工程實(shí)現(xiàn),大大促進(jìn)了AI領(lǐng)域的發(fā)展。作為國(guó)內(nèi)AI領(lǐng)域的先行者,百度也憑借百度飛槳(PaddlePaddle)從2016年打響國(guó)產(chǎn)AI框架開源第一槍,并一路朝著全面AI技術(shù)布局演進(jìn)。如今,飛槳平臺(tái)已能夠?qū)Ω黝愑布?shí)現(xiàn)廣泛適配,并能直接部署到大規(guī)模的科學(xué)計(jì)算集群,與已有的科學(xué)計(jì)算生態(tài)緊密融合,強(qiáng)力支撐AI for Science方案的部署與應(yīng)用。
同樣在2016年,向輝也開始在百度接觸AI行業(yè),隨后親身經(jīng)歷了AI在計(jì)算機(jī)視覺、自然語(yǔ)言處理、推薦等領(lǐng)域的技術(shù)應(yīng)用與快速更迭,如今她已成為百度飛槳AI for Science產(chǎn)品負(fù)責(zé)人。
向輝在接受36氪專訪時(shí)談到,面對(duì)AI for Science的落地挑戰(zhàn),百度飛槳認(rèn)為核心要解決的是構(gòu)建一個(gè)通用化的深度學(xué)習(xí)平臺(tái),能夠銜接下游的各種異構(gòu)算力,提供支持科學(xué)計(jì)算問題求解的API,以及編譯加速機(jī)制等,以更好支撐典型的科學(xué)計(jì)算場(chǎng)景建設(shè)和分析,如支持氣象預(yù)測(cè)、流體仿真、材料發(fā)現(xiàn)等領(lǐng)域問題?!巴瑫r(shí)也要建設(shè)可持續(xù)的、融合科研、科學(xué)計(jì)算、平臺(tái)以及終端用戶的開放生態(tài)?!彼f(shuō)。
為讓不同領(lǐng)域的科學(xué)工作者都可以靈活地使用當(dāng)下熱門的科研模型,早在2019年,百度飛槳就已開始嘗試在AI for Science領(lǐng)域進(jìn)行技術(shù)形態(tài)、產(chǎn)品路線等規(guī)劃,并在2020年初至2021年底相繼發(fā)布了生物計(jì)算平臺(tái)“螺旋槳PaddleHelix”、量子計(jì)算平臺(tái)“量槳PaddleQuantum”,以及面向流體、固體、電磁等領(lǐng)域的科學(xué)計(jì)算平臺(tái)“賽槳PaddleScience”。
此外,百度飛槳還提供了PINN、FNO、DeepONet等主流模型,以及用戶可直接復(fù)用的標(biāo)準(zhǔn)案例,如CFD中障礙物繞流、渦激振動(dòng)、達(dá)西流等。
百度飛槳還支持基于組件進(jìn)行定制化的問題復(fù)現(xiàn)與分析,支持?jǐn)?shù)據(jù)驅(qū)動(dòng)以及與物理機(jī)理相結(jié)合的多種方法,分別在物理仿真、化合物分子表征、量子糾纏處理等場(chǎng)景有了突破性的進(jìn)展。
其中,為了更好地服務(wù)廣大科學(xué)計(jì)算用戶對(duì)各類PDE方程的求解需求,百度飛槳也在積極實(shí)現(xiàn)與優(yōu)秀科學(xué)計(jì)算Repo-DeepXDE的全量模型支撐,目前已初步完成所有模型的精度對(duì)齊工作,并在百度飛槳最新的高階自動(dòng)微分機(jī)制、自動(dòng)化的分布式策略以及編譯加速機(jī)制等加持下,部分用例的求解效率已領(lǐng)先同類產(chǎn)品。
為進(jìn)一步推動(dòng)AI for Science的落地進(jìn)程,百度飛槳還與多家高校、科研機(jī)構(gòu)等開展了流體、材料、生物等方面的范例建設(shè),并形成了一些開放性的、多學(xué)科交叉的生態(tài)社區(qū)。今年5月還推出了“飛槳AI for Science共創(chuàng)計(jì)劃”,希望通過與各方一道進(jìn)行技術(shù)聯(lián)合開發(fā)、推廣資源共享,共建生態(tài)商機(jī)。
回想這些社區(qū)的發(fā)展經(jīng)歷,向輝對(duì)不少學(xué)生團(tuán)隊(duì)的項(xiàng)目記憶猶新。她回憶,其中北航有一個(gè)學(xué)生團(tuán)隊(duì)開展了一個(gè)真空羽流模擬實(shí)驗(yàn),實(shí)驗(yàn)本身需要在真空條件下,無(wú)法在地面上復(fù)現(xiàn),但通過飛槳AI for Science的產(chǎn)品,團(tuán)隊(duì)繁衍出了玻爾茲曼方程的一些系數(shù),最終達(dá)到了令人驚艷的效果?!斑@些案例都已證明,在某些場(chǎng)景中,百度飛槳的AI for Science能夠一定程度地解決開發(fā)者們的科研問題?!毕蜉x說(shuō)。
一路發(fā)展至今,百度飛槳AI for Science工具集已能支持AI方法與基礎(chǔ)學(xué)科方法交叉融合,最大的特點(diǎn)在于能突破基礎(chǔ)學(xué)科中“基于數(shù)值計(jì)算求解控制方程”面臨的維數(shù)高、時(shí)間長(zhǎng)、跨尺度、算力不足等挑戰(zhàn),將數(shù)值差分等效為“基于數(shù)據(jù)、物理機(jī)理驅(qū)動(dòng)的神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)”。
開辟AI for Science賽道,對(duì)百度飛槳來(lái)說(shuō)無(wú)疑是AI能力的又一次挑戰(zhàn)和躍升。在大幅加速科學(xué)問題求解的同時(shí),它也將為行業(yè)在探索更多未知科學(xué)問題的路上深踩油門。
平臺(tái)之下,底層算力賦能軟硬協(xié)同發(fā)展
正如前文所說(shuō),AI for Science的科學(xué)問題加速求解和產(chǎn)業(yè)落地,不僅需要框架或軟件平臺(tái)層面的支持,亦需要基礎(chǔ)設(shè)施提供強(qiáng)大算力和軟件優(yōu)化能力。
面向科學(xué)計(jì)算領(lǐng)域,有大量芯片廠商在圍繞如何提高AI算力,加速AI應(yīng)用落地做相應(yīng)布局。而英特爾正是這一賽道中頗具代表性的領(lǐng)軍企業(yè)之一,其一直以來(lái)都在致力于“讓AI無(wú)處不在”。
在英特爾人工智能架構(gòu)師楊威與36氪的訪談中,他從一家芯片企業(yè)的角度出發(fā),針對(duì)AI for Science這一領(lǐng)域給我們帶來(lái)了不一樣的視角和觀點(diǎn)。
楊威認(rèn)為,AI for Science普及的主要難點(diǎn)卡在如何降低AI硬件的成本,以及要有易于上手的AI軟件優(yōu)化工具。
他強(qiáng)調(diào):英特爾從第二代至強(qiáng)可擴(kuò)展處理器開始,實(shí)現(xiàn)了CPU內(nèi)置的AI加速。通過AVX-512和DL Boost等AI加速技術(shù),讓“用CPU跑AI”成為了可能。此舉的意義,在于能夠充分激活和利用部署更廣泛且成本優(yōu)勢(shì)更明顯的CPU的算力,在輸出絕大多數(shù)應(yīng)用所需的通用算力的同時(shí),還能通過對(duì)AI推理的加速推進(jìn)AI應(yīng)用的落地。同時(shí)英特爾還向公眾開源,即免費(fèi)提供各種AI軟件優(yōu)化工具,包括oneAPI、OpenVINO等,這些軟件的技術(shù)門檻與使用難度較低,且能幫助用戶釋放至強(qiáng)CPU的AI加速能力。
此外,考慮到AI for Science領(lǐng)域的模型或相似變體對(duì)內(nèi)存的消耗非常敏感,且對(duì)大內(nèi)存應(yīng)用來(lái)說(shuō)CPU平臺(tái)的計(jì)算資源通常會(huì)更具優(yōu)勢(shì),英特爾還有的放矢地的進(jìn)一步強(qiáng)化了這方面的能力——其與至強(qiáng)CPU搭檔的英特爾傲騰持久內(nèi)存,能提供遠(yuǎn)超主流DRAM的容量,更容易達(dá)成TB級(jí)內(nèi)存配置并擁有接近DRAM的性能。也就是說(shuō),它能夠在盡可能降低科學(xué)計(jì)算模型在整個(gè)鏈路上時(shí)延的同時(shí),突破限制AI for Science應(yīng)用的內(nèi)存容量瓶頸。
雖然在現(xiàn)階段,英特爾針對(duì)AI for Science等AI應(yīng)用的核心硬件布局是以CPU為主,加速的應(yīng)用類型也是以推理為主,但這只是其在XPU時(shí)代擴(kuò)展AI產(chǎn)品組合的第一步。在英特爾的“XPU愿景”里,隨著未來(lái)數(shù)據(jù)類型和應(yīng)用類型的高速增長(zhǎng)和裂變,其底層硬件架構(gòu)也將從CPU拓展到CPU與GPU、FPGA和AISC加速器俱全的XPU架構(gòu)。
基于這一策略,英特爾2023年不但會(huì)推出代號(hào)為Sapphire Rapids的第四代至強(qiáng)可擴(kuò)展處理器,還會(huì)發(fā)布可與這款CPU搭配,專攻科學(xué)計(jì)算及AI加速的、代號(hào)為Ponte Vecchio的數(shù)據(jù)中心GPU產(chǎn)品,并由此形成在AI推理上以高性價(jià)比、易獲取和使用的CPU為主,在AI訓(xùn)練上則以GPU為主的更完善布局。而且這種XPU組合還可借助oneAPI工具包實(shí)現(xiàn)對(duì)異構(gòu)硬件的統(tǒng)一編程和管理,具有靈活調(diào)配、無(wú)縫協(xié)作和高效易用等特點(diǎn)。
依托上述產(chǎn)品組合已經(jīng)或即將帶來(lái)的強(qiáng)大算力支持,英特爾從硬件到軟件多維度地為AI for Science提供了優(yōu)化,力求讓更多科研人員可以親自參與到開發(fā)和定制當(dāng)中,并實(shí)現(xiàn)科學(xué)智能的真正普及。在其持續(xù)的努力下,如今已有許多合作伙伴實(shí)現(xiàn)了產(chǎn)品落地。
例如在AI小分子藥物設(shè)計(jì)領(lǐng)域,英特爾與劑泰生物合作,在小分子藥物優(yōu)化方面實(shí)現(xiàn)了高通量的分子生成,有望在更大的化學(xué)空間中探索更多潛在的候選分子。在大分子藥物設(shè)計(jì)領(lǐng)域,英特爾則與百度飛槳、晶泰科技、上海交大等各大機(jī)構(gòu)和高校進(jìn)行了深入合作,基于AlphaFold 2實(shí)現(xiàn)了高通量和長(zhǎng)序列蛋白結(jié)構(gòu)預(yù)測(cè)推理的優(yōu)化,并在AlphaFold 2中引入了TB級(jí)內(nèi)存技術(shù),總體達(dá)到了降本增效。
其中,英特爾與百度飛槳也早在2017年就開始了以軟硬件協(xié)同優(yōu)勢(shì)為主的合作。隨著雙方在AI領(lǐng)域的持續(xù)布局,合作的廣度和深度也在不斷提升。例如,英特爾和百度飛槳致力于實(shí)現(xiàn)英特爾全棧軟硬件和飛槳的相互支持,通過oneAPI實(shí)現(xiàn)深度適配與性能優(yōu)化,并通過飛槳+OpenVINO等方式共建部署生態(tài)。
有意思的是,如今百度飛槳與英特爾在AI for Science領(lǐng)域達(dá)成合作,不僅與這些前序的合作有關(guān),也與開發(fā)者生態(tài)有著千絲萬(wàn)縷的關(guān)系。
長(zhǎng)期以來(lái),百度飛槳都在積極發(fā)展開發(fā)者生態(tài),如建設(shè)飛槳特殊興趣小組(PPSIG),希望通過開放的社區(qū)形式與全球開發(fā)者共同構(gòu)建一個(gè)開放、多元和架構(gòu)包容的生態(tài)體系。而英特爾的一位專家正巧是PPSIG-科學(xué)計(jì)算Science小組最早期的成員,曾積極參與了PaddlePaddle科學(xué)計(jì)算開源社區(qū)建設(shè),并且對(duì)分子動(dòng)力學(xué)模擬在生物蛋白分子和能源材料的應(yīng)用產(chǎn)生了濃厚興趣。
在這個(gè)契機(jī)下,雙方在AI for Science的合作也水到渠成。從2022年3月起,百度飛槳與英特爾結(jié)合各自實(shí)際,經(jīng)過多次討論交流,最終確定了任務(wù)方向與合作內(nèi)容,共同開展AI for Science在分子動(dòng)力學(xué)和生命科學(xué)領(lǐng)域的實(shí)質(zhì)性工作,并取得了一系列成果,包括:百度飛槳實(shí)現(xiàn)了國(guó)內(nèi)首個(gè)完成與傳統(tǒng)分子動(dòng)力學(xué)軟件LAMMPS以及AI勢(shì)函數(shù)訓(xùn)練軟件DeepMD-kit融合工作的AI深度學(xué)習(xí)框架,并基于英特爾oneAPI實(shí)現(xiàn)了從訓(xùn)練到推理全流程打通的“0到1”式突破性進(jìn)展;百度Helix Fold模型基于至強(qiáng)平臺(tái)的AVX-512、oneDNN和大內(nèi)存能力進(jìn)行優(yōu)化,不但實(shí)現(xiàn)了性能的顯著提升,還可輕松預(yù)測(cè)推理長(zhǎng)度超過4000,即超長(zhǎng)序列的蛋白質(zhì)結(jié)構(gòu)。
結(jié)語(yǔ):AI for Science的普惠之路,臨界點(diǎn)已近
一個(gè)是在深度學(xué)習(xí)領(lǐng)域深耕多年,已成長(zhǎng)為國(guó)內(nèi)開源AI框架一哥的百度飛槳,一個(gè)是科學(xué)計(jì)算領(lǐng)域Top級(jí)玩家英特爾,雙方正依托各自優(yōu)勢(shì)產(chǎn)品和對(duì)AI領(lǐng)域的持續(xù)布局,以靈活多樣的“組合拳”不斷拉低AI for Science的應(yīng)用門檻,共同朝著“讓AI無(wú)處不在,更加普惠千行百業(yè)”以及“讓合作貫穿產(chǎn)、學(xué)、研,助AI for Science打通理論、實(shí)驗(yàn)和產(chǎn)業(yè)應(yīng)用道路“的目標(biāo)持續(xù)推進(jìn)。
站在這個(gè)關(guān)鍵的時(shí)間節(jié)點(diǎn),我們?cè)俅位厮軦I發(fā)展的七十余年,或能更清晰地看到,它在每一個(gè)發(fā)展階段的爆發(fā),都在歷史長(zhǎng)河中砸出了創(chuàng)新的波紋,這些波紋終于在今天疊加成推動(dòng)產(chǎn)業(yè)變革的巨浪。正如今天的AI for Science,就正在一浪又一浪地驅(qū)動(dòng)著科研沖擊范式革新的臨界點(diǎn),身處其中的每一個(gè)參與者,都在抑制不住地暢想這種沖擊成功后將為人類未來(lái)開辟的可能性。
畢竟,這將是如核裂變鏈接反應(yīng)或寒武紀(jì)生命大爆發(fā)一樣的無(wú)窮種可能性。
聯(lián)系客服