人工智能不僅在互聯(lián)網(wǎng)和工業(yè)界被越來越多的提及,從物理學(xué)、社會(huì)學(xué)、天文學(xué)、醫(yī)學(xué)到化學(xué),人工智能也改變著科學(xué)界。
粒子物理學(xué)家們從上個(gè)世紀(jì)80年代就開始搗鼓人工智能。為了解宇宙的奧秘,粒子物理學(xué)家們需要粉碎亞原子粒子,同時(shí)用巨大的力量炸出新的異常物質(zhì)(物理學(xué)中,異常物質(zhì)指的是與普通物質(zhì)不同,具有奇異特性的物質(zhì)的統(tǒng)稱)。
比如,在2012年,科學(xué)家使用世界上最大的質(zhì)子對撞機(jī)發(fā)現(xiàn)了傳說中的希格斯玻色子。這顆稍縱即逝的粒子正是物理學(xué)家們解釋其他所有基本粒子如何獲得其質(zhì)量的關(guān)鍵。
然而,這種異常物質(zhì)很難定性。在對撞機(jī)中,大約每10億個(gè)質(zhì)子碰撞中才會(huì)出現(xiàn)一個(gè)希格斯玻色子,而且在十億分之一皮秒內(nèi),它會(huì)衰變成其他顆粒。
一次碰撞將在瞬間產(chǎn)生數(shù)量十分巨大的數(shù)據(jù),就像大海撈針,所以從數(shù)據(jù)中提取最多的有效信息非常重要。
機(jī)器學(xué)習(xí)尚未攻克這一領(lǐng)域。物理學(xué)家們?nèi)灾饕繉﹄[含物理學(xué)的理解來找出與新粒子相關(guān)的數(shù)據(jù)。但AI很可能變得愈來愈重要,在這一點(diǎn)上,機(jī)器學(xué)習(xí)對于能否跟上數(shù)據(jù)大潮至關(guān)重要。
算法如何分析大眾情緒
社交媒體每年數(shù)以十億計(jì)的用戶以及數(shù)以千億計(jì)的推特和帖子為社會(huì)科學(xué)帶來海量數(shù)據(jù)。
心理學(xué)家 Martin Seligman 認(rèn)識到這也為利用人工智能研究大眾傳播的走向提供了前所未有的機(jī)會(huì)。在賓夕法尼亞大學(xué)正面心理學(xué)中心進(jìn)行的世界福祉項(xiàng)目(World Well-Being Project)中,他與20 多位心理學(xué)家、醫(yī)生和計(jì)算機(jī)科學(xué)家使用機(jī)器學(xué)習(xí)和自然語言處理方法來篩選數(shù)據(jù),以檢測公眾身心健康狀況。
這通常是由調(diào)查問卷來完成的。這些數(shù)據(jù)當(dāng)然首先需要大量預(yù)處理,但 AI 同時(shí)也提供了強(qiáng)大的可視化工具。
在最近的一項(xiàng)研究中,Seligman和他的同事們對 29,000 位參與了抑郁自我評估的臉書用戶的日常更新進(jìn)行了跟蹤。使用其中的 28,000 個(gè)用戶的數(shù)據(jù),機(jī)器學(xué)習(xí)算法發(fā)現(xiàn)了更新所用的詞匯與抑郁水平之間的聯(lián)系。然后可以根據(jù)其更新內(nèi)容成功預(yù)測其他用戶的抑郁情況。
「語言與心理學(xué)的交叉分析注定會(huì)有一場革命?!沟轮荽髮W(xué)奧斯丁分校的社會(huì)心理學(xué)家 James Pennebaker 說,他關(guān)注的重點(diǎn)不是內(nèi)容而是行文風(fēng)格?!脯F(xiàn)在我們可以對你之前發(fā)布和撰寫過的所有內(nèi)容進(jìn)行分析?!筆ennebaker說,結(jié)果就是,「越來越多的圖片拼湊出一個(gè)原本的你?!?/span>
梳攏自閉癥基因
對于基因?qū)W家來說,自閉癥是一項(xiàng)惱人的挑戰(zhàn)。
遺傳圖譜表明它具有很強(qiáng)的先天性遺傳因素。但已知的在自閉癥中發(fā)揮一定作用的數(shù)十種基因的變體只能解釋約 20% 的病例的病因。在其他 25,000 種人類基因和相關(guān)DNA數(shù)據(jù)中找到其他的變體或許可以對完整解釋自閉癥有一定幫助。
但是基因?qū)W家們近期才意識到,基因并不是孤立的。它們的行為是由數(shù)百萬附近的非編碼基因聯(lián)合造成的,而且與 DNA 結(jié)合蛋白以及其他因素相互作用。識別哪些非編碼變體可能影響附近的自閉癥基因是比找到病變基因本身更難的問題,研究者們正在試圖用 AI 解決這個(gè)問題。
通達(dá)天意的機(jī)器
今年 4 月,天體物理學(xué)家Michael Schawinski在 Twitter 上發(fā)了幾張模糊的星系圖片,并問有沒有同仁能幫他區(qū)分出這四個(gè)星系。同事們說,這些圖像看起來很像與銀河類似的橢圓螺旋星系。
一些天文學(xué)家懷疑這是Schawinski的小把戲,直截了當(dāng)?shù)貑?,這些是真正的星系還是在計(jì)算機(jī)上模擬建模出來的?事實(shí)上都不是。瑞士蘇黎世理工學(xué)院的Schawinski,以及其他合作者,用對物理學(xué)一無所知的神經(jīng)網(wǎng)絡(luò)造出了這些星系。
Schawinski 只想通過這條 Twitter 來表明神經(jīng)網(wǎng)絡(luò)生成的東西有多么逼真。但他更大的目標(biāo)是創(chuàng)造一些類似電影中的技術(shù),可以神奇地使模糊的監(jiān)控圖像變得清晰。
神經(jīng)網(wǎng)絡(luò)可以使一張模糊的星圖看起來像是用一臺高性能望遠(yuǎn)鏡拍攝的,這也能夠讓天文學(xué)家從中觀測出更精細(xì)的細(xì)節(jié)。
這只是越來越多的天文學(xué)認(rèn)知的一部分。人工智能提供了一種強(qiáng)大的方法在 PB 級數(shù)據(jù)中查找和分類有趣的對象。 對Schawinski 來說,「我認(rèn)為這個(gè)時(shí)代真的會(huì)變成一個(gè)‘哦,上帝,數(shù)據(jù)太多了’的時(shí)代。」
神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)化學(xué)合成之道
有機(jī)化學(xué)家是一切向后看的專家。像大廚從考慮成品菜的樣子開始然后研究具體做菜步驟一樣,許多化學(xué)家從他們想要造的分子的合成開始,然后考慮如何組裝。
德國明斯特大學(xué)研究生賽格勒說:「你需要合適的食材和菜譜來組合它們?!顾推渌苏龑⑷斯ぶ悄芤胨麄兊姆肿訌N房。
他們寄望 AI 可以助其應(yīng)對分子生成的關(guān)鍵挑戰(zhàn):從數(shù)百個(gè)潛在的模塊中精挑細(xì)選,并連接以數(shù)千個(gè)化學(xué)規(guī)則。
幾十年來,化學(xué)家們嘔心瀝血地?cái)€出具有預(yù)裝響應(yīng)能力的計(jì)算機(jī),希望能夠創(chuàng)建一個(gè)能快速計(jì)算出最簡分子配方的系統(tǒng)。然而,塞格勒說,化學(xué)「非常微妙,二進(jìn)制很難覆蓋所有規(guī)則。」
所以塞格勒,明斯特大學(xué)的電腦科學(xué)家Mike Preuss 及其導(dǎo)師Mark Waller 都轉(zhuǎn)向了 AI 。他們通過深度神經(jīng)網(wǎng)絡(luò)模型替代了生硬快速的化學(xué)反應(yīng)規(guī)則進(jìn)行編程,從數(shù)百萬的例子中自行學(xué)習(xí)化學(xué)反應(yīng)的過程。
「提供的數(shù)據(jù)越多越好」賽格勒說。 隨著時(shí)間的推移,模型學(xué)會(huì)了預(yù)測合成所需步驟的最佳反應(yīng)。 最終,它可以從零開始自己制造分子。
三人用 40 個(gè)不同的分子測試了機(jī)器學(xué)習(xí)程序,將結(jié)果與傳統(tǒng)的分子生成程序進(jìn)行了比較。
即將前往倫敦制藥公司工作的塞格勒希望采用這種方法來改善制藥環(huán)節(jié)。
斯坦福大學(xué)的有機(jī)化學(xué)家Paul Wender表示,現(xiàn)在對塞格勒方法下結(jié)論還為時(shí)尚早。 但是,他認(rèn)為「可能會(huì)產(chǎn)生深遠(yuǎn)的影響」,不僅僅在構(gòu)合成已知的分子方面,而是在生成新的分子方面。
聯(lián)系客服