編者按:本文來自微信公眾號(hào)“機(jī)器之心”(ID:almosthuman2014),編輯:虞喵喵、李澤南,36氪經(jīng)授權(quán)發(fā)布。
去年 11 月底,中國科學(xué)院神經(jīng)科學(xué)研究所、中國科學(xué)院腦科學(xué)與智能技術(shù)卓越創(chuàng)新中心、香港科技大學(xué)生命科學(xué)部和分子神經(jīng)科學(xué)國家重點(diǎn)實(shí)驗(yàn)室、中國科學(xué)院自動(dòng)化研究所在《Neuron》上聯(lián)合發(fā)表了一篇概述論文《China Brain Project: Basic Neuroscience, Brain Diseases, and Brain-Inspired Computing》,介紹了「中國腦計(jì)劃」在基礎(chǔ)神經(jīng)科學(xué)、腦疾病和腦啟發(fā)計(jì)算上的研究進(jìn)展。中國腦計(jì)劃引起了人們的廣泛關(guān)注。
最近,該論文聯(lián)合作者之一,中國科學(xué)院自動(dòng)化研究所所長,中國科學(xué)院腦科學(xué)與智能技術(shù)卓越創(chuàng)新中心(CEBSIT)副主任徐波在中國中文信息學(xué)會(huì)第八次全國會(huì)員代表大會(huì)上做了「類腦智能研究及發(fā)展方向」的主題演講,以下是機(jī)器之心現(xiàn)場整理的內(nèi)容。
非常高興有機(jī)會(huì)能和大家一起分享,類腦研究出現(xiàn)的時(shí)間不長,這個(gè)領(lǐng)域里有很多不成熟的地方,希望我們的研究能為大家?guī)硇滤伎肌?/p>眾所周知,人工智能是目前科學(xué)界的研究熱點(diǎn)。在人工智能領(lǐng)域里,除了深度學(xué)習(xí)以外,類腦計(jì)算這個(gè)詞出現(xiàn)的也越來越多了。類腦計(jì)算通常是指研發(fā)新類型的芯片,電子器件和體系結(jié)構(gòu)等等,在軟件上與信息處理研究,構(gòu)建模型和算法等等相關(guān)。類腦計(jì)算還有一種提法,在 863 的課題里面叫做類人智能。類人智能主要是行為級(jí)別的考量,目標(biāo)是在功能上產(chǎn)生與人可以相比較的智能,但不關(guān)注達(dá)到目標(biāo)需要使用什么樣的方法,所以這里面有一些細(xì)微的差別。
在英文里,類腦在學(xué)界存在著不同的說法。有人喜歡用 brain like,顧名思義,通過研究復(fù)制或者部分復(fù)制人類大腦,這種說法忽略了如何復(fù)制大腦;另外一種是 brain inspire,受腦啟發(fā)的智能,或者受腦啟發(fā)的計(jì)算,簡稱類腦。這是基本名詞和概念的解釋。
在內(nèi)容的第一部分中,我選擇了和計(jì)算學(xué)習(xí)相關(guān)的一些方向進(jìn)行介紹。
今年 1 月初 AlphaGo 打敗眾多圍棋冠軍是人工智能快速發(fā)展的標(biāo)志。但其實(shí)人工智能最大的前景在于它會(huì)在未來 5 到 10 年中與各個(gè)行業(yè)深度融合。這是一個(gè)艱難的過程,因?yàn)槊總€(gè)行業(yè)都有它的門檻,但是不管怎么樣,人工智能已經(jīng)成為一個(gè)國家層面的戰(zhàn)略方向。我們現(xiàn)有的大多數(shù)的智能可稱為大數(shù)據(jù)智能,或監(jiān)督數(shù)據(jù)學(xué)習(xí),它的最大特點(diǎn)是:這個(gè)系統(tǒng)呈現(xiàn)出多大的智能,它的背后就存在著多少人力的投入。包括圍棋的應(yīng)用、語音識(shí)別、圖像識(shí)別,都需要大量的人工標(biāo)注性的工作。但是,我們看到的大數(shù)據(jù)的智能,有兩種問題無法解決:
一類問題被稱作超大規(guī)??臻g,這意味著狀態(tài)空間非常大,數(shù)據(jù)再多,對(duì)這樣的問題而言都是稀疏的。此類問題用現(xiàn)有的方法很難解決。
另一個(gè)問題在于現(xiàn)有人工智能都是專用的智能。下圍棋的系統(tǒng)不能下象棋,掃地的不會(huì)擦桌子,它基本上沒有自我學(xué)習(xí),舉一反三,觸類旁通的能力。
反過來看看人類的大腦,歐盟 2012 年的腦計(jì)劃報(bào)告中寫道:在自然界里,除人腦以外,還沒有一個(gè)自然或者人工系統(tǒng),能夠具有對(duì)新環(huán)境新挑戰(zhàn)的自適應(yīng)能力。新信息與技能自動(dòng)獲取能力在復(fù)雜信息進(jìn)行有效的決策,并穩(wěn)定工作,直至幾十年的能力。也沒有任何系統(tǒng)能夠在多處損傷的情況下,保持像人腦一樣的魯棒性。而且與其他人工智能相比,人腦的功耗非常低。
受腦啟發(fā)的智能,據(jù)我們的理解,實(shí)際上是橫跨腦科學(xué)、認(rèn)知科學(xué)到智能科學(xué),并持續(xù)發(fā)展的一個(gè)方向。在腦科學(xué)中,有很多個(gè)尺度的大腦的觀察機(jī)理可供借鑒。其實(shí)在很多的腦計(jì)劃里面,比如美國的腦計(jì)劃(2013 年啟動(dòng)),它的重點(diǎn)是在突破大腦的觀察的技術(shù),測量的技術(shù),希望能看到每個(gè)神經(jīng)元的放電活動(dòng)。而日本的腦計(jì)劃(2014 年啟動(dòng))主要關(guān)注于腦疾病。歐盟的腦計(jì)劃(2012 年啟動(dòng))主要是做大腦模擬,為新一代的信息處理的研究提供依據(jù)。從其他國家的類似計(jì)劃中我們可以獲得很多信息。
另外,在認(rèn)知科學(xué)中,我們也可以獲得很多的信息。比如近年來,我們?cè)诖竽X中的視覺、聽覺、語言中對(duì)于認(rèn)知通路的研究正在變得越來越清晰。在這其中視覺通路的研究是最多的,這些研究為我們理解腦認(rèn)知功能奠定了基礎(chǔ)。智能科學(xué)大家都比較熟悉了,本來就存在一套計(jì)算方法在這個(gè)領(lǐng)域發(fā)展。
類腦智能的核心問題在于:我們能不能把腦科學(xué)、認(rèn)知科學(xué)和智能科學(xué)里面的一些研究成果整合起來,來產(chǎn)生比我們現(xiàn)有的人工智能、神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí),更好的算法和模型。如圖所示,類腦研究有兩個(gè)源頭,一個(gè)是神經(jīng)科學(xué)。這是一個(gè)統(tǒng)計(jì),過去三十年產(chǎn)生的神經(jīng)科學(xué)的知識(shí),大概是 80 年代以前的 46 倍?,F(xiàn)在的神經(jīng)科學(xué)發(fā)展速度更快,因?yàn)樯窠?jīng)科學(xué)的發(fā)展,主要依賴于新技術(shù)的出現(xiàn)?,F(xiàn)在每年神經(jīng)科學(xué)新發(fā)現(xiàn)的數(shù)字,是 80 年代以前的 100 倍,這個(gè)速度還在不斷加快,越來越很多的知識(shí)可供我們使用。
從類腦智能角度,人們可以借用什么東西呢?從大的角度來說,或者多尺度的大腦信息處理,這些機(jī)制能不能被我們所用呢?我們現(xiàn)在知道神經(jīng)元的類型非常多,人腦中有上百種神經(jīng)元,粗略分類至少有有抑制性的跟興奮性的兩類的神經(jīng)元。然而,現(xiàn)在的人工神經(jīng)元都是單點(diǎn)式的簡化的模型,還有人在做有樹突的人工神經(jīng)元模型。第二,神經(jīng)突觸的形成跟消亡,是我們最基本的學(xué)習(xí)的機(jī)制?,F(xiàn)有的人工神經(jīng)網(wǎng)絡(luò)輸出都是一類函數(shù),而生物的神經(jīng)網(wǎng)絡(luò),是一種神經(jīng)興奮發(fā)放模式,一個(gè)被稱為尖峰神經(jīng)網(wǎng)絡(luò)的機(jī)制,它和現(xiàn)有的計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò)不一樣。
關(guān)于可塑性機(jī)制,最基本的可塑性機(jī)制比較簡單,但在整個(gè)大腦中又會(huì)產(chǎn)生非常復(fù)雜的現(xiàn)象。關(guān)于連接,就是神經(jīng)元的前項(xiàng)連接、后項(xiàng)連接跟撤銷的意志,這在生物體內(nèi)都可以觀察到,這就是所謂的神經(jīng)元。從腦區(qū)級(jí)別來看,像神經(jīng)回路、功能環(huán)路、基底神經(jīng)節(jié)、丘腦型這樣的感知決策模型,和像前額葉腦區(qū)、運(yùn)動(dòng)腦區(qū)等形成的模仿學(xué)習(xí)功能,像多感知的突兀,它是視覺、聽覺、觸覺向外腦區(qū)上顳葉,與整合區(qū)形成了一個(gè)多通道學(xué)習(xí)和記憶方式。它是不同的認(rèn)知和不同的腦區(qū)相互協(xié)作的結(jié)果,從通用智能角度來看,生物體中還有很多機(jī)制可以借鑒。
從認(rèn)知來看,我們對(duì)人腦處理外界信息的方式已經(jīng)有了大致的了解。人類擁有視覺、聽覺、觸覺、嗅覺、味覺,結(jié)合短時(shí)記憶經(jīng)過工作記憶的處理,可以慢慢地把信息進(jìn)行理解抽象,變成長時(shí)記憶,人類會(huì)在成長過程中慢慢形成自我的概念,形成過去的經(jīng)驗(yàn)。長時(shí)記憶會(huì)對(duì)后來的視覺、聽覺、觸覺產(chǎn)生反饋與影響。所以從認(rèn)知的角度來說,記憶模型各不相同,不同類型的記憶實(shí)際上利用了不同的通路。像程序性的記憶,我們一旦掌握了某些技能,比如學(xué)會(huì)了騎自行車,學(xué)會(huì)了游泳,你就可能永遠(yuǎn)會(huì)都不會(huì)忘記,所以這些程序性的記憶,還有像無意識(shí)的條件反射,大多被稱為內(nèi)涵式記憶,當(dāng)然還有外顯式的記憶等等。我們?cè)谡J(rèn)知科學(xué)里面可以做很多認(rèn)知實(shí)驗(yàn),這些問題將來我們都會(huì)去驗(yàn)證、去發(fā)現(xiàn)。
從認(rèn)知科學(xué)中我們將獲得什么?其實(shí)最典型的就是很多人都在用的 random、推理、tension memory 這樣的模型。此類模型有三個(gè)部分,其中一個(gè)就是短時(shí)記憶。比如我們進(jìn)行小組對(duì)話,用這個(gè)模型做關(guān)于對(duì)話的理解,那整個(gè)對(duì)話的意思就是一個(gè)短時(shí)記憶,系統(tǒng)進(jìn)行編碼以后再進(jìn)行工作記憶處理,隨后你對(duì)這個(gè)對(duì)話可以提出任何問題,系統(tǒng)會(huì)產(chǎn)生響應(yīng)。但在這個(gè)對(duì)話里面,在理解一個(gè)問題的時(shí)候,可能需要很多背景的支持,這些內(nèi)容可能存儲(chǔ)在長時(shí)記憶模塊里。
這是一種典型的模型,我個(gè)人認(rèn)為它是受到認(rèn)知科學(xué)啟發(fā)的。深度學(xué)習(xí)研究者們正在進(jìn)行這方面的研究,這也是我們做的,我們把 tension 機(jī)制細(xì)化到詞級(jí)別的顆粒度上,通過多輪的迭代,最后獲得需要的答案。由此觀之,類腦就是人工智能的發(fā)展動(dòng)力,至少是一個(gè)可以參考的路徑。除了歐盟、日本,在美國腦計(jì)劃中專門有一個(gè)項(xiàng)目叫做 mapping,通俗來講,它是要研究一立方毫米體積的一個(gè)腦區(qū),把它整個(gè)從外面到突出極的所有連接結(jié)構(gòu)繪制出來,美國在這個(gè)項(xiàng)目上投入了 1 億美元作為啟動(dòng)資金。他們下一步計(jì)劃把探究出來的結(jié)構(gòu)用到人工智能里面。
中國在 2016 年的人大上通過了十三五的發(fā)展規(guī)劃,其中腦科學(xué)與類腦研究成為了 100 個(gè)重大項(xiàng)目里面的第四位,這些部分都是和腦科學(xué)相關(guān)的,不僅是疾病研究,還有類腦研究。
換個(gè)角度,從人工智能的角度求解這個(gè)問題。面對(duì)常規(guī)的一個(gè)問題,系統(tǒng)的求解需要把一個(gè)問題形式化,不論是律師、媒體還是下象棋,一定首先需要人的介入,把這個(gè)問題分解成幾塊,其中每一塊都可以轉(zhuǎn)化為一個(gè)圖靈機(jī)的問題。然后再用現(xiàn)有的計(jì)算機(jī)結(jié)構(gòu)來實(shí)現(xiàn)人工智能問題的求解。
從類腦智能的角度來看,我們希望計(jì)算機(jī)能夠通過像人一樣用序列化的學(xué)習(xí)方式來減少對(duì)人工形式化的依賴。如果我們實(shí)現(xiàn)了這一設(shè)想,我們就非常接近通用的人工智能了。
這就是第一部分內(nèi)容:類腦研究主要將不斷從神經(jīng)科學(xué)、認(rèn)知科學(xué),尤其是神經(jīng)科學(xué)中受到啟發(fā)。
類腦研究具體是哪幾個(gè)方向?我們正在探究各種可能性,我們認(rèn)為大腦具有高度可塑性機(jī)制。未來的人工神經(jīng)網(wǎng)絡(luò)或許可以受此啟發(fā)。這是一個(gè) STDP,它描述了人類局部神經(jīng)元之間突觸的連接強(qiáng)度,隨著相鄰兩個(gè)神經(jīng)元先后放電的時(shí)間差異——增強(qiáng)或減弱而產(chǎn)生不同表達(dá)的神經(jīng)的機(jī)制。這是生物學(xué)習(xí)機(jī)制中最基本的元素,它實(shí)現(xiàn)的功能是通過有持續(xù)地激活神經(jīng)元集群,產(chǎn)生神經(jīng)連接發(fā)生有序的強(qiáng)化,可用于儲(chǔ)存信息。
這樣一個(gè)簡單的、生物化的學(xué)習(xí)機(jī)制。它是無監(jiān)督的,非數(shù)學(xué)化的。例如在空間維度信息的學(xué)習(xí)和記憶、手寫數(shù)字識(shí)別、圖像存儲(chǔ)與提取、以及機(jī)器人的動(dòng)作序列學(xué)習(xí),還有短周期節(jié)律的學(xué)習(xí)都可以借鑒這種機(jī)制。實(shí)際上研究人員已經(jīng)在進(jìn)行此類探索了。這樣的學(xué)習(xí)機(jī)制將會(huì)與目前不同的人工神經(jīng)網(wǎng)絡(luò),包括現(xiàn)有的監(jiān)督學(xué)習(xí)去比較。它目前的性能比生物體中的效率要差一點(diǎn),但是仍然達(dá)到了 95% 的準(zhǔn)確率。目前的探索證明了生物學(xué)機(jī)制的潛力。純生物 STDP 可適應(yīng)機(jī)制可以讓機(jī)器人學(xué)會(huì)繞著某一條線走路。
這是一種輕監(jiān)督的任務(wù),機(jī)器自己理解路的概念,理解需要沿著路前進(jìn)。我們?cè)诩佑驼就鈴V場的 24 小時(shí)監(jiān)控圖像里,通過人工智能分析,可以識(shí)別圖像內(nèi)容,而且對(duì)內(nèi)容進(jìn)行分類。此外,我們開發(fā)了序列記憶系統(tǒng),它可以識(shí)別音樂節(jié)拍,然后重現(xiàn)出來。所有這些都應(yīng)用了這樣的機(jī)制。
從微觀角度來看可熟悉機(jī)制,無監(jiān)督的學(xué)習(xí)方法已經(jīng)在上述的一些任務(wù)里取得了一定的進(jìn)展。但是它引出了認(rèn)知范圍的能力的問題。目前的無監(jiān)督學(xué)習(xí)只能適用于有限范圍內(nèi)的任務(wù)處理,因?yàn)樗緵]有在結(jié)構(gòu)上面做特別多的處理。
這一領(lǐng)域的研究還有很多方向可以進(jìn)一步深化。比如秒量級(jí)的節(jié)律信息處理,就是說研究節(jié)拍之間,比如節(jié)拍超過幾百毫秒的時(shí)候,STDP 怎么如何記錄這種節(jié)拍。如果希望使用生物的學(xué)習(xí)方式,一定要有結(jié)構(gòu)的配合,包括信息的無監(jiān)督編碼的提取和復(fù)雜特征的編碼。在這一方面,比如 spike,這個(gè)神經(jīng)網(wǎng)絡(luò)功耗非常低,同時(shí)是弱監(jiān)督的。生物機(jī)制中的 bottom-up 與數(shù)學(xué)上的 top-down(目標(biāo)函數(shù)驅(qū)動(dòng))的方法如何整合,來形成新一代的人工神經(jīng)網(wǎng)絡(luò),是未來我們研究的方向。
現(xiàn)在有很多其他領(lǐng)域的學(xué)者跨界在進(jìn)行這方面的研究。本次討論的關(guān)鍵詞,可塑性機(jī)制,脈沖神經(jīng)網(wǎng)絡(luò)(脈沖神經(jīng)網(wǎng)絡(luò)和人工神經(jīng)網(wǎng)絡(luò)的輸出不同,它不可微分,所以數(shù)學(xué)上的原有的理論不能適用)還有強(qiáng)化數(shù)據(jù)深度學(xué)習(xí)。這些概念,如何整合在一起?如果可以提出一個(gè)新的模型,它的學(xué)習(xí)效率更高,對(duì)數(shù)據(jù)的依賴性、監(jiān)督性、標(biāo)記的依賴更弱,會(huì)是非常有意思的工作。第二個(gè)方向,實(shí)際上認(rèn)知功能都是由若干個(gè)環(huán)路或者是一個(gè)通路組成的,是若干腦區(qū)構(gòu)成的一個(gè)通路。這個(gè)體系作為整體呈現(xiàn)出人類的認(rèn)知功能,從計(jì)算的角度來看,最核心的問題在于,不同腦區(qū)之間是什么樣的協(xié)同關(guān)系?剛才的討論中已經(jīng)提到了一部分,很多的功能,包括模仿、決策、整合,都需要十幾個(gè)腦區(qū)協(xié)同合作(假如細(xì)分的話,這個(gè)數(shù)字會(huì)更大),但整合起來才能產(chǎn)生復(fù)雜強(qiáng)大的認(rèn)知功能。腦區(qū)有幾種組織方式?我的看法傾向于層次化的方式,尤其在感知方面,在視覺方面這種方式非常明顯,從感官到第一要區(qū),再到高級(jí)的認(rèn)知功能和記憶、判斷推理、眼動(dòng)、控制四肢手、運(yùn)動(dòng)規(guī)劃都有這種方式的痕跡。另一種組織方式體現(xiàn)在高級(jí)認(rèn)知系統(tǒng)中,我認(rèn)為是模塊化的。不同的腦區(qū)之間有相互反饋和信息的交互。比如記憶系統(tǒng)的溝通,強(qiáng)化學(xué)習(xí)性,它的連接關(guān)系相對(duì)來說是層次性的,比視覺系統(tǒng)復(fù)雜。在研究協(xié)同方面,我們也做了很多工作,比如視覺和層次的研究,我們根據(jù)現(xiàn)有的神經(jīng)科學(xué)數(shù)據(jù),構(gòu)建了視覺的各種模型,它和以前的此類模型,包括 20 年前的聽覺模型等方式大不相同。在新的視覺模型中,我們通過多層次構(gòu)建了一個(gè)符合生物進(jìn)化機(jī)制的目標(biāo)函數(shù),來求解區(qū)域之間的連接強(qiáng)度。當(dāng)然模型每層之間也有新的特性,例如側(cè)向連接。模型中神經(jīng)元的數(shù)量來自于一些生理數(shù)據(jù)。受到這些結(jié)構(gòu)啟發(fā)的模型,它在感受、空間分布,還有相應(yīng)的神經(jīng)元細(xì)胞的響應(yīng),實(shí)際觀察來看同步性是非常相似的。
當(dāng)然,模型還包含有類結(jié)蹄組織結(jié)構(gòu),神經(jīng)元的傾向分位,差異分布等等特性。我們看到的協(xié)同,就是層次化的腦區(qū)的協(xié)同,我們希望能夠構(gòu)造符合生物進(jìn)化機(jī)制的目標(biāo)函數(shù),使得它能量消耗最低。具體表現(xiàn)為突出的、連接的低能耗,還有表征的低能耗。另外我們從多腦區(qū)、高級(jí)定制、協(xié)同等方面也進(jìn)行了研究,開發(fā)出了進(jìn)階模型。模擬了十幾個(gè)腦區(qū),完成從視覺編碼開始,到最后做出決策的所有任務(wù)。這種模型被稱為運(yùn)動(dòng)感知和決策模型。其中包含興奮性通路和抑制性通路,還有內(nèi)部的連接關(guān)系及擴(kuò)散結(jié)構(gòu),不同的腦區(qū)相互作用等等。
應(yīng)該說,這個(gè)模型基本上是用仿生的思路開發(fā)的。另外,我們對(duì)單個(gè)神經(jīng)元的類型也做了很多的嘗試。我們用不同類型的神經(jīng)元構(gòu)造出整個(gè)網(wǎng)絡(luò),模擬了腦區(qū)之間的競爭的機(jī)制,學(xué)習(xí)行為選擇和權(quán)重更新等機(jī)制。
這個(gè)模型最終展現(xiàn)出來的學(xué)習(xí)機(jī)制總體而言比較簡單,就是通過多巴胺的釋放來調(diào)節(jié)學(xué)習(xí)的速度,這有點(diǎn)類似于獎(jiǎng)懲信度分配——強(qiáng)化學(xué)習(xí)里面的邏輯機(jī)制。它呈現(xiàn)出了類似強(qiáng)化學(xué)習(xí)的功能,但它的復(fù)雜度、學(xué)習(xí)的速度都比后者要快。我們把剛才提到的視覺層次化與運(yùn)動(dòng)決策模塊化整合在一起,研究無人機(jī)躲避障礙和處理突發(fā)事件的新方法,這些實(shí)驗(yàn)也是我們研究的一部分。這類研究最大的特點(diǎn)就是它具有可解釋性,它完成每個(gè)決策時(shí),每個(gè)腦區(qū),每個(gè)神經(jīng)網(wǎng)絡(luò)發(fā)揮的作用都可以解釋的,研究者可以清楚地觀察到。這是我們新一代人工神經(jīng)網(wǎng)絡(luò)的重要特征。它不像現(xiàn)有的監(jiān)督學(xué)習(xí)方式,在訓(xùn)練后處于黑箱狀態(tài),人們無法獲知神經(jīng)網(wǎng)絡(luò)每一層的功能。我們的模型從仿生角度設(shè)計(jì),可以較清晰地觀察特定腦區(qū)在發(fā)揮什么樣的作用。
第三部分更加復(fù)雜,但對(duì)于類腦智能的價(jià)值也非常大。就是探究如何構(gòu)造一個(gè)可以發(fā)育演化的模型。現(xiàn)有的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)與人類最大的區(qū)別在于時(shí)間尺度。人類的學(xué)習(xí)也許會(huì)經(jīng)歷幾年或幾天,它的時(shí)間序列非常長。我們目前的感知系統(tǒng)無法這樣學(xué)習(xí)。我們的機(jī)器學(xué)習(xí)始終把目標(biāo)函數(shù)作為優(yōu)化的唯一的機(jī)制。而且在優(yōu)化過程中,我們能看到其中有很多表示,其中印證了神經(jīng)科學(xué)的一些發(fā)現(xiàn),包括剛剛講到的腦區(qū)細(xì)胞類型、分子狀態(tài)、計(jì)算和存儲(chǔ)的機(jī)制。
在最早神經(jīng)科學(xué)把神經(jīng)元的概念引入到機(jī)器學(xué)習(xí)中,啟發(fā)了深度學(xué)習(xí)等方式之后,最新的成功研究和神經(jīng)科學(xué)的關(guān)系越來越少了。但是,我們現(xiàn)在看到神經(jīng)科學(xué)與機(jī)器學(xué)習(xí)融合的新機(jī)會(huì)正在出現(xiàn)。我們首先意識(shí)到機(jī)器學(xué)習(xí)的目標(biāo)函數(shù)正在變得越來越復(fù)雜?,F(xiàn)有的大多數(shù)神經(jīng)網(wǎng)絡(luò)都是單一目標(biāo)函數(shù),但有很多的神經(jīng)網(wǎng)絡(luò)可以隨著不同的神經(jīng)層、深度、時(shí)間產(chǎn)生變化。比如學(xué)習(xí)次數(shù)不同導(dǎo)致目標(biāo)函數(shù)的不同, 它可能會(huì)有持續(xù)的捆綁性,我們?cè)诘讓訖C(jī)器學(xué)習(xí)的設(shè)計(jì)中也許需要把它考慮在內(nèi)。還有大家最熟悉的對(duì)抗式學(xué)習(xí),它是由兩個(gè)神經(jīng)網(wǎng)絡(luò)組成的,用一個(gè)網(wǎng)絡(luò)修正另一個(gè)網(wǎng)絡(luò)的輸出的目標(biāo)函數(shù)。這些方向?yàn)槲覀兾磥淼臋C(jī)器學(xué)習(xí)模型打開了思路。
為了使優(yōu)化更加高效。機(jī)器學(xué)習(xí)已經(jīng)發(fā)展出了不同的網(wǎng)絡(luò)結(jié)構(gòu)。
神經(jīng)科學(xué)與人工智能之間的關(guān)系存在三大假設(shè):
1、大腦具有優(yōu)化目標(biāo)函數(shù)的能力。大腦特定的腦區(qū),特定的結(jié)構(gòu)具有在數(shù)學(xué)層面上優(yōu)化目標(biāo)函數(shù)的能力。
2、目標(biāo)函數(shù)在不同腦區(qū)和發(fā)育階段是不同的,現(xiàn)代機(jī)器學(xué)習(xí)的發(fā)展,實(shí)際上也是從這里受到啟發(fā)的。
3、大腦中存在大量的專用機(jī)制,這是天生的、在進(jìn)化中得來的,可以有效地解決一些關(guān)鍵的計(jì)劃問題。
從大腦優(yōu)化目標(biāo)函數(shù)的方式中,我們可以觀察到人類在運(yùn)動(dòng)過程中其實(shí)有很多的策略,從進(jìn)化角度考慮,人類必須減少能量的消耗,減少運(yùn)動(dòng)的風(fēng)險(xiǎn),降低受到傷害的幾率。我們目前認(rèn)為目標(biāo)優(yōu)化策略機(jī)制在大腦中廣泛存在,它們形成了不同的特定處理方式。
那么大腦目標(biāo)函數(shù)優(yōu)化的確切含義是什么?有很多的網(wǎng)絡(luò)結(jié)構(gòu),比如饋增網(wǎng)絡(luò),有些存在反向通道,STDP 機(jī)制和一些相關(guān)結(jié)構(gòu)。在經(jīng)過學(xué)習(xí)后可以產(chǎn)生和數(shù)學(xué)上的 BP(錯(cuò)誤反穿)一樣的效果的學(xué)習(xí)機(jī)制。但目前有關(guān)大腦中存在 BP 學(xué)習(xí)機(jī)制還是一種假設(shè)。在神經(jīng)科學(xué)中,哪一種運(yùn)行機(jī)制假說是對(duì)的還沒有定論。但這些假設(shè)可以給人帶來很多啟發(fā)。
第二個(gè)假設(shè)是目標(biāo)函數(shù)在不同腦區(qū)和不同發(fā)育階段是不同的。這很容易讓人理解,在構(gòu)造神經(jīng)網(wǎng)絡(luò)應(yīng)用的時(shí)候,可能一個(gè)網(wǎng)絡(luò)被用于進(jìn)行分類、決策,另一個(gè)網(wǎng)絡(luò)會(huì)不斷地隨時(shí)間、環(huán)境,或者被其他動(dòng)機(jī)驅(qū)動(dòng),產(chǎn)生變動(dòng)的目標(biāo)函數(shù),因此,這個(gè)神經(jīng)網(wǎng)絡(luò)就會(huì)更加適應(yīng)環(huán)境,具有更好的表現(xiàn)。
目前的深度學(xué)習(xí)正在向無監(jiān)督方向發(fā)展,人腦是否存在真正的無監(jiān)督學(xué)習(xí)?我們現(xiàn)在仍然只能進(jìn)行假設(shè),因?yàn)榇竽X實(shí)在太復(fù)雜了,目前的神經(jīng)科學(xué)還難以支撐這樣的結(jié)論。順著假說的思路,利用無監(jiān)督學(xué)習(xí)來解決特定的問題是目前研究者面臨的挑戰(zhàn),如果按照剛才的優(yōu)化目標(biāo)來看,大腦目標(biāo)函數(shù)是隨著時(shí)間和不同的發(fā)育階段而變化的。因此,我們需要探討的問題是,真正的演化是不是根據(jù)當(dāng)前的狀態(tài)?我們能不能通過一系列目標(biāo)函數(shù)來建立回路和行為?我們總是希望用較少的數(shù)據(jù)來訓(xùn)練完美的模型,人類的大腦在進(jìn)行學(xué)習(xí)時(shí)不需要一個(gè)具有數(shù)百萬已標(biāo)記數(shù)據(jù)的數(shù)據(jù)集來訓(xùn)練。人類只需要一些簡單的邏輯和少量事例,就可以觸類旁通,僅需要非常少的數(shù)據(jù)即可完成訓(xùn)練。
現(xiàn)在,我們希望計(jì)算機(jī)可以把復(fù)雜的問題分解成若干的不同的階段,每階段只需少量數(shù)據(jù)進(jìn)行訓(xùn)練,輸出相應(yīng)的目標(biāo)函數(shù),如果這個(gè)方向出現(xiàn)了成果,那么人工智能就向前邁進(jìn)了一步。
第二,在增強(qiáng)學(xué)習(xí)上,我們目前認(rèn)為大腦中普遍存在此類機(jī)制。增強(qiáng)學(xué)習(xí)和深度學(xué)習(xí)正在不斷地被整合,此類研究也已經(jīng)出現(xiàn)了很大的進(jìn)展。它的基本思想就是用強(qiáng)化學(xué)習(xí)來產(chǎn)生定義的目標(biāo),也就是說所謂的有效錯(cuò)誤反彈,它也可以理解為通過學(xué)習(xí)需要達(dá)到的目標(biāo),加上強(qiáng)化的過程。我們可以把這種學(xué)習(xí)方式理解為不斷變化的 cost function,加上半監(jiān)督學(xué)習(xí)。
第三,專業(yè)系統(tǒng)如何進(jìn)行有效計(jì)算的問題,這與實(shí)現(xiàn)機(jī)制結(jié)構(gòu)相關(guān)。不同模式的信息在不同領(lǐng)域中被用來解決各種類型的問題。有些區(qū)域是 highly recurrent,有些區(qū)域是在不同的激活狀態(tài),有些區(qū)域好像在做信息的路由,基底區(qū)在做增強(qiáng)學(xué)習(xí)跟離散的決策。在大腦中可能存在一些較為固化的結(jié)構(gòu)在做無監(jiān)督學(xué)習(xí),這意味著深層次的模型可能是大腦中的固定結(jié)構(gòu),因?yàn)樯顚哟文P褪遣恍枰O(jiān)督的。
還有一些有關(guān)物理世界固有特性的目標(biāo)函數(shù),比如說一個(gè)物體,我們推動(dòng)它會(huì)產(chǎn)生慣性。在特定結(jié)構(gòu)下做出優(yōu)化,即使有一組強(qiáng)大的基因來決定,我們的 cost-function 要在一個(gè)空白的網(wǎng)絡(luò)上演化出復(fù)雜的認(rèn)知也是非常困難的。
預(yù)設(shè)一個(gè)結(jié)構(gòu)對(duì)解決復(fù)雜問題而言是必要條件,優(yōu)化公式的學(xué)習(xí)是在復(fù)雜的動(dòng)態(tài)的協(xié)同過程中完成的。我們知道大腦中存在很多特殊結(jié)構(gòu),用于完成各種類型的任務(wù),這種機(jī)制并不需要經(jīng)過大量學(xué)習(xí)。目前,智能研究社區(qū)非常關(guān)心大腦到底有沒有反向傳播(backpropagation)機(jī)制,我們可以設(shè)計(jì)一種模型,實(shí)現(xiàn)類似大腦的反向傳播,但從生物學(xué)中更復(fù)雜的技術(shù)層面上看,類腦的角度是非常有益的。無論如何,一旦生物運(yùn)算機(jī)制被我們破解,我們就可以把它復(fù)制到計(jì)算機(jī)領(lǐng)域中,使得人工智能程序的學(xué)習(xí)變得更加簡單、更加有效。
在演化部分里有這樣一個(gè)結(jié)論:假如我們目前的技術(shù)向內(nèi)容的認(rèn)知能力方向發(fā)展,最后出現(xiàn)的算法將會(huì)遠(yuǎn)遠(yuǎn)超出目前硬件技術(shù)所能容納的范圍。從大腦的角度來看,目前人造的數(shù)據(jù)驅(qū)動(dòng)方式都無法達(dá)到人腦的運(yùn)行效率。所以,我們需要轉(zhuǎn)變思路,吸收很多的模塊化機(jī)制,反應(yīng)偶然性的推理方式,原始物理和心理機(jī)制,來構(gòu)建能夠理解感知現(xiàn)實(shí)世界的模型。
DARPA(美國國防高級(jí)研究計(jì)劃局)的局長在 2014 年的一份報(bào)告中講到:生物是自然界的終極創(chuàng)新者,任何直觀創(chuàng)新的機(jī)構(gòu)如果不從作為復(fù)雜系統(tǒng)的大腦中尋求靈感,都將是愚蠢的。
大腦擁有上千億個(gè)神經(jīng)元細(xì)胞,百萬億的突觸形成的網(wǎng)絡(luò),其復(fù)雜程度也許讓我們一時(shí)難以復(fù)制。我可以先用一個(gè)簡單的模型來說明這個(gè)問題:亞馬遜螞蟻,上千只螞蟻組成的群體,當(dāng)它形成一個(gè)環(huán)形的運(yùn)動(dòng)狀態(tài),它會(huì)一直爬行,直到所有螞蟻都累死為止。但是當(dāng)遇到阻礙的時(shí)候,它們又能搭橋;碰到蛇的時(shí)候,它們可以互相配合進(jìn)行抵抗。螞蟻的行為非常簡單,但它們可以通過協(xié)同合作來完成個(gè)體無法做到的任務(wù)。對(duì)于大腦來說,原理也是類似的。當(dāng)我們最終了解了大腦的復(fù)雜系統(tǒng)信息共享,自主性和實(shí)際性信號(hào)處理等等機(jī)制的秘密,人類的科技水平將會(huì)出現(xiàn)新的突破。
有人說現(xiàn)代科學(xué)已經(jīng)進(jìn)入了復(fù)雜性微積分時(shí)代,我們正在從多種研究角度,從心理、計(jì)算、動(dòng)力學(xué)、混沌、進(jìn)化等不同的角度在研究復(fù)雜性。但是整個(gè)生物學(xué)領(lǐng)域里面,越來越多信息處理的思想來正在形成我們理解動(dòng)物行為的理論框架。雖然在生命系統(tǒng)中,信息的處理和計(jì)算的完整概念還非常的模糊,科學(xué)家們對(duì)于它定義的形式化都還沒有形成共識(shí)。但是,可以預(yù)見的是,計(jì)算機(jī)科學(xué)及更廣泛的計(jì)算領(lǐng)域終將從類腦智能的研究中獲益。以上是我個(gè)人對(duì)于類腦智能的一些見解。這是我們目前正在進(jìn)行的研究,把一個(gè)鼠腦的幾百個(gè)腦區(qū),七千多萬個(gè)神經(jīng)元用一些現(xiàn)有的信息處理方法進(jìn)行完整的模擬?,F(xiàn)在,我們的研究還處于初始階段。在全腦的尺度中,即使是一些非常初級(jí)的功能也需要進(jìn)行大量的探索,但我們的征途已經(jīng)開始。
謝謝大家。
聯(lián)系客服