雷鋒網(wǎng) AI 科技評(píng)論按:隨著神經(jīng)網(wǎng)絡(luò)的研究和應(yīng)用越來(lái)越多,人們也越發(fā)地認(rèn)識(shí)到神經(jīng)網(wǎng)絡(luò)所需的計(jì)算力近乎于無(wú)底洞 。如果說(shuō)高校實(shí)驗(yàn)室和一般愛(ài)好者在耐心等待之外辦法不多的話,大公司們要面對(duì)的則是“做還是不做”的問(wèn)題。
英特爾、英偉達(dá)、微軟、谷歌這幾年為了“做”,都有哪些舉動(dòng)呢?紐約時(shí)報(bào)的這篇文章可以帶我們看看這一變化的梗概。雷鋒網(wǎng) AI 科技評(píng)論編譯如下,有刪改。
最近人們希望電腦能做的事情越來(lái)越多。電腦要跟人對(duì)話,要能認(rèn)出人臉,也要能認(rèn)出路邊的小花,再過(guò)不久還要給人類開(kāi)車。所有這些人工智能都需要極高的計(jì)算能力,即便當(dāng)下最先進(jìn)的電腦也沒(méi)法隨隨便便完成。
為了能夠滿足高速增長(zhǎng)的計(jì)算需求,一些科技巨頭們現(xiàn)在正從生物學(xué)中尋找靈感。他們正在重新思考電腦的本質(zhì),然后建造更像人類大腦的機(jī)器:神經(jīng)系統(tǒng)里要有一個(gè)中央腦干,然后把聽(tīng)、說(shuō)這樣的具體任務(wù)交給周圍的大腦皮層去做。他們希望電腦也能這樣。
新時(shí)代的萌芽
在連續(xù)幾年的緩步發(fā)展以后,計(jì)算機(jī)終于又開(kāi)始進(jìn)化了,換上了新樣子的計(jì)算機(jī)會(huì)產(chǎn)生廣泛而持久的影響。它們能夠大大提高人工智能系統(tǒng)的運(yùn)行速度,也許未來(lái)某一天“機(jī)器人可以統(tǒng)治世界”的夢(mèng)想也可以成真。這種轉(zhuǎn)換也會(huì)削弱芯片巨頭英特爾的地位。從提供互聯(lián)網(wǎng)服務(wù)的數(shù)據(jù)中心、手里的iPhone到VR頭盔和無(wú)人機(jī),所有科技產(chǎn)品的核心都是半導(dǎo)體芯片。隨著新型芯片的時(shí)代來(lái)臨,目前年產(chǎn)值三千億美元的半導(dǎo)體工業(yè)很可能會(huì)完全變個(gè)樣子。
現(xiàn)任谷歌母公司Alphabet董事的 John Hennessy 曾任斯坦福大學(xué)校長(zhǎng),1990年代他出版寫過(guò)一本計(jì)算機(jī)設(shè)計(jì)的權(quán)威著作?!斑@是一場(chǎng)巨大的變革,”他說(shuō),“現(xiàn)在的這一套做法馬上就要過(guò)時(shí)了,大家都想重新開(kāi)發(fā)一套系統(tǒng)架構(gòu)?!?/p>
現(xiàn)有的計(jì)算機(jī)架構(gòu)也有過(guò)自己的好日子。在過(guò)去的接近五十年里,計(jì)算機(jī)的設(shè)計(jì)者們都圍繞著一塊單獨(dú)的、全能的芯片設(shè)計(jì)整個(gè)系統(tǒng)。這個(gè)全能的芯片就是CPU,臺(tái)式電腦、筆記本電腦里都有,往往來(lái)自英特爾;手機(jī)里有時(shí)候也有英特爾的CPU。英特爾也是全球最大的半導(dǎo)體生廠商之一。
更復(fù)雜的系統(tǒng)在計(jì)算機(jī)工程師中間變得流行起來(lái)。以前可能所有的任務(wù)都要傳到英特爾CPU中完成,現(xiàn)在的計(jì)算機(jī)則會(huì)把任務(wù)分成許多的小塊,然后把它們交給外圍的專用芯片完成,這些芯片結(jié)構(gòu)比CPU簡(jiǎn)單、耗電也要更少。
谷歌的大型數(shù)據(jù)中心里的變化是對(duì)全行業(yè)未來(lái)走向的一個(gè)預(yù)兆。谷歌大多數(shù)的服務(wù)器里都還有一個(gè)CPU,但是現(xiàn)在有數(shù)不清的定制化芯片和它們共同工作,為語(yǔ)音識(shí)別等人工智能應(yīng)用提供運(yùn)算支持。
實(shí)實(shí)在在的需求推動(dòng)了谷歌的這一變化。多年以來(lái),谷歌都有著全世界最大的計(jì)算機(jī)網(wǎng)絡(luò),簡(jiǎn)直像是一個(gè)數(shù)據(jù)中心和線纜組成的帝國(guó),從加利福尼亞一直擴(kuò)張到芬蘭和新加坡。然而,對(duì)這位谷歌的研究員來(lái)說(shuō),這樣的網(wǎng)絡(luò)還是太小了。
Jeff Dean 和谷歌為人工智能應(yīng)用開(kāi)發(fā)的TPU
Jeff Dean 是谷歌最出名、最受人尊敬的工程師之一。2011年他開(kāi)始帶領(lǐng)團(tuán)隊(duì)探索“神經(jīng)網(wǎng)絡(luò)”的想法。這種想法的核心是讓計(jì)算機(jī)算法自己學(xué)習(xí)任務(wù),然后可以用在很多的場(chǎng)合中,比如識(shí)別手機(jī)用戶的語(yǔ)音輸入,又或者是照片中的人臉。只花了幾個(gè)月的時(shí)間,Jeff Dean 和他的團(tuán)隊(duì)就開(kāi)發(fā)出了一個(gè)基于神經(jīng)網(wǎng)絡(luò)語(yǔ)音識(shí)別系統(tǒng),它識(shí)別對(duì)話的準(zhǔn)確率要比谷歌那時(shí)已有的系統(tǒng)高得多。但接下來(lái)也有一個(gè)麻煩,全世界運(yùn)行谷歌的安卓系統(tǒng)的智能手機(jī)已經(jīng)超過(guò)了10億部,假設(shè)這些手機(jī)用戶們每天只用3分鐘語(yǔ)音識(shí)別,根據(jù) Jeff Dean 的計(jì)算,谷歌也需要把現(xiàn)有的數(shù)據(jù)中心容量翻一倍才能支持得了。
監(jiān)控著谷歌“數(shù)據(jù)中心帝國(guó)”運(yùn)行的是計(jì)算機(jī)科學(xué)家 Urs H?lzle,在一次開(kāi)會(huì)的時(shí)候 Jeff Dean 就對(duì)他說(shuō):“我們需要再建立一個(gè)谷歌”,后來(lái)有參會(huì)者回憶道。但這個(gè)想法實(shí)現(xiàn)不了,Jeff Dean 就提出了一個(gè)替代方案:自己造一種專門運(yùn)行這種人工智能的芯片。
谷歌數(shù)據(jù)中心里的這個(gè)苗頭已經(jīng)擴(kuò)散到了其它科技巨頭的身上。在未來(lái)幾年里,谷歌、蘋果、三星等公司都會(huì)制造帶有專用的AI芯片的手機(jī)。微軟設(shè)計(jì)的這種芯片打算專門用在AR頭盔上,然后谷歌、豐田等一大群造自動(dòng)駕駛汽車的廠商也會(huì)需要類似的芯片。
這種研發(fā)專用芯片和新計(jì)算機(jī)架構(gòu)的熱潮,在美國(guó)國(guó)防部研究機(jī)構(gòu) DARPA 的前項(xiàng)目管理人員 Gill Pratt 看來(lái)可謂是人工智能界的“寒武紀(jì)生物大爆發(fā)”,他本人現(xiàn)在正在豐田從事無(wú)人車的研究。他已經(jīng)感覺(jué)到,把不同的計(jì)算分散給數(shù)量眾多的小面積、低功耗芯片的運(yùn)行方式,會(huì)讓機(jī)器更像人腦,這也讓能源的利用效率提高了不少?!霸谏锏拇竽X中,能源效率至關(guān)重要”,在近期的一次采訪中,身處豐田在硅谷的新研究中心的 Gill 這樣說(shuō)。
地平線已經(jīng)發(fā)生變化
硅基的計(jì)算機(jī)芯片有很多種。有的芯片可以存儲(chǔ)數(shù)據(jù),有的芯片可以完成玩具和電視機(jī)中的基本任務(wù);也有的芯片可以運(yùn)行計(jì)算機(jī)上的各種運(yùn)算,它們大到能構(gòu)造全球變暖模型的超級(jí)計(jì)算機(jī)用的芯片,小到個(gè)人計(jì)算機(jī)、服務(wù)器和手機(jī)上用的。
多年以來(lái),計(jì)算機(jī)和類似的設(shè)備都是以CPU作為核心運(yùn)行的,CPU也是設(shè)備成本的大頭。這一切都似乎不需要做什么改變。根據(jù)英特爾聯(lián)合創(chuàng)始人戈登·摩爾提出的著名的摩爾定律,計(jì)算機(jī)芯片中晶體管數(shù)量每?jī)赡曜笥揖蜁?huì)翻一番,幾十年來(lái)計(jì)算機(jī)性能的提升就是按照摩爾定律一路穩(wěn)定地發(fā)展了過(guò)來(lái)。而根據(jù) IBM 研究員 Robert Dennard 提出的?Dennard 縮放定律,芯片性能提升的同時(shí),它們消耗的能源卻幾乎維持不變。所以在以往的日子里一切都還好。
然而到了2010年,讓晶體管數(shù)量再翻一倍花的時(shí)間比摩爾定律預(yù)測(cè)的更長(zhǎng)了,Dennard 縮放定律也失效了,因?yàn)樾酒O(shè)計(jì)人員們遇到了來(lái)自材質(zhì)物理特性本身的限制。結(jié)果就是,如果想要更高的計(jì)算能力,只靠升級(jí)CPU已經(jīng)不能解決問(wèn)題了,需要增加更多的計(jì)算機(jī)、消耗更多的空間和電力。
語(yǔ)音和語(yǔ)言團(tuán)隊(duì)負(fù)責(zé)人黃學(xué)東(左)和計(jì)算架構(gòu)組的 Doug Burger 都是微軟的專用芯片開(kāi)發(fā)團(tuán)隊(duì)成員
業(yè)界和學(xué)術(shù)界的研究者們都在想辦法延長(zhǎng)摩爾定律的生命力,探索全新的芯片材料和芯片設(shè)計(jì)方法。但是微軟研究員?Doug Burger 有了另一種想法:除了整個(gè)業(yè)界從1960年代以來(lái)都倚仗的CPU的穩(wěn)步進(jìn)化之外,為什么不試著探索專用芯片之路呢?
當(dāng)時(shí)微軟才剛剛開(kāi)始用機(jī)器學(xué)習(xí)改進(jìn)必應(yīng)搜索,通過(guò)分析用戶的使用方式改善搜索結(jié)果。雖然那時(shí)候的算法對(duì)硬件的要比后來(lái)風(fēng)靡的神經(jīng)網(wǎng)絡(luò)低得多,但是芯片已經(jīng)有點(diǎn)跟不上了。
Doug Burger 和他的團(tuán)隊(duì)做了很多不同的嘗試,最終決定用了這種叫做“FPGA”(現(xiàn)場(chǎng)可編程矩陣門陣列)的芯片,它們可以在工作過(guò)程中重新編程,適應(yīng)新的任務(wù)。微軟的Windows需要運(yùn)行在英特爾的CPU上,但是CPU是不能重新編程的,一旦造出來(lái),能做什么就固定了。有了FPGA,微軟就可以改變芯片工作的方式。他們可以先對(duì)芯片編程,讓它在特定的機(jī)器學(xué)習(xí)算法中表現(xiàn)非常好;然后可以重新編程,讓它適合做邏輯運(yùn)算。同一個(gè)芯片可以有截然不同的表現(xiàn)。
大概2015年前后,微軟開(kāi)始應(yīng)用這類芯片。到現(xiàn)在,幾乎每一臺(tái)微軟的數(shù)據(jù)中心新增的服務(wù)器中都帶有一塊FPGA芯片,它們幫助呈現(xiàn)必應(yīng)搜索的結(jié)果,以及支持著微軟的云計(jì)算服務(wù)Azure。
給計(jì)算機(jī)裝上耳朵
2016年秋天,另一組微軟的研究員們做了和 Jeff Dean 的團(tuán)隊(duì)同樣的工作,構(gòu)建了一個(gè)比人類的平均水平還要高一點(diǎn)點(diǎn)的語(yǔ)音識(shí)別系統(tǒng),也是通過(guò)神經(jīng)網(wǎng)絡(luò)。
這個(gè)項(xiàng)目的負(fù)責(zé)人就是黃學(xué)東,他是來(lái)自中國(guó)的語(yǔ)音識(shí)別專家。在介紹這項(xiàng)工作的論文發(fā)表之后沒(méi)多久,他就約了他的好朋友、英偉達(dá)?CEO黃仁勛在 Palo Alto 吃了個(gè)飯。他們開(kāi)了一瓶香檳慶祝。
黃學(xué)東和他的微軟同事們就是靠著數(shù)量眾多的英偉達(dá)?GPU訓(xùn)練出他們的語(yǔ)音識(shí)別系統(tǒng)的。沒(méi)有繼續(xù)使用英特爾的CPU。如果沒(méi)有做這樣的轉(zhuǎn)換,他們很可能完成不了這項(xiàng)突破?!拔覀兓瞬畈欢嘁荒甑臅r(shí)間達(dá)到了人類的水平”,黃學(xué)東說(shuō)?!叭绻麤](méi)有新計(jì)算架構(gòu)的幫助,我們可能至少要花5年。”
基于神經(jīng)網(wǎng)絡(luò)的系統(tǒng)可以很大程度上自己學(xué)習(xí),所以它們進(jìn)化得比傳統(tǒng)方法設(shè)計(jì)的系統(tǒng)快得多。以往的系統(tǒng)需要工程師們寫下無(wú)數(shù)行代碼,仔仔細(xì)細(xì)描述系統(tǒng)應(yīng)該如何如何做?;谏窠?jīng)網(wǎng)絡(luò)的系統(tǒng)就不需要這樣。不過(guò)神經(jīng)網(wǎng)絡(luò)的問(wèn)題就是,它需要無(wú)數(shù)次的試錯(cuò)。要構(gòu)建一個(gè)單詞識(shí)別達(dá)到人類水平的系統(tǒng),研究者們需要花費(fèi)很多時(shí)間反復(fù)訓(xùn)練它,對(duì)算法做精細(xì)的調(diào)節(jié),以及不斷優(yōu)化訓(xùn)練數(shù)據(jù)。這個(gè)過(guò)程里需要嘗試成百上千算個(gè)不同的算法,每個(gè)算法又需要運(yùn)行上萬(wàn)、上億次。這需要龐大的計(jì)算能力,如果微軟這樣的公司用一般的通用芯片來(lái)做這樣的計(jì)算,這個(gè)過(guò)程花的時(shí)間就太久了,芯片可能支持不了這樣高的負(fù)載,用掉的電也太多了。
所以,幾個(gè)互聯(lián)網(wǎng)巨頭都已經(jīng)借助英偉達(dá)的GPU訓(xùn)練自己的神經(jīng)網(wǎng)絡(luò)。GPU本來(lái)的設(shè)計(jì)只是為了用在游戲圖形渲染中的,專用的設(shè)計(jì)讓它們保持了CPU近似水平的功耗,但是在神經(jīng)網(wǎng)絡(luò)訓(xùn)練中的計(jì)算速度要比CPU高很多。現(xiàn)在GPU就和CPU聯(lián)手負(fù)責(zé)計(jì)算機(jī)中的運(yùn)算。
英偉達(dá)借著這個(gè)機(jī)會(huì)大舉擴(kuò)張,向美國(guó)以及全世界的科技公司銷售了大量的GPU,中國(guó)公司的購(gòu)買數(shù)量尤為驚人。英偉達(dá)季度營(yíng)收中數(shù)據(jù)中心業(yè)務(wù)的部分,在過(guò)去的一年中翻了3倍,超過(guò)了4億美元。
“有點(diǎn)像是互聯(lián)網(wǎng)剛興起的那時(shí)候就走對(duì)了路”,黃仁勛在最近的一個(gè)采訪中說(shuō)。換句話說(shuō),科技界的局勢(shì)正在快速改變,英偉達(dá)正處在這場(chǎng)改變的中心。
創(chuàng)造專用芯片
GPU是各個(gè)公司訓(xùn)練神經(jīng)網(wǎng)絡(luò)的重要基石,不過(guò)這也只是整個(gè)過(guò)程中的一部分。當(dāng)神經(jīng)網(wǎng)絡(luò)訓(xùn)練完畢以后就可以開(kāi)始執(zhí)行任務(wù),這時(shí)候需要的計(jì)算能力又有所不同。
比如,在訓(xùn)練好一個(gè)語(yǔ)音識(shí)別算法以后,微軟會(huì)把它作為一個(gè)線上服務(wù)提供出來(lái),然后它就可以開(kāi)始識(shí)別人們講給自己手機(jī)的指令。GPU在這種時(shí)候就沒(méi)有那么高效了。所以很多公司現(xiàn)在都開(kāi)始制造專門用于執(zhí)行所學(xué)到的東西的芯片。
谷歌造了自己的專用芯片:TPU。英偉達(dá)也在造類似的芯片。微軟在繼續(xù)對(duì) FPGA 芯片重新編程來(lái)讓它們更適合運(yùn)行神經(jīng)網(wǎng)絡(luò),這些芯片來(lái)自英特爾收購(gòu)的 Altera。
其它的公司也在后面追趕。專做智能手機(jī)用的ARM芯片的高通,以及數(shù)量客觀的初創(chuàng)公司都在研發(fā)AI芯片,希望能在這個(gè)快速成長(zhǎng)的市場(chǎng)中分一杯羹。根據(jù)科技調(diào)研公司 IDC 預(yù)計(jì),到2021年,帶有替代計(jì)算芯片的服務(wù)器將達(dá)到68億美元的銷售額,大致是整個(gè)服務(wù)器市場(chǎng)的十分之一。
Bart Sano 表示目前 TPU 也只是谷歌整個(gè)網(wǎng)絡(luò)運(yùn)營(yíng)里的一小部分
Doug Burger 透露,在微軟全球的服務(wù)器網(wǎng)絡(luò)中,替代計(jì)算芯片只占了所有運(yùn)營(yíng)中很小的一部分。谷歌的網(wǎng)絡(luò)軟硬件研發(fā)工程副總裁?Bart Sano 表示谷歌的數(shù)據(jù)中心也是類似的狀況。
英特爾實(shí)驗(yàn)室的主管?Mike Mayberry 已經(jīng)向著替代計(jì)算芯片開(kāi)始發(fā)起努力??赡苁且?yàn)橛⑻貭栒紦?jù)著數(shù)據(jù)中心市場(chǎng)90%的市場(chǎng)份額,從而也是傳統(tǒng)芯片的最大的銷售商。他說(shuō),如果對(duì)CPU做一些適當(dāng)?shù)男薷?,它們也可以?yīng)對(duì)新的任務(wù)而無(wú)需其它幫助。
不過(guò)這個(gè)硅片的新浪潮擴(kuò)散得很快,英特爾的市場(chǎng)地位也越來(lái)越糾結(jié)。它一方面否認(rèn)市場(chǎng)正在發(fā)生變化,但是又或多或少地轉(zhuǎn)換著自己的業(yè)務(wù)避免掉隊(duì)。2年前,英特爾花費(fèi)了高達(dá)167億美元收購(gòu)了Altera,這家公司造的就是微軟使用的FPGA。這是英特爾歷史上最大的收購(gòu)。去年,英特爾又收購(gòu)了一家開(kāi)發(fā)專門用于神經(jīng)網(wǎng)絡(luò)的公司 Nervana,據(jù)說(shuō)又花了超過(guò)4億美元。如今,在Nervana團(tuán)隊(duì)的領(lǐng)導(dǎo)下,英特爾也在開(kāi)發(fā)一款專門用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練和執(zhí)行的芯片。
硅谷風(fēng)投公司紅杉資本的合伙人 Bill Coughran 在過(guò)去的接近10年中為谷歌的互聯(lián)網(wǎng)基礎(chǔ)設(shè)施出謀劃策,他的工作內(nèi)容基本針對(duì)的就是英特爾。他表示,“他們都有大公司病,他們需要想清楚如何踏入這片新的、成長(zhǎng)中的領(lǐng)域,而且還不損害他們的傳統(tǒng)業(yè)務(wù)?!?/p>
當(dāng)英特爾內(nèi)部高管們討論摩爾定律失效的狀況時(shí),他們內(nèi)部的混亂連公司外的人都看得到。在近期一次紐約時(shí)報(bào)的采訪中,Nervana創(chuàng)始人、現(xiàn)在已是英特爾高管的Naveen Rao表示,英特爾其實(shí)可以讓摩爾定律“再堅(jiān)持幾年”。從官方口徑上講,英特爾的姿態(tài)是傳統(tǒng)芯片的改善在未來(lái)10年都還可以順利地進(jìn)行下去。
英特爾實(shí)驗(yàn)室的主管?Mike Mayberry 則表示加一兩塊芯片不是什么新鮮事了,他說(shuō)以前的電腦里就有單獨(dú)的芯片來(lái)處理聲音之類的事情。
不過(guò)現(xiàn)在的趨勢(shì)要比以前大多了,而且從新的層面上改變著這個(gè)市場(chǎng)。英特爾面前的競(jìng)爭(zhēng)對(duì)手不僅有英偉達(dá)和高通的這樣的芯片制造商,還有谷歌和微軟這樣一直以來(lái)都相當(dāng)“軟”的公司。谷歌已經(jīng)在設(shè)計(jì)第二代的TPU芯片了。根據(jù)谷歌的說(shuō)法,今年晚些時(shí)候,任何谷歌云計(jì)算服務(wù)的客戶或者開(kāi)發(fā)者都可以在新的TPU芯片上面運(yùn)行他們自己的軟件。
雖然目前這些事情都還只發(fā)生在消費(fèi)者視野之外的大型數(shù)據(jù)中心里,但是這對(duì)整個(gè)IT工業(yè)體系產(chǎn)生廣泛的影響恐怕只是時(shí)間問(wèn)題。人們最期待的是,隨著新型移動(dòng)芯片的到來(lái),手持設(shè)備也可以獨(dú)立完成更多、更復(fù)雜的任務(wù),不再需要把任務(wù)交給幾百公里外的數(shù)據(jù)中心,無(wú)論是智能手機(jī)無(wú)需互聯(lián)網(wǎng)也能識(shí)別語(yǔ)音指令,還是無(wú)人駕駛汽車可以用現(xiàn)在無(wú)法企及的速度和精度識(shí)別周邊的世界。
換句話說(shuō),無(wú)人駕駛汽車少不了攝像頭和雷達(dá),但是同樣少不了一顆好的大腦。
via?NYTimes,雷鋒網(wǎng) AI 科技評(píng)論編譯
本文來(lái)自騰訊新聞客戶端自媒體,不代表騰訊新聞的觀點(diǎn)和立場(chǎng)
聯(lián)系客服