今天是個被AI圈刷屏的日子。
原因不是谷歌新手機和波士頓動力的機器人,而是華為發(fā)布了一款新的AI開發(fā)平臺:ModelArts。
我粗略統(tǒng)計了一下,AI從業(yè)者與開發(fā)者們之所以瞬間被撩到嗨點,是因為國內(nèi)看似熱鬧無比的AI行業(yè),其實已經(jīng)很久沒有AI開發(fā)相關(guān)的重要項目出來了。ModelArts一出來,有一種終于被重視了的“久旱逢甘霖”體驗。
這事其實非常吊詭:AI再怎么宏大敘事,不也要靠開發(fā)者一磚一瓦蓋起來嗎?可偏偏AI行業(yè)是PPT邏輯圖發(fā)了不少,用來干活的家伙卻屈指可數(shù)。
而AI開發(fā),在今天并不是一個多么成熟的工作,其中問題與矛盾非常顯著。
在HC大會第三天,華為云分析了今天AI開發(fā)的困境。今天限制AI開發(fā)的兩個主要因素,一個是快,一個是慢,兩者形成了相互依賴的矛盾體,解決一個要依賴另一個的大幅改善。
可以說,這是對AI開發(fā)現(xiàn)狀的精準判斷。
而ModelArts的價值也不僅是刷屏朋友圈,而是與其他AI開發(fā)工具一起,從全流程、普惠的角度針對性解決了今天AI開發(fā)中幾個最明顯的“槽點”。
想要明白ModelArts與AI開發(fā)生態(tài)的背后秘密,咱們要先從這些“槽點”說起。
寫到這,其實筆者心中的洪荒之力已經(jīng)按耐不住了。因為長時間采訪AI開發(fā)者,筆者電腦和大腦里都存儲了無數(shù)開發(fā)者的吐槽——要不是因為擔(dān)心收視率不高,我都能做好幾期AI吐槽大會了......
謝天謝地,好在這一切終于快結(jié)束了。
每一個都是戰(zhàn)士:
夠開幾季“吐槽大會”的AI開發(fā)者們
好,大家嚴肅點,下面開始吐槽了。
經(jīng)過長時間追蹤AI開發(fā)者,我們的記者團隊一致認為今天這個行業(yè)都是戰(zhàn)士。尤其是那些希望用AI開發(fā)來創(chuàng)業(yè)的,更是戰(zhàn)士中的斯巴達克斯。這里咱們可以看幾種最有槽點,不對,是最典型的AI開發(fā)案例:
案例1:親朋好友一起上型AI開發(fā)者。我們知道,AI里有個詞叫做AI民工,或者數(shù)據(jù)民工。就是說AI訓(xùn)練之前,其實有大量時間沒干別的,就是做數(shù)據(jù)標記。這個活其實非常簡單,但問題是極其枯燥大量重復(fù),并且一旦某些數(shù)據(jù)標記錯,很可能帶給開發(fā)者后面訓(xùn)練時以“無限驚喜”。
而我們了解到的情況是,雖然大家都在說所謂AI民工,但這個崗位由于非常新穎且上下不靠,即使在大公司也是稀缺資源。而對小團隊開發(fā)者來說,哪里找AI民工來標記數(shù)據(jù)?。克院芏嗳说慕鉀Q方案,就是親戚群里發(fā)紅包幫標點數(shù)據(jù)、老同學(xué)里叫一聲幫我弄點數(shù)據(jù),更有甚者我見過朋友圈眾籌標數(shù)據(jù)的——做AI,愣做出了拼多多購物的既視感。
案例2:“Boss求求你了”型AI開發(fā)者。這種開發(fā)者一般存在于科研機構(gòu)和高校中,以在讀博士為主要人群。他們寫完模型,等著變成paper,于是想用學(xué)校買的架構(gòu)驗證一下。那么好,先登記排隊。輪到號了訓(xùn)練一下一星期過去了,結(jié)果發(fā)現(xiàn)不太對?挑個參數(shù)又一星期,優(yōu)化一下數(shù)據(jù)集又一星期。由于師兄師弟不少,還就經(jīng)常輪不上你。
模型錯誤幾次,這類開發(fā)者和他們的導(dǎo)師都很容易抓狂。于是經(jīng)常出現(xiàn)這樣一幕:某某AI博士哭訴“Boss大人求求你了再讓我算一次吧”。
案例3:創(chuàng)業(yè)焦慮型AI開發(fā)者。創(chuàng)業(yè)AI開發(fā)者,注重更多的是在部署和應(yīng)用,而巧的是坑也在這里。我們采訪過一個案例,開發(fā)者做了一個教育類的深度學(xué)習(xí)算法,但在部署時卻發(fā)現(xiàn),TensorFlow上訓(xùn)練的模型不支持大規(guī)模GPU并用,給后續(xù)帶來了無盡麻煩。
部署難,一部署就出錯,是很多AI開發(fā)者面臨的瓶頸。創(chuàng)業(yè)團隊辛辛苦苦訓(xùn)練了個聰明的模型,一投入應(yīng)用就變傻子,這感覺豈是一個酸爽了得。
案例4:理想豐滿型AI開發(fā)者。AI大潮襲來,也催生了很多非科班出身,尤其是IT工程師轉(zhuǎn)型AI。結(jié)果一入門發(fā)現(xiàn),各種算法算力算子不計其數(shù),調(diào)參配比極其復(fù)雜。而且AI的黑箱性還帶來一種“養(yǎng)蠱”的快感,入門級選手連錯都不知道哪錯了。最終只能是AI前景遠大,AI理想豐滿,AI讓我暫時撤退……
案例5:早知如此型AI開發(fā)者。 AI開發(fā),經(jīng)常要經(jīng)過N個版本的優(yōu)化和再訓(xùn)練,當然這就跟做設(shè)計一樣,經(jīng)常結(jié)果是第一版最好。于是經(jīng)常出現(xiàn)老板或者導(dǎo)師沉思了一下,說:我覺得三版之前那個蠻好的,找出來數(shù)據(jù)再優(yōu)化一下吧。呵呵噠,三版之前是啥天知地知反正我不知——遇到這種情況,開發(fā)者經(jīng)常只能捶地大喊:早知如此何必……
案例6:對不起有點狂,因為可吐槽的案例實在太多了,就說最后一個吧。還有一種“社區(qū)大神”人設(shè)的AI開發(fā)者,專注混社區(qū)五百年。貌似啥都會,就是不會賺錢。我們見過盜用大神分享的工具和數(shù)據(jù)拿到融資,但大神愣不知道的。AI開發(fā)人才如何實現(xiàn)IP保護和變現(xiàn),其實也是個大問題。
AI開發(fā),是個有多重要就有多少無奈的行當。
好在,以上這密密麻麻的槽點,已經(jīng)被華為剛發(fā)布的ModelArts以及相關(guān)工具“一劍斬群寇了”。
讓“貝爺”們都進星級廚房:
華為做了個什么事?
假如說,開發(fā)者是一位位大廚,打算為我們端上美味的AI大餐。
那么今天AI開發(fā)的問題,就是大廚們不是穿戴整齊走進廚房煎炒烹炸。而是上山找芯片調(diào)算力,下海找人標數(shù)據(jù),進林子里采工具,到亂世從中跑訓(xùn)練。好端端的一位大廚,愣被割裂的開發(fā)場景和高企的費用給逼成了《荒野求生》的貝爺。
而假如一位廚師要從上山打獵開始做起,又怎么能期望他燉肉效率高呢?
為什么會這樣?
原因在于今天的深度學(xué)習(xí)訓(xùn)練流程,是在一個個偶然、垂直條件下產(chǎn)生的。開發(fā)框架有的是最開始僅供少部分科研,有的是僅供企業(yè)內(nèi)部調(diào)用;數(shù)據(jù)集和算子,是經(jīng)過各種偶然因素,被不同人或組織開源的;AI算力,最早都是附加在IT算力上的“增值服務(wù)”。而一些自動機器學(xué)習(xí)項目,則噱頭價值遠大于實際部署價值——于是四面奔波,不斷解決兼容問題就成了開發(fā)者的常規(guī)操作。
而華為云剛剛在HC大會上拿出來的ModelArts,特質(zhì)就在于它把以上場景全都整合到了一套云服務(wù)體系下。開發(fā)者可以不離開系統(tǒng),完成從數(shù)據(jù)標記與訓(xùn)練準備,到訓(xùn)練、調(diào)試、推理、部署等所有工作。
這就好比打造了一整套星級廚房,里面有水電燃氣,各種廚具食材,那么開發(fā)者將省去前面無比漫長的準備工作,直接一展廚藝可矣。
具體來說,名為ModelArts的廚房,跟以前常規(guī)用的“野炊”模式相比,有四大直觀改變:
一、食材隨意購
AI開發(fā)者能夠快速完成數(shù)據(jù)標記,就像廚師能夠快速買到食材一樣重要。畢竟做廚師,沒有先從養(yǎng)殖場干起的——知道的我是AI開發(fā)者,不知道還以為我是數(shù)據(jù)農(nóng)家樂呢!
針對最耗時的數(shù)據(jù)標記環(huán)節(jié),ModelArts內(nèi)置了AI數(shù)據(jù)框架,以AI機制來治理數(shù)據(jù),用迭代訓(xùn)練來解決標注的數(shù)據(jù)量問題。也就是讓AI來完成數(shù)據(jù)標注本身,不斷優(yōu)化數(shù)據(jù)集,從而讓數(shù)據(jù)標注與準備效率百倍提升。
當然,數(shù)據(jù)還是開發(fā)者來準備,只是準備體驗將獲得巨大躍升。
二、開灶有火
AI模型的訓(xùn)練速度,關(guān)乎于AI算力的提供,也關(guān)乎于訓(xùn)練平臺的路徑優(yōu)化。AI訓(xùn)練過程就像點火做飯,火夠大當然炒菜更快。針對訓(xùn)練效率問題,ModelArts通過各類優(yōu)化技術(shù),達成了在同樣的模型、數(shù)據(jù)集和同等硬件資源情況下,模型訓(xùn)練耗時降低一半——換句話說,這意味著同樣算力可以供給多一倍的開發(fā)者使用。
三、廚具齊全
上面說過,AI最怕部署,有些AI模型甚至有“見光死”的特點。尤其面對部署在不同的軟硬件架構(gòu)上,給人一種東家借口鍋,西家偷個鏟的感覺。而基于全棧AI解決能力,ModelArts實現(xiàn)了一鍵推送模型到所有邊緣、端的設(shè)備上的能力,并支持在線部署和批量推理,滿足大并發(fā)和分布式這些最困難的部署方式??芍^一應(yīng)出具俱全,做出什么菜式都不在話下。
四、還有廚房家電都能幫忙
AI開發(fā)者的最后問題,可能是機器學(xué)習(xí)訓(xùn)練中的技術(shù)門檻。針對于此,ModelArts不僅給出了明確的教學(xué)演練,還創(chuàng)造性地引入了AI自動學(xué)習(xí)功能,包括模型的自動設(shè)計與自動調(diào)參等,可以給開發(fā)者智能化幫助。
此外,ModelArts還實現(xiàn)了全流程可視化管理,不管丟在哪里的數(shù)據(jù)和模型都能準確找到,這也間接有利于AI黑想象的攻克。
這些蘊藏的“AI黑科技”,就像冰箱微波爐這些現(xiàn)代廚房神器,以AI開發(fā)AI,降低開發(fā)者技術(shù)門檻,或許是接下來新的潮流。
值得注意的是,華為云這次不光發(fā)布了“廚房”,還帶來了“餐廳”。于是我們看到了機器視覺開發(fā)平臺HiLens,以及離線開發(fā)套件Atlas 200 、量子計算模擬器與編程框架HiQ,讓開發(fā)者可以模擬重要環(huán)境的實際應(yīng)用場景。
據(jù)華為云介紹,ModelArts將在年底前上線,我們會第一時間帶來上線評測。
全棧AI的第一個紅利:
為什么ModelArts敢說“全生命周期”?
在采訪中,華為云認為,目前業(yè)界的AI開發(fā)平臺,問題是都相對場景單一,不夠全面。而ModelArts則率先做到了全生命周期開發(fā),可以支撐和管理AI開發(fā)當中的每一個環(huán)節(jié)。上面我們也說過,將割裂場景整合到一起,構(gòu)成全生命周期AI開發(fā),是ModelArts倒逼解決慢與貴的核心優(yōu)勢。
這里有個問題值得注意,相信也是大家所關(guān)心的:顯然每個人都知道廚房更好用,不想去野地里做飯,那么為什么只有華為的ModelArts,在今天敢說自己是“全生命周期”?
我們或許可以這樣理解:在華為全棧AI體系剛剛發(fā)布48小時,ModelArts與視覺AI應(yīng)用開發(fā)平臺HiLens、離線開發(fā)套件Atlas 200 、量子計算模擬器與編程框架HiQ四件套代表的AI開發(fā)平臺已經(jīng)變成了第一個紅利級產(chǎn)品。事實上,ModelArts本身就是華為全棧AI體系的組成部分。與芯片、架構(gòu)、AI使能平臺緊密相連,從而能夠一個場景跑通所有數(shù)據(jù)、訓(xùn)練、推理的需要??梢哉f是剛剛發(fā)布的華為全棧AI,探出的第一根觸手。
其次,全生命周期的AI開發(fā),算力是一切的基礎(chǔ)。在昇騰芯片到來后,華為獲得了能夠組織大規(guī)模AI并聯(lián)算池的機會,從而可以保證全場景AI開發(fā)運行無阻。這里有一個環(huán)環(huán)相扣的AI推導(dǎo)邏輯。
再者,我們確實可以看到,今天無論是世界巨頭還是獨角獸公司。所推的AI開發(fā)平臺都是基于自身的業(yè)務(wù)考量。不會有公司推出一個與自己業(yè)務(wù)不想關(guān),甚至自身能力之外的AI開發(fā)平臺。所以我們看到AI開發(fā)場景,依然是東一榔頭西一棒子的狀態(tài)。
而華為云,則是圍繞用戶為中心打造了AI開發(fā)平臺,以不讓開發(fā)者奔波為第一思路。并且確實認真看了哪些復(fù)雜可以留給自己,找到了很多關(guān)鍵矛盾的背后邏輯,并將之消解化。這歸因于華為的IT儲備優(yōu)勢,但更歸因華為云“復(fù)雜的歸自己”以及“解決實際問題”兩大核心理念。
對比之下,以往的AI開發(fā)平臺,更多是以自身產(chǎn)業(yè)利益為視角構(gòu)建產(chǎn)品,而不是以開發(fā)者為出發(fā)視角,或者說不具備以開發(fā)者為中心,清掃問題的產(chǎn)業(yè)條件。
當全生命周期的AI開發(fā)平臺開始出現(xiàn),本質(zhì)上意味著某些AI產(chǎn)業(yè)的“黑歷史”將開始瓦解。無論是華為云還是其他品牌,很快會讓AI開發(fā)變成一個拼創(chuàng)意與想象力的游戲——而不是勞動力、資金成本與技術(shù)門檻相互競底的搞笑節(jié)目。
未來的某個時刻,我們會回想起那段AI開發(fā)能開“吐槽大會”的日子,后輩會覺得簡直不可思議,往事杯酒,幾成笑談。
但那時已經(jīng)遍布AI的世界,卻并不會笑我們。因為從鉆木取火,到探索人工智能,歷史會記住每一位開發(fā)者都是偉大的。
聯(lián)系客服