文:Apple
編:亦可
毫無疑問,當(dāng)前的科技圈已進(jìn)入“大模型”時(shí)代。含“模”量大到什么程度?但凡科技企業(yè),基本都在做“大模型”。
“從去年12月ChatGPT(Chat Generative Pre-trained Transformer)引爆科技圈之后,幾乎所有行業(yè)玩家都想抓住這根救命稻草。因?yàn)樽龀闪司鸵馕吨プ∥磥韼资甑内厔?shì)。”行業(yè)創(chuàng)業(yè)者夏先生對(duì)壹DU財(cái)經(jīng)說道:“ChatGPT是生成式AI,是大模型的落地場(chǎng)景之一。理論上講,這條路的走通,加速了大模型在短期內(nèi)的爆發(fā)。”
的確,ChatGPT的爆發(fā),讓更多人看到了語言模型的魅力。微軟、谷歌、百度、阿里等
國(guó)內(nèi)外科技巨頭快速響應(yīng),相繼推出自家的AI聊天機(jī)器人,試圖以To C作為切入口,搶占市場(chǎng)。
風(fēng)口在哪里,資金和人才就在哪里。隨后,先是廠商陸續(xù)宣布推出大模型,如百度的文心大模型、阿里的通義大模型、騰訊的行業(yè)大模型,后有科技圈曾經(jīng)的風(fēng)云人物也開始陸續(xù)入場(chǎng),李開復(fù)、王小川、周伯文、王慧文等。出行、認(rèn)知、辦公等一些垂直領(lǐng)域的大模型也相繼推出。
半年時(shí)間,國(guó)內(nèi)呈現(xiàn)出“群模亂舞”盛況。而在經(jīng)歷喧囂后,大模型或許是時(shí)候回歸現(xiàn)實(shí)了。
玩家們開始意識(shí)到,最初的熱鬧僅僅是熱鬧,他們最終的戰(zhàn)場(chǎng)在B端市場(chǎng)。此時(shí),多家有著人工智能積累和云計(jì)算大廠登臺(tái),相繼推出了AI大模型服務(wù)。
行業(yè)老炮和新手創(chuàng)業(yè)者的對(duì)決,也就此開始了。
01
熱情高漲,玩家們跑步入場(chǎng)
進(jìn)入2023年,大模型技術(shù)讓科技圈沸騰起來??吹紺hatGPT爆發(fā)后,不少大廠抓緊時(shí)間推出相應(yīng)產(chǎn)品,新老創(chuàng)業(yè)者們著急招兵買馬,生怕慢一步就錯(cuò)過了這難得的風(fēng)口。一級(jí)市場(chǎng)關(guān)于大模型的投融資熱度也在攀升,不少FA開始瘋狂補(bǔ)課。
一時(shí)間,整個(gè)行業(yè)熱鬧非常。
在OpenAI發(fā)布GPT4大模型后,第一個(gè)采取行動(dòng)的是百度,在3月16日用“Demo演示”的形式正式發(fā)布文心一言。同樣在3月,已經(jīng)沉寂許多的周鴻祎推出大模型產(chǎn)品,甚至連名字都沒來得及取。
在此之后,科技巨頭、創(chuàng)業(yè)公司和高校研究院們展開了一場(chǎng)關(guān)于“大模型”的競(jìng)速賽。整個(gè)4月,都成了“大模型的發(fā)布月”,華為、商湯、阿里都在4月份亮出了自己的大模型產(chǎn)品。
到了5月,訊飛推出了自己的星火大模型,并公布了大模型在自己優(yōu)勢(shì)領(lǐng)域的諸多應(yīng)用場(chǎng)景。
創(chuàng)業(yè)者們也在火速入場(chǎng)。原美團(tuán)聯(lián)合創(chuàng)始人王惠文(目前已退出)、創(chuàng)新工場(chǎng)CEO李開復(fù)、前京東AI掌門人周伯文、前阿里技術(shù)副總裁賈揚(yáng)清等開始招兵買馬。前搜狗CEO王小川的百川智能拿到5000萬美元融資后,甚至揚(yáng)言:“今年年底做到國(guó)內(nèi)最好的”。
“這波創(chuàng)業(yè)熱潮有點(diǎn)2000年左右的互聯(lián)網(wǎng)創(chuàng)業(yè)潮的意思?!币晃粯I(yè)內(nèi)人士說道:“似乎每個(gè)創(chuàng)業(yè)者都想在這個(gè)時(shí)代找到第二春?!?/span>
總體來看,今年上半年,大模型幾乎成為所有科技企業(yè)的必選項(xiàng)。對(duì)于普通人而言,大模型或許是件很遙遠(yuǎn)的事。畢竟不是每次科技浪潮都能成功靠岸,如元宇宙、XR等行業(yè)。
但事實(shí)上,大模型的應(yīng)用更多在B端市場(chǎng)。那么,在行業(yè)烈火烹油過后,擺在這些玩家眼前的,理應(yīng)是他們對(duì)市場(chǎng)更多的理性思考。比如市場(chǎng)是否真的需要大模型?大模型真正走向成熟,需要越過哪些重要關(guān)卡?能否真正意義上實(shí)現(xiàn)商業(yè)化。
02
“軍備賽”開打
大模型軍備賽的沖鋒號(hào)吹響后,整個(gè)行業(yè)開始“卷”起來。更多玩家已經(jīng)將視線移至應(yīng)用層面。因?yàn)樾袠I(yè)“退燒”后,最終考驗(yàn)的還是玩家們的“硬實(shí)力”。
此時(shí),一些在人工智能、云計(jì)算上有積累的玩家則占據(jù)的先發(fā)優(yōu)勢(shì)。尤其是模型的參數(shù)量。
就目前市場(chǎng)上發(fā)布的AI模型來看,雖然大家都自稱為“大模型“,但參數(shù)量實(shí)質(zhì)是大模型和小模型的界定因素之一。
此前,百度集團(tuán)副總裁侯震宇在接受媒體采訪時(shí)曾表示,2022年,10億參數(shù)的模型就叫大模型。但到了眼下,千億參數(shù)以上才會(huì)出現(xiàn)“智能涌現(xiàn)”,才會(huì)形成泛化能力,才能在各個(gè)場(chǎng)景下具備通用能力。
何為“智能涌現(xiàn)”?簡(jiǎn)單地講,當(dāng)模型規(guī)模、算力水平超過某個(gè)參數(shù)閾值后,AI效果將不再是隨機(jī)概率事件。比如初期語言大模型出現(xiàn)“圖不對(duì)文”“答非所問”等現(xiàn)象。
并且在通用領(lǐng)域,參數(shù)量越大,智能通常涌現(xiàn)的可能性就越大,AI準(zhǔn)確率就越高。在垂直領(lǐng)域則更容易獲得精確的效果。
今年5月,科技部下屬的中國(guó)科學(xué)技術(shù)信息研究所發(fā)布的《中國(guó)人工智能大模型地圖研究報(bào)告》統(tǒng)計(jì),截至5月28日,國(guó)內(nèi)10億級(jí)參數(shù)規(guī)模以上基礎(chǔ)大模型至少已發(fā)布79個(gè)。
但可以看到,10億級(jí)參數(shù)這個(gè)量級(jí),很可能不是真正的“分界線”。因?yàn)楝F(xiàn)實(shí)的情況是,一些未能達(dá)到千億規(guī)模的模型,很難在當(dāng)前市場(chǎng)的競(jìng)爭(zhēng)具有競(jìng)爭(zhēng)力。不過,也不排除一些在垂直領(lǐng)域深耕的玩家,最終能跑出來。
“大模型需要算力、算法和數(shù)據(jù)積累,絕對(duì)不是玩概念的事情,最終還是要市場(chǎng)買單?!毕南壬J(rèn)為,目前來看諸如百度、騰訊、阿里無論是在資源還是積累上,都有一定的優(yōu)勢(shì),“他們?cè)谠剖袌?chǎng)深耕,并在自己擅長(zhǎng)的領(lǐng)域積累多年,無論技術(shù)層面還是行業(yè)積累上,實(shí)質(zhì)已經(jīng)完成了搶跑,未來就看這些頭部玩家如何落地?!?/span>
而在投入層面,這會(huì)是一個(gè)天文數(shù)字。
以百度為例。據(jù)透露,過去10年,百度在AI方向的投入已超過1000億元。但大模型不是投一筆錢、做一個(gè)模型那么簡(jiǎn)單,它需要有算力、有數(shù)據(jù)、有經(jīng)驗(yàn)豐富的AI工程師在好的研發(fā)平臺(tái)上長(zhǎng)期積累。
而創(chuàng)業(yè)公司如果直接去做基礎(chǔ)大模型,除了上述投入之外,還需要能夠把模型、算力管理好的AI開發(fā)平臺(tái)。
這意味著,創(chuàng)業(yè)公司不論是自建開發(fā)平臺(tái),還是采購(gòu)?fù)獍脚_(tái),其投入都不會(huì)是小數(shù)目。并且,大模型不是預(yù)訓(xùn)練出來就好,更需要后續(xù)持續(xù)敏捷迭代。從這一點(diǎn)看,創(chuàng)業(yè)公司所受的限制明顯要高于大公司。
但大廠很難留住強(qiáng)算法人才的弊端也比較突出,因?yàn)榇竽P屯度胧且患L(zhǎng)期主義的事,必定會(huì)面臨與既有業(yè)務(wù)之間的沖突。這一點(diǎn),從大廠出走的大模型創(chuàng)業(yè)者的經(jīng)歷,就說明了一點(diǎn)。長(zhǎng)期主義對(duì)創(chuàng)業(yè)公司同樣重要,無論是創(chuàng)始人的背景背書,還是資源合作,抑或是客戶的拓展,都需要長(zhǎng)期積淀。
03
行業(yè)競(jìng)賽即將鳴槍
人工智能專家侯世達(dá)的學(xué)生梅拉妮·米歇爾《AI 3.0時(shí)代》一書中提到,研究人工智能與賽道中的創(chuàng)業(yè)者們都熟悉了一種模式——先是“人工智能的春天”,緊接著是過度的承諾和媒體炒作,接下來便是“人工智能的寒冬”。并且,他認(rèn)為這一模式將以五到十年為周期不斷上演。
具體到2023年上半年的大模型賽道,顯然其正處于第二個(gè)階段——行業(yè)很火,市場(chǎng)很熱。這一周期往往是最短的,也通常意味著如此去泡沫化后,賽道競(jìng)爭(zhēng)即將正式開始。
大模型比拼的不僅僅是技術(shù),還應(yīng)該將重點(diǎn)放在大模型應(yīng)用、產(chǎn)業(yè)生態(tài)中去評(píng)估。
目前,市場(chǎng)上大模型的玩家主要分三類。
一是聚焦基礎(chǔ)層,主要對(duì)標(biāo)OpenAI,發(fā)揮基礎(chǔ)設(shè)施的作用。
第二類是錨定中間層,不需要像OpenAI一樣花大錢做底層,只需要掌握通用化能力,就可以通過開源大模型做精調(diào),讓模型具備差異化能力,最終可以形成垂直類模型。
第三類是調(diào)用大模型API的企業(yè),專注開發(fā)大模型具體場(chǎng)景的應(yīng)用,如Jasper。
相對(duì)而言,前兩類又是大模型的“基礎(chǔ)設(shè)施”,因?yàn)橛袠O高的門檻,對(duì)技術(shù)、資金以及資源有嚴(yán)格的準(zhǔn)入壁壘,往往是大公司布局的主要方向。
目前來看,百度、阿里和華為在大模型的構(gòu)建上,不約而同地采用了“模型+工具平臺(tái)+生態(tài)”的三層共建模式。騰訊云則更專注于應(yīng)用層而,6月19日公布的騰訊云MaaS服務(wù)解決方案即覆蓋了金融、文旅、政務(wù)、教育等10個(gè)行業(yè)、超50個(gè)解決方案。
雖然巨頭們參與競(jìng)爭(zhēng)的姿勢(shì)不同,但目標(biāo)實(shí)質(zhì)上只有一個(gè),那就是打通應(yīng)用層。在百度創(chuàng)始人李彥宏看來,應(yīng)用層最具想象空間。
商湯科技聯(lián)合創(chuàng)始人楊帆認(rèn)為,AI 基礎(chǔ)設(shè)施本質(zhì)上還是算力、數(shù)據(jù)、基礎(chǔ)算法,包括算法相關(guān)的工具,本質(zhì)上還是三位一體的東西。最后誰能把這三者的整合能力提供的好,提供更低成本、更低門檻的能力是決定整個(gè)競(jìng)爭(zhēng)最重要的點(diǎn)。
結(jié)語
AI大模型是人工智能邁向通用智能的里程碑式技術(shù),因?yàn)槠淇蔀楦餍懈鳂I(yè)的智能化升級(jí)提供強(qiáng)勁的生產(chǎn)力工具。在千行百業(yè)數(shù)字化轉(zhuǎn)型升級(jí)的當(dāng)下,大模型的重要意義不言而喻。也因此,在當(dāng)下,誰能率先在賽道里搶到更多籌碼,就非常關(guān)鍵了??梢灶A(yù)料,未來,拋開“基礎(chǔ)設(shè)施”層面的較量外,真正的戰(zhàn)場(chǎng)大概率是各行各業(yè)的切實(shí)落地上。
聯(lián)系客服