NB!對不起,實(shí)在沒忍住說出這兩個(gè)字。
ChatGPT(GPT-3.5)引爆科技圈后,所有人都在討論,AI下一步會(huì)往哪個(gè)方向發(fā)展。
上一次有這種感覺,還是初代iPhone發(fā)布的時(shí)候。
我們并沒有等太久。
隔夜,OpenAI正式推出新品GPT-4,再次點(diǎn)燃了大家的想象力。
老板Sam Altman直接開門見山地介紹:
這是我們迄今為止功能最強(qiáng)大的模型!
有多強(qiáng)?
就像不少人感嘆的:如果GPT-3.5尚屬意料之中,GPT-4則讓我自愧不如。
這一波,真是科幻照進(jìn)現(xiàn)實(shí)了。
怎么證明一個(gè)人比另一個(gè)人水平高?
現(xiàn)實(shí)社會(huì)中,主要手段是考試、拿證。
所以,想讓大部分人直觀地感受到,新AI模型比舊的牛逼,同樣是考試。
OpenAI用GPT-4參加了多項(xiàng)美國通用考試,成績很驚艷:
在SAT數(shù)學(xué)和閱讀考試中,GPT-4比GPT-3.5高150分;
它還能通過律師模擬考試,得分排在應(yīng)試者前10%,而震撼全球的GPT-3.5只能排在倒數(shù)10%……
隨后,在YouTube上進(jìn)行的Live Demo中,OpenAI展示了GPT-4的真正實(shí)力:總結(jié)文章、寫代碼、報(bào)稅、寫詩……GPT-3.5做不到的,GPT-4輕松拿下。
而且,還不僅僅是這樣。
根據(jù)OpenAI官網(wǎng)描述,相較于GPT3.5,GPT-4最大的進(jìn)化在于:“多模態(tài)”和長內(nèi)容生成。
其中的關(guān)鍵,就是多模態(tài)這個(gè)詞,顧名思義,就是不同類型數(shù)據(jù)的融合。
目前GPT-4最大的突破,就是擁有了“讀圖能力”。
用戶可以直接用圖片提問,它能夠在讀懂圖片內(nèi)容的基礎(chǔ)上,給出有邏輯的回答。
有個(gè)形象的例子。
下面這個(gè)人用筆在本子上畫了個(gè)網(wǎng)站的草圖,然后用手機(jī)拍下來,發(fā)送給GPT-4。
10秒鐘后,它不僅識別出圖片的含義,還生成了要建立這個(gè)網(wǎng)站的代碼。
“您好,您的網(wǎng)站建好了?!?/span>
這個(gè)事件中,最核心的點(diǎn)并不在于編程、計(jì)算和分析能力,而是它能準(zhǔn)確理解圖片的含義,并給出解答,甚至是圖片解答。
這就比GPT-3.5高出一個(gè)世代了。
兩者的表現(xiàn)力根本不是一個(gè)級別的。我們可以理解為,在純文字的年代,照相機(jī)的出現(xiàn),對信息交流產(chǎn)生了多大的促進(jìn)作用。
這就是AI進(jìn)化史上類似的事件。
甚至,這也只是表象。更讓我震驚加一點(diǎn)恐懼的,是GPT-4具備的的初步邏輯思維能力。
正如OpenAI在今天的博文中所說:
我們創(chuàng)建了GPT-4,這是 OpenAI 努力擴(kuò)展深度學(xué)習(xí)的最新里程碑。雖然在許多現(xiàn)實(shí)世界場景中的能力不如人類,但在各種專業(yè)和學(xué)術(shù)基準(zhǔn)上表現(xiàn)出人類水平。
在OpenAI提供的一個(gè)示例中,GPT-4準(zhǔn)確地回答了幾個(gè)網(wǎng)絡(luò)meme為什么搞笑的問題,雖然解釋得并不好笑。
GPT-4還學(xué)會(huì)簡單的邏輯推理了。比如你問,圖片里的繩子剪斷會(huì)發(fā)生什么。它答,氣球會(huì)飛走。
它甚至可以講出一些質(zhì)量不咋地、模式化的冷笑話。雖然并不好笑,但至少,它已經(jīng)開始理解“幽默”這一人類特質(zhì)。
這兩件小事看起來挺弱智的,卻是AI向人類思維慢慢進(jìn)化的標(biāo)志。
就像古猿人第一次學(xué)會(huì)直立行走,石器時(shí)代的原始人第一次思考人與自然的關(guān)系。
微觀角度看,這沒什么大不了的。但拉長時(shí)間線,以后人的眼光看,這也許正是偉大變革的前奏曲。
就像我們研究原始人走路一樣。
當(dāng)然,GPT-4依然有局限性。
首先,它的知識范疇也存在時(shí)間限制,截止于 2021 年 9 月。
其次,AI畢竟是AI,OpenAI也表示目前GPT-4并不完美,它在很多場景下的能力都不如人類。
據(jù)稱,該模型仍然存在“幻覺”或編造事實(shí)的問題,并且在事實(shí)方面也不一定總是可靠的,“它傾向于堅(jiān)持認(rèn)為它是正確的,即使它錯(cuò)了”。
OpenAI表示,GPT-4正在努力解決其局限性,例如社會(huì)偏見、幻覺和對抗性提示。
但盡管如此,沒人能否認(rèn),GPT非常有潛力。
世界上任何事,最難的永遠(yuǎn)不是做不到,而是想不到。
只要有個(gè)雛形,哪怕很low、很簡陋,距離做好就不會(huì)很遠(yuǎn)了。
OpenAI做出ChatGPT,最大的意義是是向大家證明,這種應(yīng)用是存在的,這種技術(shù)是可行的。這件事,不是干不成的。
就好像多年前,大家都在空談概念的時(shí)候,只有特斯拉先做出了成品。
一個(gè)恐怖的事實(shí):GPT-4早在去年8月就訓(xùn)練完成了。
之所以現(xiàn)在才面市,是OpenAI需要花6個(gè)月時(shí)間,讓它變得更安全。
這就不得不讓人浮想聯(lián)翩。
會(huì)不會(huì)已經(jīng)有GPT-5、GPT-6了,它們到底是什么樣子?是否已經(jīng)成長為無法掌控的巨獸?
OpenAI的內(nèi)部技術(shù),到底領(lǐng)先外界多少年?
巨大的壓力給到全世界。
自ChatGPT發(fā)布以來,國內(nèi)外眾多科技公司對AIGC技術(shù)的追捧已達(dá)到空前絕后的熱度了。
Chat GPT剛剛發(fā)布,百度便立即官宣了大模型新項(xiàng)目“文心一言”(ERNIE Bot),將在明天和大家見面。
在此后很短的一段時(shí)間內(nèi),阿里、京東、騰訊、字節(jié)跳動(dòng)、360等多家互聯(lián)網(wǎng)及IT企業(yè)紛紛表示對AIGC技術(shù)發(fā)展的關(guān)注和跟進(jìn),并同步提出了一些相關(guān)計(jì)劃。
種種跡象表明,從科技巨頭到行業(yè)龍頭,中國企業(yè)已紛紛進(jìn)入AIGC賽道競逐。
但是,這塊蛋糕,并不好吃。
GPT-4是人工智能生成內(nèi)容——AIGC技術(shù)最新進(jìn)展的代表。
所謂AIGC,是繼專業(yè)生成內(nèi)容(PGC)、職業(yè)生成內(nèi)容(OGC)、用戶生成內(nèi)容(UGC)后,互聯(lián)網(wǎng)內(nèi)容生成的第四個(gè)階段——神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)。
這的確是人類科技史上翻天覆地的革命。
GPT-3.5和GPT-4,之所以能生成文字、代碼、語音、圖片、視頻,完成語言翻譯、文案撰寫、腳本編程,是因?yàn)镺penAI對數(shù)據(jù)、算力、算法等關(guān)鍵要素進(jìn)行了幾個(gè)世代的升級。
先說數(shù)據(jù)。
僅GPT-3.5的訓(xùn)練參數(shù),就達(dá)到1750億個(gè)以上。
想要把如此海量的數(shù)據(jù)被反復(fù)投喂給AI模型,單次訓(xùn)練成本就高達(dá)460萬美元。
如果不是先有馬斯克、后有微軟的支持,OpenAI是不可能耗費(fèi)得起的。
再說算力。
2012-2018年,全球AI算力需求增長約為30萬倍,這個(gè)數(shù)字已經(jīng)很恐怖了。
但從2018年起,隨著Google Duplex、Open AI Five以及新華社全球第一個(gè)“AI合成主播”上崗,人工智能技術(shù)開始加速落地。尤其是今年,稱得上是爆發(fā)之年。
按照現(xiàn)在的進(jìn)度,根據(jù)預(yù)測,AI所需算力每100天將翻一倍。
也就是說,到2030年,AI所需算力是現(xiàn)在的3200萬倍。(2的25次方)
顯然,如果不在軟件服務(wù)、硬件支撐、芯片技術(shù)等方面協(xié)同創(chuàng)新,我們的算力水平不可能實(shí)現(xiàn)指數(shù)級別的增長。
GPT-4的訓(xùn)練是在微軟云上進(jìn)行的。而在全球云計(jì)算市場,微軟云排名第二,再加上芯片技術(shù)的高速發(fā)展,這些都為ChatGPT的橫空出世奠定了堅(jiān)實(shí)的算力基礎(chǔ)。
最后說算法。
相比傳統(tǒng)的AI算法,GPT的優(yōu)勢在于,通過海量參數(shù),進(jìn)一步提升模型的精確度。
初代GPT模型的參數(shù)是1.17億個(gè);GPT-2事15億個(gè),增加了10倍;GPT-3達(dá)到1750億,是GPT-2的 100 倍;而GPT-4的真實(shí)參數(shù)在1750億-2800億之間,并沒有比GPT-3高出太多,其重點(diǎn)在數(shù)據(jù)處理優(yōu)化上。
這種大模型算法的實(shí)現(xiàn),必須有高效率的算法框架來支撐,因?yàn)閰?shù)量上去之后,需要把模型和數(shù)據(jù)分散放到多個(gè)GPU卡上,卡之間如何通信、調(diào)度,如何進(jìn)行高效的反向傳播,都需要大量高水平技術(shù)人才來推進(jìn)和實(shí)施。
GPT之所以獨(dú)特,就是在目前世界上最強(qiáng)大的LLM(大語言模型)為基礎(chǔ)的同時(shí),引入了基于人類反饋的強(qiáng)化學(xué)習(xí)方法,從而提高了對話的質(zhì)量,而升級到多模態(tài)預(yù)訓(xùn)練大模型GPT-4版本后,其對話質(zhì)量變得更加強(qiáng)大、完美。(具體可閱讀《ChatGPT的兩宗罪》)
同時(shí)也能看到,GPT-4之所以比GPT3.5強(qiáng)得有限,可能就是算法的效率達(dá)到瓶頸了。
GPT-5,可能沒有我們想象的那么快到來。
綜上,可以看出,ChatGPT是靠強(qiáng)大算力和高成本,用大規(guī)模的數(shù)據(jù)“喂”出來的AI模型,它的出圈看似是偶然的,但其成功卻絕非偶然。
其他公司想要復(fù)制一款ChatGPT,絕非隨便設(shè)計(jì)個(gè)對話模型就完事。
事實(shí)上,國內(nèi)AI領(lǐng)域真正缺乏的是技術(shù)積累,包括數(shù)據(jù)的清洗和標(biāo)注、模型的結(jié)構(gòu)設(shè)計(jì),以及怎么訓(xùn)練、推理等,這些技術(shù)很多都需要經(jīng)驗(yàn)和積累,需要大量的科研人才和普通技術(shù)人員一步一個(gè)腳印走出來。
這方面,目前大公司更有優(yōu)勢。
比如百度,之所以能盡快推出“文心一言”,就是因?yàn)槠涫甓鄟砝塾?jì)投入了超過1000億元的技術(shù)研發(fā)經(jīng)費(fèi)。
而小公司,不僅承擔(dān)不起高昂的成本,也沒有前期的技術(shù)研發(fā)沉淀。跟風(fēng)入局,雖然在股市里有一時(shí)的風(fēng)光,利用時(shí)間差賺一些塊錢。
但長遠(yuǎn)來看,終究會(huì)被市場淘汰。
當(dāng)然,并不是說小公司完全沒有機(jī)會(huì),若能真正腳踏實(shí)地做好AIGC相關(guān)的一個(gè)細(xì)分板塊,依然有機(jī)會(huì)跑出來。
愿國內(nèi)科技公司在追趕世界前沿科技的同時(shí),少一些嬌嬈炒作,少一些急功近利,多一些創(chuàng)新實(shí)干,多一些厚積薄發(fā)。
今天有個(gè)熱搜挺有意思的。
說是《?;ǖ馁N身高手》水了一萬多章,十多年還沒完結(jié),被讀者舉報(bào)了。
看得人一臉懵逼,這不是剛上高中時(shí)躲被窩里看的么。作者魚人二代,當(dāng)年還挺火的,《極品修真強(qiáng)少》、《很純很曖昧》都是青春期難忘的回憶。
印象中,這部小說早就被翻拍成電視劇,下意識便以為完本了。
其實(shí)想想也正常,追了一萬多章的書,?;ǘ汲砂⒁塘?,男主還是個(gè)雛兒,讀者當(dāng)然生氣……
還有另一種說法。
平臺(tái)和簽約作者有協(xié)議,只要小說不斷更,每個(gè)月就有幾萬元固定收入。所以本該完本的小說,作者又找了個(gè)代筆,磨磨唧唧水了近十年。
這波啊,是反向薅資本家羊毛,堪稱吾輩楷模。
平臺(tái)被薅得受不了了,于是自己找人偷偷舉報(bào)。
聯(lián)想一下。
當(dāng)ChatGPT、“文心一言”在國內(nèi)普及后,如果過氣的老牌作者人手一個(gè),天天水字?jǐn)?shù),能白嫖多少稿費(fèi)?
想想就流口水啊。
對已經(jīng)功成名就的部分網(wǎng)文作者而言,AI的普及,大概率是件好事。
但對其他人,不一定如此了。
根據(jù)上文,總的來說,GPT-4 的已經(jīng)證明了,它有能力在很多領(lǐng)域,呈現(xiàn)出超越人類的表現(xiàn)。
甚至有傳言稱,GPT-4通過了“圖靈測試”,在邏輯能力上與絕大部分人類已經(jīng)無異。
現(xiàn)在唯一的門檻,就是成本問題了。
一旦算力、算法、數(shù)據(jù)得到突破性進(jìn)展,成本降下來了,就真的會(huì)對一些產(chǎn)業(yè)形成沖擊。
說不定吃著火鍋唱著歌,突然就被 AI 把命給革了。
當(dāng)然,我還是那個(gè)觀點(diǎn):快點(diǎn)學(xué),快點(diǎn)用。
AI畢竟是工具,是被人奴役的對象。
即使將來淘汰一部分人,也是先淘汰那些不會(huì)使用先進(jìn)工具的人。
我愛這個(gè)魔幻的世界。(全文完)
聯(lián)系客服