2022年,從引爆AI作畫領(lǐng)域的DALL-E 2、Stable Diffusion等AI模型,到以ChatGPT為代表的接近人類水平的對(duì)話機(jī)器人,AIGC不斷刷爆網(wǎng)絡(luò),其強(qiáng)大的內(nèi)容生成能力給人們帶來了巨大的震撼。學(xué)術(shù)界和產(chǎn)業(yè)界也都形成共識(shí):AIGC絕非曇花一現(xiàn),其底層技術(shù)和產(chǎn)業(yè)生態(tài)已經(jīng)形成了新的格局。
就內(nèi)容生產(chǎn)而言,AIGC作為新的生產(chǎn)力引擎,讓我們從過去的PGC、UGC,已經(jīng)不可避免地進(jìn)入AIGC時(shí)代。AIGC代表著AI技術(shù)從感知、理解世界到生成、創(chuàng)造世界的躍遷,正推動(dòng)人工智能迎來下一個(gè)時(shí)代。
經(jīng)過了2022年的預(yù)熱,2023年AIGC領(lǐng)域?qū)⒂瓉砀蟀l(fā)展。AIGC生成內(nèi)容的類型不斷豐富、質(zhì)量不斷提升,也將有更多的企業(yè)積極擁抱AIGC。在這個(gè)背景下,騰訊研究院正式發(fā)布《AIGC發(fā)展趨勢報(bào)告2023:迎接人工智能的下一個(gè)時(shí)代》。報(bào)告從技術(shù)發(fā)展和產(chǎn)業(yè)生態(tài)、應(yīng)用趨勢、治理挑戰(zhàn)等維度,對(duì)AIGC的發(fā)展趨勢進(jìn)行了深入思考。
本文為報(bào)告核心內(nèi)容摘要(文末附下載):
AIGC的大爆發(fā)不僅有賴于AI技術(shù)的突破創(chuàng)新,還離不開產(chǎn)業(yè)生態(tài)快速發(fā)展的支撐。在技術(shù)創(chuàng)新方面,生成算法、預(yù)訓(xùn)練模型、多模態(tài)技術(shù)等AI技術(shù)匯聚發(fā)展,為AIGC的爆發(fā)提供了肥沃的技術(shù)土壤。
圖:AIGC技術(shù)累積融合
第一,基礎(chǔ)的生成算法模型不斷突破創(chuàng)新。比如為人熟知的GAN、Transformer、擴(kuò)散模型等,這些模型的性能、穩(wěn)定性、生成內(nèi)容質(zhì)量等不斷提升。得益于生成算法的進(jìn)步,AIGC現(xiàn)在已經(jīng)能夠生成文字、代碼、圖像、語音、視頻、3D物體等各種類型的內(nèi)容和數(shù)據(jù)。
第二,預(yù)訓(xùn)練模型,也即基礎(chǔ)模型、大模型,引發(fā)了AIGC技術(shù)能力的質(zhì)變。雖然過去各類生成模型層出不窮,但是使用門檻高、訓(xùn)練成本高、內(nèi)容生成簡單和質(zhì)量偏低,遠(yuǎn)遠(yuǎn)不能滿足真實(shí)內(nèi)容消費(fèi)場景中的靈活多變、高精度、高質(zhì)量等需求。而預(yù)訓(xùn)練模型能夠適用于多任務(wù)、多場景、多功能需求,能夠解決以上諸多痛點(diǎn)。預(yù)訓(xùn)練模型技術(shù)也顯著提升了AIGC模型的通用化能力和工業(yè)化水平,同一個(gè)AIGC模型可以高質(zhì)量地完成多種多樣的內(nèi)容輸出任務(wù),讓AIGC模型成為自動(dòng)化內(nèi)容生產(chǎn)的“工廠”和“流水線”。正因如此,谷歌、微軟、OpenAI等企業(yè)紛紛搶占先機(jī),推動(dòng)人工智能進(jìn)入預(yù)訓(xùn)練模型時(shí)代。
第三,多模態(tài)技術(shù)推動(dòng)了AIGC的內(nèi)容多樣性,進(jìn)一步增強(qiáng)了AIGC模型的通用化能力。多模態(tài)技術(shù)使得語言文字、圖像、音視頻等多種類型數(shù)據(jù)可以互相轉(zhuǎn)化和生成。比如CLIP模型,它能夠?qū)⑽淖趾蛨D像進(jìn)行關(guān)聯(lián),如將文字“狗”和狗的圖像進(jìn)行關(guān)聯(lián),并且關(guān)聯(lián)的特征非常豐富。這為后續(xù)文生圖、文生視頻類的AIGC應(yīng)用的爆發(fā)奠定了基礎(chǔ)。
未來,算法的進(jìn)步將帶來更多激動(dòng)人心的應(yīng)用,語言模型會(huì)得到進(jìn)一步發(fā)展,可以自我持續(xù)學(xué)習(xí)的多模態(tài)AI將日益成為主流,這些因素會(huì)進(jìn)一步推動(dòng)AIGC領(lǐng)域的蓬勃發(fā)展。
在產(chǎn)業(yè)生態(tài)方面,AIGC領(lǐng)域正在加速形成三層產(chǎn)業(yè)生態(tài)并持續(xù)創(chuàng)新發(fā)展,正走向模型即服務(wù)(MaaS)的未來。
第一層是基礎(chǔ)層,以預(yù)訓(xùn)練模型為基礎(chǔ)搭建的AIGC技術(shù)基礎(chǔ)設(shè)施層。在國外,以O(shè)penAI、Stability.ai為代表,通過受控API、開源等方式輸出模型能力。
第二層是中間層,是在預(yù)訓(xùn)練模型基礎(chǔ)上,通過專門的調(diào)試和訓(xùn)練,快速抽取形成垂直化、場景化、定制化的小模型和應(yīng)用工具層,可以實(shí)現(xiàn)工業(yè)流水線式部署,同時(shí)兼具按需使用、高效經(jīng)濟(jì)的優(yōu)勢。比如,知名的二次元畫風(fēng)生成模型Novel-AI,以及各種風(fēng)格的角色生成器等,就是基于Stable Diffusion開源進(jìn)行的二次開發(fā)。隨著AIGC模型加速成為新的技術(shù)平臺(tái),模型即服務(wù)(Model-as-a-Service,MaaS)開始成為現(xiàn)實(shí),預(yù)計(jì)將對(duì)商業(yè)領(lǐng)域產(chǎn)生巨大影響。
第三層是應(yīng)用層,依托底層模型和中間層的垂直模型,各廠商進(jìn)一步開放面向C端和B端用戶的各種各樣的AIGC產(chǎn)品和服務(wù),滿足海量用戶的內(nèi)容創(chuàng)建和消費(fèi)需求。例如群聊機(jī)器人、文本生成軟件、頭像生成軟件等AIGC消費(fèi)工具。
目前,從提供預(yù)訓(xùn)練的AI大模型的基礎(chǔ)設(shè)施層公司到專注打造垂直領(lǐng)域內(nèi)AIGC工具的中間層公司、再到直接面對(duì)消費(fèi)者和終端用戶提供產(chǎn)品和服務(wù)的應(yīng)用層公司,美國圍繞AIGC生長出繁榮的生態(tài),技術(shù)創(chuàng)新引發(fā)的應(yīng)用創(chuàng)新浪潮迭起;中國也有望憑借領(lǐng)先的AIGC技術(shù)賦能千行百業(yè)。
AIGC領(lǐng)域目前呈現(xiàn)AIGC的內(nèi)容類型不斷豐富、內(nèi)容質(zhì)量不斷提升、技術(shù)的通用性和工業(yè)化水平越來越強(qiáng)等趨勢,這使得AIGC在消費(fèi)互聯(lián)網(wǎng)領(lǐng)域日趨主流化,涌現(xiàn)了寫作助手、AI繪畫、對(duì)話機(jī)器人、數(shù)字人等爆款級(jí)應(yīng)用,支撐著傳媒、電商、娛樂、影視等領(lǐng)域的內(nèi)容需求。目前AIGC也正在向產(chǎn)業(yè)互聯(lián)網(wǎng)、社會(huì)價(jià)值領(lǐng)域擴(kuò)張應(yīng)用。
圖:AIGC應(yīng)用現(xiàn)狀概覽(引用自紅杉資本)
在消費(fèi)互聯(lián)網(wǎng)領(lǐng)域,AIGC牽引數(shù)字內(nèi)容領(lǐng)域的全新變革。目前AIGC的爆發(fā)點(diǎn)主要是在內(nèi)容消費(fèi)領(lǐng)域,已經(jīng)呈現(xiàn)百花齊放之勢。AIGC生成的內(nèi)容種類越來越豐富,而且內(nèi)容質(zhì)量也在顯著提升,產(chǎn)業(yè)生態(tài)日益豐富。這其中有三個(gè)值得關(guān)注的趨勢:
第一,AIGC有望成為新型的內(nèi)容生產(chǎn)基礎(chǔ)設(shè)施,塑造數(shù)字內(nèi)容生產(chǎn)與交互新范式,持續(xù)推進(jìn)數(shù)字文化產(chǎn)業(yè)創(chuàng)新。過去AI在內(nèi)容消費(fèi)領(lǐng)域的作用主要體現(xiàn)在推薦算法成為了新型的傳播基礎(chǔ)設(shè)施。推薦算法對(duì)數(shù)字內(nèi)容傳播,短視頻為主的數(shù)字內(nèi)容新業(yè)態(tài)發(fā)展,起到了顛覆式的變革作用。而現(xiàn)在,隨著AIGC生成的內(nèi)容種類越來越豐富,內(nèi)容的質(zhì)量不斷提升,AIGC將作為新型的內(nèi)容生產(chǎn)基礎(chǔ)設(shè)施對(duì)既有的內(nèi)容生成模式產(chǎn)生變革影響。
第二,AIGC的商業(yè)化應(yīng)用將快速成熟,市場規(guī)模會(huì)迅速壯大。當(dāng)前AIGC已經(jīng)率先在傳媒、電商、影視、娛樂等數(shù)字化程度高、內(nèi)容需求豐富的行業(yè)取得重大發(fā)展,市場潛力逐漸顯現(xiàn)。比如,在廣告領(lǐng)域,騰訊混元AI大模型能夠支持廣告智能制作,即利用AIGC將廣告文案自動(dòng)生成為廣告視頻,大大降低了廣告視頻制作成本。巨大的應(yīng)用前景將帶來市場規(guī)模的快速增長,根據(jù)6pen預(yù)測,未來五年10%-30%的圖片內(nèi)容由AI參與生成,有望創(chuàng)造超過600億以上市場規(guī)模。也有國外商業(yè)咨詢機(jī)構(gòu)預(yù)測,2030年AIGC市場規(guī)模將達(dá)到1100億美元。
第三,AIGC還將作為生產(chǎn)力工具,不斷推動(dòng)聊天機(jī)器人、數(shù)字人、元宇宙等領(lǐng)域發(fā)展。AIGC技術(shù)讓聊天機(jī)器人接近人類水平日益成為現(xiàn)實(shí),當(dāng)前以ChatGPT為代表的聊天機(jī)器人已經(jīng)在刺激搜索引擎產(chǎn)業(yè)的神經(jīng),未來人們獲取信息是否會(huì)更多通過聊天機(jī)器人而非搜索引擎?這已經(jīng)使谷歌等公司面臨的巨大壓力。AIGC也在大大提升數(shù)字人的制作效能,并且使其更神似人。比如騰訊AI LAB的虛擬歌手AI艾靈,能夠基于AIGC實(shí)現(xiàn)作詞和歌曲演唱。在元宇宙領(lǐng)域,AIGC在構(gòu)建沉浸式空間環(huán)境、提供個(gè)性化內(nèi)容體驗(yàn)、打造智能用戶交互等方面發(fā)揮重要作用。比如,扎克伯格在元宇宙的島嶼上,可以通過發(fā)出語音命令生成創(chuàng)造海灘、變換天氣,添加不同的場景等。只有借助AGIC,元宇宙才可能以低成本、高效率的方式滿足海量用戶的不同內(nèi)容需求。
在產(chǎn)業(yè)互聯(lián)網(wǎng)領(lǐng)域,基于AIGC技術(shù)的合成數(shù)據(jù)(synthetic data)迎來重大發(fā)展,合成數(shù)據(jù)將牽引人工智能的未來。MIT科技評(píng)論將AI合成數(shù)據(jù)列為2022年10大突破性技術(shù)之一;Gartner也預(yù)測稱,到2030年合成數(shù)據(jù)將徹底取代真實(shí)數(shù)據(jù),成為訓(xùn)練AI的主要數(shù)據(jù)來源。
圖:合成數(shù)據(jù)發(fā)展預(yù)測(來源:Gartner)
合成數(shù)據(jù)的用途是成為真實(shí)世界數(shù)據(jù)的廉價(jià)替代品,用來訓(xùn)練、測試、驗(yàn)證AI模型。AIGC技術(shù)的持續(xù)創(chuàng)新,讓合成數(shù)據(jù)迎來新的發(fā)展契機(jī),開始迸發(fā)出更大的產(chǎn)業(yè)發(fā)展和商業(yè)應(yīng)用活力。這主要體現(xiàn)在以下四個(gè)方面:
第一,合成數(shù)據(jù)為AI模型訓(xùn)練開發(fā)提供強(qiáng)大助推器,推動(dòng)實(shí)現(xiàn)AI 2.0。過去用真實(shí)世界數(shù)據(jù)訓(xùn)練AI模型,存在數(shù)據(jù)采集和標(biāo)注的成本高昂,數(shù)據(jù)質(zhì)量較難保障、數(shù)據(jù)多樣化不足、隱私保護(hù)挑戰(zhàn)等多方面問題。而合成數(shù)據(jù)可以很好的解決這些問題。使用合成數(shù)據(jù)不僅能更高效地訓(xùn)練AI模型,而且可以讓AI在合成數(shù)據(jù)構(gòu)建的虛擬仿真世界中自我學(xué)習(xí)、進(jìn)化,極大擴(kuò)展AI的應(yīng)用可能性。從某種意義上也可以說合成數(shù)據(jù)讓AI模型訓(xùn)練從1.0階段發(fā)展到2.0階段。
第二,合成數(shù)據(jù)助力破解AI“深水區(qū)”的數(shù)據(jù)難題,持續(xù)拓展產(chǎn)業(yè)互聯(lián)網(wǎng)應(yīng)用空間。目前,合成數(shù)據(jù)正迅速向交通、金融、醫(yī)療、零售、工業(yè)等諸多產(chǎn)業(yè)領(lǐng)域拓展應(yīng)用,幫助破解產(chǎn)業(yè)互聯(lián)網(wǎng)應(yīng)用中的數(shù)據(jù)難題。比如,騰訊自動(dòng)駕駛團(tuán)隊(duì)研發(fā)的仿真系統(tǒng)TAD SIM可以自動(dòng)生成各種交通場景數(shù)據(jù),助力自動(dòng)駕駛系統(tǒng)測試、開發(fā)。在醫(yī)療領(lǐng)域,美國國立衛(wèi)生研究院和合成數(shù)據(jù)服務(wù)商合作,基于其COVID-19病人病歷數(shù)據(jù)庫,合成了不具有可識(shí)別性的替代數(shù)據(jù),可供世界范圍內(nèi)的研究人員自由分享和使用。
圖:騰訊自動(dòng)駕駛數(shù)字孿生仿真平臺(tái)
第三,正是由于合成數(shù)據(jù)對(duì)人工智能未來發(fā)展的巨大價(jià)值,合成數(shù)據(jù)正加速成為一個(gè)新產(chǎn)業(yè)賽道,科技大廠和創(chuàng)新企業(yè)紛紛搶先布局。目前,全球合成數(shù)據(jù)創(chuàng)業(yè)企業(yè)也已經(jīng)達(dá)到100家,英偉達(dá)、亞馬遜、微軟等頭部科技企業(yè)也在加速布局,涌現(xiàn)了合成數(shù)據(jù)即服務(wù)(SDaaS,synthetic data as a service)這一全新商業(yè)模式。
第四,合成數(shù)據(jù)加速構(gòu)建AI賦能、數(shù)實(shí)融合的大型虛擬世界。合成數(shù)據(jù)指向的終極應(yīng)用形態(tài)是借助游戲引擎、3D圖形、AIGC技術(shù)構(gòu)建的數(shù)實(shí)融合的大型虛擬世界?;诤铣蓴?shù)據(jù)構(gòu)建的大型虛擬世界,為測試、開發(fā)新的人工智能應(yīng)用,提供了一個(gè)安全、可靠、高效以及最重要的是——低成本的、可重復(fù)利用的環(huán)境,將成為AI數(shù)實(shí)融合的關(guān)鍵載體,包括為AI開發(fā)提供數(shù)據(jù)和場景、試驗(yàn)田等。比如騰訊開悟的AI開放研究環(huán)境,已經(jīng)吸引了國內(nèi)外眾多決策智能領(lǐng)域的研究團(tuán)隊(duì)使用。
在社會(huì)價(jià)值領(lǐng)域,AIGC也在助力可持續(xù)社會(huì)價(jià)值的實(shí)現(xiàn)。比如,在醫(yī)療健康方面,AI語音生成幫助病人“開口說話”。語音合成軟件制造商Lyrebird為漸凍癥患者設(shè)計(jì)的語音合成系統(tǒng)實(shí)現(xiàn)“聲音克隆”,幫助患者重新獲得“自己的聲音”。AI數(shù)字人也能幫助老年癡呆癥患者與他們可能記得的年輕面孔或者逝去的親人互動(dòng)。此外,AIGC也可以用于文物修復(fù),助力文物保護(hù)傳承。騰訊公司利用360度沉浸式展示技術(shù)、智能音視頻技術(shù)、人工智能等技術(shù)手段,對(duì)敦煌古壁畫進(jìn)行數(shù)字化分析與修復(fù)。在國外,DeepMind合作開發(fā)的深度神經(jīng)網(wǎng)絡(luò)模型Ithaca可以修復(fù)殘缺的歷史碑文。
圖:騰訊利用AIGC技術(shù)手段,助力敦煌古壁畫修復(fù)
總之,隨著AIGC模型的通用化水平和工業(yè)化能力的持續(xù)提升,AIGC的根本影響在于,將極大降低內(nèi)容生產(chǎn)和交互的門檻和成本,有望帶來一場自動(dòng)化內(nèi)容生產(chǎn)與交互變革,引起社會(huì)的成本結(jié)構(gòu)的重大改變,進(jìn)而在各行各業(yè)引發(fā)巨震。未來,“AIGC+”將持續(xù)大放異彩,深度賦能各行各業(yè)高質(zhì)量發(fā)展。
首先,AIGC引發(fā)的新型版權(quán)侵權(quán)風(fēng)險(xiǎn),已經(jīng)成為整個(gè)行業(yè)發(fā)展所面臨的緊迫問題。因版權(quán)爭議,國外藝術(shù)作品平臺(tái)ArtStation上的畫師們掀起了抵制AIGC生成圖像的活動(dòng)。其次,安全問題始終存在于科技發(fā)展應(yīng)用之中。在AIGC中,主要表現(xiàn)為信息內(nèi)容安全、AIGC濫用引發(fā)詐騙等新型違法犯罪行為,以及AIGC的內(nèi)生安全等。較為著名的案例是,詐騙團(tuán)隊(duì)利用AIGC換臉偽造埃隆·馬斯克的視頻,半年詐騙價(jià)值超過2億人民幣的數(shù)字貨幣。再次,算法歧視等倫理問題依然存在。比如,DALL·E 2具有顯著的種族和性別刻板印象。最后是環(huán)境影響,AIGC模型訓(xùn)練消耗大量算力,碳排放量驚人。此前就有研究表明,單一機(jī)器學(xué)習(xí)模型訓(xùn)練所產(chǎn)生的碳排放,相當(dāng)于普通汽車壽命期內(nèi)碳排放量的5倍。
為了應(yīng)對(duì)以上挑戰(zhàn),面向人工智能的下一個(gè)時(shí)代,人們需要更加負(fù)責(zé)任地、以人為本地發(fā)展應(yīng)用AIGC技術(shù),打造可信AIGC生態(tài)。面對(duì)AIGC技術(shù)應(yīng)用可能帶來的風(fēng)險(xiǎn)挑戰(zhàn),社會(huì)各界需要協(xié)同參與、共同應(yīng)對(duì),通過法律、倫理、技術(shù)等方面的多元措施支持構(gòu)建可信AI生態(tài)。在立法方面,網(wǎng)信辦等三部門出臺(tái)的《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》針對(duì)深度合成技術(shù)服務(wù)提出的要求和管理措施,諸如禁止性要求、標(biāo)識(shí)要求、安全評(píng)估等,亦適用于AIGC。接下來,需要著重從以下方面持續(xù)推進(jìn)AIGC的政策和治理。
其一,政府部門需要結(jié)合AIGC技術(shù)的發(fā)展應(yīng)用情況,制定并明晰AIGC的知識(shí)產(chǎn)權(quán)與數(shù)據(jù)權(quán)益保護(hù)規(guī)則。目前,AIGC的知識(shí)產(chǎn)權(quán)與數(shù)據(jù)權(quán)益保護(hù)規(guī)則的不明確,在某種程度上導(dǎo)致甚至加劇了AI領(lǐng)域的亂象。
其二,研發(fā)應(yīng)用AIGC技術(shù)的主體需要積極探索自律管理措施,例如,秉持不作惡、科技向善等目的,制定適宜的政策(消極要求和積極要求),采取控制和安全措施保障AIGC的安全可控應(yīng)用,采取內(nèi)容識(shí)別、內(nèi)容溯源等技術(shù)確保AIGC的可靠來源。
其三,打造安全可信的AIGC應(yīng)用,需要深入推進(jìn)AI倫理治理。例如,行業(yè)組織可以制定可信AIGC的倫理指南,更好地支持AIGC健康可持續(xù)發(fā)展;AIGC領(lǐng)域的創(chuàng)新主體需要考慮通過倫理委員會(huì)等方式,推進(jìn)落實(shí)AI風(fēng)險(xiǎn)管理、倫理審查評(píng)估等,在AIGC應(yīng)用中實(shí)現(xiàn)“倫理嵌入設(shè)計(jì)”(ethics by design)。
其四,社會(huì)各界需要攜手應(yīng)對(duì)AIGC領(lǐng)域的能源消耗問題,推行綠色AI的發(fā)展理念,致力于打造綠色可持續(xù)、環(huán)境友好型的AI模型,實(shí)現(xiàn)智能化與低碳化融合發(fā)展。
未來已來,讓我們擁抱AIGC,擁抱人工智能的下一個(gè)時(shí)代,打造更美好的未來。
聯(lián)系客服