就在昨日,我國(guó)人工智能大模型領(lǐng)域又迎來重大突破,AGI的真正連鎖反應(yīng)或?qū)囊曨l開始。
4月27日上午,“2024中關(guān)村論壇-未來人工智能先鋒論壇”在北京正式舉辦,本次平行論壇由科學(xué)技術(shù)部、北京市人民政府主辦,旨在進(jìn)一步探討“語言大模型”、“多模態(tài)大模型”、“具身智能”等新一代人工智能關(guān)鍵技術(shù)與應(yīng)用的創(chuàng)新。
國(guó)產(chǎn)AI視頻斬獲新進(jìn)展,中國(guó)版“Sora”閃亮登場(chǎng)
就在此次論壇會(huì)議上,國(guó)內(nèi)首個(gè)純自研Sora級(jí)視頻大模型Vidu正式發(fā)布。該模型由北京生數(shù)科技聯(lián)合清華大學(xué)共同研發(fā),是我國(guó)首個(gè)長(zhǎng)時(shí)長(zhǎng)、高一致性、高動(dòng)態(tài)性視頻大模型。Vidu的發(fā)布,表明我國(guó)在視頻大模型領(lǐng)域已初步具備對(duì)標(biāo)Sora的能力,標(biāo)志著我國(guó)全面進(jìn)入視頻大模型自研時(shí)代。
據(jù)介紹,Vidu采用研發(fā)團(tuán)隊(duì)原創(chuàng)的架構(gòu)U-ViT,支持一鍵生成長(zhǎng)達(dá)16秒、分辨率高達(dá)1080P的高清視頻內(nèi)容,不僅能模擬真實(shí)物理世界,還擁有豐富想象力,具備多鏡頭生成、時(shí)空一致性高等特點(diǎn)。
值得注意的是,與Sora相比,Vidu可以生成特有的中國(guó)元素,例如熊貓、龍等。
不少業(yè)內(nèi)人士認(rèn)為,盡管目前Vidu生成視頻的能力只有16秒,距離Sora宣稱的還有一定差距,但這顯然是訓(xùn)練量不足導(dǎo)致的,Vidu現(xiàn)在的成果表明技術(shù)方向是正確的。僅從視頻效果和發(fā)布時(shí)間來看,Vidu已超出了大部人的預(yù)期,未來隨著在算力、時(shí)長(zhǎng)等方向上的延伸和突破,Vidu有望為我們帶來更多驚喜。
文生視頻時(shí)代悄然降臨,部分行業(yè)或?qū)⒓铀僮兏?/strong>
此前的2月16日,OpenAI的文字生成視頻模型--Sora首次面世。該模型可以根據(jù)所輸入的prompt(提示詞),直接輸出最高長(zhǎng)達(dá)60秒的視頻,并且包含高度細(xì)致的背景、復(fù)雜的多角度鏡頭,以及富有情感的多個(gè)角色。
當(dāng)時(shí)Sora發(fā)布的生成視頻,無論從人物動(dòng)作還是場(chǎng)景表現(xiàn)上看,都無比貼近現(xiàn)實(shí)。如果不告訴觀看者視頻是由AI生成的,誰又能辨別出來呢?
這個(gè)能夠快速且優(yōu)質(zhì)地將文字描述轉(zhuǎn)化為引人入勝視頻的AI工具,不僅僅代表著技術(shù)上的一次巨大飛躍,也預(yù)示著我們熟悉的許多行業(yè)即將面臨一場(chǎng)革命。
有關(guān)統(tǒng)計(jì)數(shù)據(jù)顯示,目前,全球有超過60億人口是視頻工具和短視頻的用戶,而其中與視頻產(chǎn)業(yè)相關(guān)的從業(yè)者可能已經(jīng)超過了將近10億人,占到了全球總?cè)丝诘?3%到14%,這些從業(yè)者涵蓋了影視行業(yè)、短視頻行業(yè)等諸多我們?nèi)粘S|手可及的各種視頻展示領(lǐng)域。
對(duì)于影視行業(yè)來說,AI視頻模型的出現(xiàn),將極大地降低拍攝劇集的門檻。
做了20年影視導(dǎo)演的某位業(yè)內(nèi)人士,看到AI視頻后說的第一句話是“要變天了”,第二句話是“我直到今天才慶幸自己是個(gè)導(dǎo)演”。
令從業(yè)者發(fā)此感嘆,主要是因?yàn)楝F(xiàn)在的影視行業(yè),分工極其精細(xì),很多工種和里面的從業(yè)者都是階段式配合,可以說一個(gè)環(huán)節(jié)掉鏈子,整個(gè)戲就可能功虧一簣。而如果AI視頻按照現(xiàn)在的速度發(fā)展下去,未來至少很多簡(jiǎn)單的鏡頭、群演、燈光布景等,都可以用AI去完成了。
而對(duì)于短視頻行業(yè)來說,AI視頻生成模型的陸續(xù)發(fā)布,無疑將令行業(yè)競(jìng)爭(zhēng)進(jìn)一步加劇。
在全球范圍內(nèi),無論是中國(guó)的抖音、快手、B站和小紅書等平臺(tái),還是國(guó)際版的TikTok,短視頻內(nèi)容消費(fèi)正處于前所未有的高峰。而隨著AI模型的出現(xiàn),用戶現(xiàn)在能夠迅速制作出各種類型的視頻內(nèi)容,未來稀缺的不再將是視頻拍攝或者剪輯的能力,只要擁有獨(dú)特的創(chuàng)意,便可輕松入局,行業(yè)本就激烈的競(jìng)爭(zhēng)可能進(jìn)一步加劇。
文生視頻熱潮之下,國(guó)內(nèi)哪些上市公司已布局?
文生視頻作為AI領(lǐng)域的新興熱點(diǎn)概念,此前曾受到市場(chǎng)資金的“追捧”。2月19日,在Sora的催化之下,諸多概念股迅速升溫,部分公司當(dāng)日股價(jià)呈現(xiàn)“20cm漲?!薄?/p>
而本次Vidu視頻生成模型的隆重推出,是否會(huì)進(jìn)一步帶動(dòng)相關(guān)概念股股價(jià)上漲呢?讓我們拭目以待,周一開盤見分曉。
據(jù)覽富財(cái)經(jīng)網(wǎng)不完全統(tǒng)計(jì),目前A股市場(chǎng)中涉及文生視頻相關(guān)概念的,共有12家公司,其中不少公司都在積極推進(jìn)相關(guān)業(yè)務(wù)。
聯(lián)系客服