Sora的橫空出世使AIGC概念板塊全線飄紅,包括當虹科技、萬興科技、因賽集團在內(nèi)的多家涉及文生視頻業(yè)務(wù)的上市公司股價集體20CM漲停。
一時間,文生視頻成為最火爆話題。國內(nèi)相關(guān)上市公司如何看待Sora這一“爆炸性”產(chǎn)品?
記者就此采訪了多家上市公司,其中不乏行業(yè)頭部玩家。不少公司火速回應(yīng),在文生視頻等跨模態(tài)領(lǐng)域已有布局,正處于研發(fā)狀態(tài)。亦有上市公司火速升級大模型,以支持商業(yè)視頻自動生成。
不過當前在文生視頻方面,國內(nèi)AI模型文生視頻與Sora所生成的視頻差距較為明顯。但有業(yè)內(nèi)人士認為,國內(nèi)外廠商在文生視頻的差距并不像大模型領(lǐng)域差距那么大,而Sora的發(fā)布會進一步加速國內(nèi)廠商在該領(lǐng)域的投入。
商用“曙光”閃現(xiàn)
2月16日,全球人工智能模型領(lǐng)跑者OpenAI推出了一款能根據(jù)文字指令即時生成短視頻的模型,命名為Sora。
Sora能夠從文本說明中生成長達60秒的視頻,并能夠提供具有多個角色,特定類型的動作和詳細的背景細節(jié)的場景。Sora還能在一個生成的視頻中創(chuàng)建多個鏡頭,體現(xiàn)人物和視覺風格。此外,Sora可以一次性生成整個視頻,也可以擴展生成的視頻,使其更長。
在業(yè)內(nèi)看來,雖然目前Sora存在一定的局限性,諸如無法準確模擬常見的物理運動過程,視頻互動中無法正確顯示物體狀態(tài)的變化、長時間樣本發(fā)展的不連貫性或物體突然出現(xiàn)等等。
但其所呈現(xiàn)的效果,所支持的視頻參數(shù)等基礎(chǔ)條件已具備商用化技術(shù)基礎(chǔ),AI視頻商用將不再遙遠,有望在影視、廣告、短視頻等多個領(lǐng)域?qū)崿F(xiàn)應(yīng)用。
銀河證券認為,在C端,通過AI視頻生成,此類AI視頻應(yīng)用有望通過其生成的內(nèi)容來構(gòu)建自有用戶流量池,完成后續(xù)的流量變現(xiàn)在B端。
該機構(gòu)認為,AI視頻可以大幅度降低視頻的制作成本,對廣告營銷、影視、游戲等都有可觀的降本增效作用,相關(guān)內(nèi)容的供給端有望實現(xiàn)飛躍式的發(fā)展。這也令市場看到了商用“曙光”。
基于商用預(yù)期,A股AIGC概念股在龍年的首個交易日集體暴漲。包括當虹科技、萬興科技、因賽集團、易點天下等業(yè)務(wù)涉及文生視頻的上市公司20CM漲停,而包括昆侖萬維、拓爾思、首都在線之內(nèi)的AI概念股也漲逾15%。
那么,國內(nèi)文生視頻玩家當前處于什么階段?其產(chǎn)品與Sora究竟有多大差距?這是眾多投資者所關(guān)心的問題。
昆侖萬維董事長兼CEO方漢表示,Sora具有三維空間的連貫性、模擬數(shù)字世界、長期連續(xù)性和物體持久性、與世界互動的技術(shù)特點,是文生視頻領(lǐng)域特別大的進步和突破,領(lǐng)先國內(nèi)同行半年左右,對影視、視頻、廣告等行業(yè)有很大的沖擊。
但在他看來,國內(nèi)廠商和國外廠商在文生視頻的差距,不像大模型領(lǐng)域的差距那么大,Sora的發(fā)布會進一步加速國內(nèi)廠商在該領(lǐng)域的投入。
不過,以國內(nèi)某通用大模型為例,記者實際體驗發(fā)現(xiàn),該模型文生視頻功能仍難言出色,產(chǎn)出視頻基本仍由動圖組成。而且,與Sora視頻所展現(xiàn)的鮮活人物相比,國內(nèi)大模型仍呈現(xiàn)數(shù)字人形象。
嚴格而言,該大模型所生成的內(nèi)容難以稱之為視頻,其與Sora所呈現(xiàn)的驚艷效果有著明顯差距。
國內(nèi)玩家進展如何?
盡管差距猶存,Sora身后卻不乏眾多追隨者。記者采訪發(fā)現(xiàn),在文生視頻方面,國內(nèi)一眾玩家早已布局。此時此景,不禁令人聯(lián)想到2023年初的人工智能熱潮。
一位接近科大訊飛人士向記者透露,科大訊飛目前內(nèi)部已經(jīng)開始文生視頻進一步攻關(guān)研發(fā)。而且該人士透露,此前的訊飛星火大模型已經(jīng)擁有相對基礎(chǔ)的文生視頻功能。
就在1月底,星火認知大模型剛完成了V3.5的升級?;谑讉€全國產(chǎn)算力訓練的訊飛星火V3.5,七大核心能力全面提升,其中數(shù)學、語言理解、語音交互能力超GPT-4 Turbo。
而就在2月19日,虹軟科技官微宣布,其核心大模型技術(shù)引擎——虹軟ArcMuse再次升級。而此次升級將支持面向商拍的商業(yè)視頻自動生成。
據(jù)介紹,與Open AI Sora類似,虹軟ArcMuse大模型視頻生成基于diffusion-transformer技術(shù)架構(gòu),具備豐富多樣的創(chuàng)意力和想象力。通過圖像,ArcMuse大模型能夠捕捉到商品的細節(jié)特征、質(zhì)感、色彩等方面的精確信息,生成更能展示商品真實面貌的動態(tài)商拍視頻。
該公司方面表示,其文生視頻技術(shù)已取得一定進展,在生成視頻時長和效果方面,還在逐漸突破。
另外,記者以投資者身份致電因賽集團。該公司方面表示,其AIGC項目團隊按照計劃,將在三月進行文生視頻功能的開發(fā),等待時機成熟后投入公測。
事實上,因賽集團此前在與機構(gòu)交流時透露,其InsightGPT內(nèi)測版已開放視頻智能剪輯功能試用體驗。該公司預(yù)計2024年2月底前,開放體驗圖生視頻相關(guān)營銷應(yīng)用產(chǎn)品;預(yù)計2024年3月底前,開發(fā)實現(xiàn)文生視頻功能;之后在今年二季度推出公測版正式啟動商業(yè)化。
公司表示,目前正在進行幾家汽車、大消費、大健康等行業(yè)知名品牌方相關(guān)AIGC營銷項目的比稿及應(yīng)標,同時也在加強行業(yè)研究和競對調(diào)研工作,商業(yè)化進程正在加速。不過,該公司同時表示,“由于文生視頻技術(shù)由于剛剛推出,對行業(yè)會帶來怎樣變化暫未可知,對公司業(yè)務(wù)會產(chǎn)生多大影響目前也無法量化。”
此外,云從科技方面也表示,該公司在視覺方面積累較為深厚。目前,其從容大模型已實現(xiàn)利用diffusion、GAN等生成式技術(shù)圍繞人物圖像、人物視頻數(shù)據(jù)進行建模,通過文本和音頻實現(xiàn)對圖像和視頻內(nèi)容進行生成、控制、編輯。
該公司透露,其在文生圖像、視頻等跨模態(tài)領(lǐng)域積極布局,包括發(fā)布數(shù)字人能力平臺,生成AI視頻。同時,該公司也與中國電信合作AI營銷海報生成等。
而首都在線則在互動平臺上公開回應(yīng)稱,公司聯(lián)合武智院共同上線 “照片說話”應(yīng)用,用戶可以通過簡短的文本描述或錄音文件,“讓照片開口說話”。
據(jù)悉,該應(yīng)用依托公司高性能異構(gòu)智算平臺的全棧智能算力服務(wù)能力,結(jié)合武智院“紫東太初”2.0全模態(tài)大模型的經(jīng)驗與技術(shù),可以令用戶體驗到個性化AI創(chuàng)作的魅力。
總體來看,Sora在文生視頻上的進一步突破,將會催化整個人工智能賽道。在業(yè)內(nèi)看來,國內(nèi)文生視頻接下來有望迎來百花齊放,多模態(tài)大模型技術(shù)迭代也有望進一步加速。
(文章來源:中國基金報)
聯(lián)系客服