衡宇 發(fā)自 凹非寺
Text-to-Video文生視頻,繼作文、繪畫之后AI殺入的又一領(lǐng)域,有越來(lái)越多產(chǎn)品涌現(xiàn)。根據(jù)讀者爆料,一款主打AI生成視頻的產(chǎn)品,已經(jīng)在小圈子內(nèi)被頻頻提及,還是國(guó)產(chǎn)的。
量子位迫不及待淺扒了一段關(guān)于曹操的介紹,喂給它,得到這樣一段視頻:
在不經(jīng)任何替換和干預(yù)的情況下,生成的視頻畫面符合人物、時(shí)代背景和部分文案提及的場(chǎng)景,效果還算不錯(cuò)。
最最重要的是,用它制作一段視頻,幾乎不存在“剪輯”這個(gè)步驟,比以往圖文轉(zhuǎn)視頻的產(chǎn)品門檻更低,耗費(fèi)的時(shí)間也更短。
但要評(píng)判這款產(chǎn)品到底是騾子是馬,還得多次體驗(yàn),再往深處挖一挖。
這產(chǎn)品名叫一幀秒創(chuàng),本次體驗(yàn)的主角是它最基礎(chǔ)常規(guī)的“文案一鍵生成視頻”。
開(kāi)頭關(guān)于曹操的簡(jiǎn)介視頻,是用該功能這樣生成的——
點(diǎn)擊該選項(xiàng)后,會(huì)跳出一個(gè)文本框供輸入標(biāo)題和正文,底端可以選擇最終的畫面呈現(xiàn)形式是橫屏還是豎屏。
這一步驟實(shí)測(cè)下來(lái),標(biāo)題部分對(duì)后續(xù)內(nèi)容生成影響不大,現(xiàn)階段可以不用輸入,后續(xù)AI會(huì)自動(dòng)提取補(bǔ)充。相對(duì)而言,第二個(gè)需要輸入文案內(nèi)容的部分非常重要。
量子位做了如圖文案輸入:
點(diǎn)擊右下角“下一步”,可以更改AI對(duì)文案進(jìn)行的分類,也可以修改文案的分割。分割成n個(gè)小段的文案,承擔(dān)分鏡頭腳本文案的功能,以便后續(xù)AI從素材庫(kù)里匹配對(duì)應(yīng)的視頻片段。
在這方面,AI的分割效果沒(méi)有出太大紕漏。
但從下圖可以看到,此處AI把曹操title中的“書法家”單獨(dú)作為一個(gè)分鏡頭文案,量子位對(duì)其進(jìn)行了合并。
接下來(lái)就會(huì)進(jìn)入最后的調(diào)試界面,分出兩大板塊,即左半部分的調(diào)整界面和右半部分的預(yù)覽界面。
通過(guò)左側(cè)的工具欄,在最頂端的場(chǎng)景部分,AI為文案匹配了12個(gè)視頻片段。
12個(gè)視頻片段中,原本AI為片段8生成的視頻中出現(xiàn)了現(xiàn)代社會(huì)的外國(guó)人。也就是說(shuō),在畫面內(nèi)容和文案內(nèi)容的匹配度上,AI能力還有所欠缺。
最終量子位通過(guò)小藍(lán)框中的替換素材功能,在素材庫(kù)中選擇了更符合文案的視頻畫面。
12個(gè)鏡頭整體拉片式通看一遍,直觀感受是視頻質(zhì)量算不上精致。雖然并非完全不相關(guān),但還是與人類剪刀手的視頻編輯水平有明顯差距。
敲定視頻片段后,在音樂(lè)板塊挑選國(guó)風(fēng)類型的BGM,又選擇了“磁性渾厚”的解說(shuō)男聲,Logo和字幕都是默認(rèn)選項(xiàng)。
一切確定,點(diǎn)擊生成視頻選項(xiàng),就能在預(yù)覽板塊看到這一套搭配下來(lái)的視頻效果,最終生成文章開(kāi)頭的視頻。
歷史分類的AI視頻效果不錯(cuò),那是否在每個(gè)分類下都有同等水平的效果呢?
又陸續(xù)還嘗試了科普類(量子位文章,扔進(jìn)去)、美食類(宮保雞丁菜譜)等多種類別的文案,甚至還把谷歌Phenaki效果驚艷的小企鵝沖浪視頻的6句文案丟給了它。
結(jié)果顯示,科普類和美食類,生成視頻的表現(xiàn)都還算文案和畫面貼合。
但,小企鵝沖浪文案的生成效果就有些拉胯:
看遍視頻畫面的每一秒鐘,從未出現(xiàn)過(guò)一只企鵝,連影子都沒(méi)有……
Excuse me???
雖然部分畫面也和文案有所關(guān)聯(lián),比如出現(xiàn)人在沙灘上走的第一視角視頻片段。但和曹操視頻的效果相比,可以說(shuō)大相徑庭,實(shí)在有點(diǎn)出乎意料。
無(wú)獨(dú)有偶,國(guó)外有個(gè)Quickvid同樣主打AI生成視頻的功能,同樣在小圈子里走紅。而目前開(kāi)放Beta測(cè)試的Youtube Shorts功能,和上述國(guó)內(nèi)產(chǎn)品功能類似。
為了測(cè)試,把相同的小企鵝沖浪文案喂給了Quickvid。結(jié)果是,Quickvid生成的視頻里,仍然不見(jiàn)企鵝的蹤影,一幀也沒(méi)有!
(谷歌Phenaki聽(tīng)后狂喜)
當(dāng)然,Quickvid之所以走紅,并不是因?yàn)樯傻囊曨l質(zhì)量驚人。除了成為文本生成視頻賽道的“早鳥(niǎo)”外,與背后的開(kāi)發(fā)者密切相關(guān)。
開(kāi)發(fā)者小哥名叫Daniel Habib,此前在Facebook的虛擬現(xiàn)實(shí)部門Oculus工作。
Quickvid走紅是從今年2月開(kāi)始的,當(dāng)時(shí)它正式從內(nèi)測(cè)轉(zhuǎn)為Beta測(cè)試,僅2月23日一天,就有2萬(wàn)2千多人成為用戶。本月ChatGPT開(kāi)放API后,Daniel把它接入了Quickvid,成為了第一批ChatGPT生態(tài)內(nèi)開(kāi)發(fā)者。
量子位的視頻編輯對(duì)兩款產(chǎn)品也進(jìn)行了試玩,用戶評(píng)價(jià)是這樣的:暫不認(rèn)為這東西能威脅自己的就業(yè)。
但對(duì)于AI生成視頻展現(xiàn)出的趨勢(shì),多少有點(diǎn)心有凄凄焉。
因?yàn)槟悴坏貌怀姓J(rèn),用這玩意兒做視頻,完全不需要懂得剪輯知識(shí)。而且做一條同等質(zhì)量的視頻,相比人工剪輯,用AI生成,時(shí)間和資源投入顯著降低。
不僅僅是Quick接入了別人家的API,事實(shí)上,今天體驗(yàn)的一幀秒創(chuàng)也接入了GPT-2的API,還用上了開(kāi)源Stable Diffusion模型。
這不是猜測(cè),是我們直接找到背后開(kāi)發(fā)者“對(duì)質(zhì)”后得知的結(jié)果。
一幀秒創(chuàng)背后的公司叫做新壹科技。
這個(gè)名字或許比較陌生,但這個(gè)“新的一”是“一下科技”的“一”。
一下科技,曾經(jīng)多次站在視頻風(fēng)口上的公司,一直播、秒拍、小咖秀,都出自一下科技之手,這是移動(dòng)互聯(lián)網(wǎng)時(shí)代視頻領(lǐng)域響當(dāng)當(dāng)?shù)耐婕?。背后的團(tuán)隊(duì),也是源自搜狐視頻-酷6網(wǎng)-新浪視頻一脈的視頻內(nèi)容老兵們。
其創(chuàng)始人兼董事長(zhǎng)韓坤,在創(chuàng)立一下科技之前,以聯(lián)合創(chuàng)始人的身份把酷6網(wǎng)打造成中國(guó)第一家在美國(guó)納斯達(dá)克上市的視頻網(wǎng)站。
新壹科技是韓坤手下孵化出的最新公司,現(xiàn)有團(tuán)隊(duì)在2020年年中開(kāi)始籌備,領(lǐng)隊(duì)人雷濤,現(xiàn)任新壹科技CEO,也是一下科技的創(chuàng)始團(tuán)隊(duì)成員。
團(tuán)隊(duì)正式組建的2020年12月,距ChatGPT出生還有一年,連DALLE-2和Stable Diffusion代表的AI繪畫也還沒(méi)有名聲大噪,但春江水暖鴨先知,一下內(nèi)部這支團(tuán)隊(duì)感知到了AI對(duì)于視頻內(nèi)容創(chuàng)作的方向性改變。
因?yàn)橐曨l內(nèi)容的傳統(tǒng)和基因,新公司誕生之初,新壹并沒(méi)有把自己定位為一個(gè)人工智能公司。
他們希望從首先解決創(chuàng)作者需求切入,讓AI介入視頻生產(chǎn)全流程,盡可能降低視頻內(nèi)容創(chuàng)作門檻。
通過(guò)AI能力,讓用戶以低成本制作視頻,還能用秒拍平臺(tái)上的視頻為AI匹配提供一個(gè)龐大的素材庫(kù),形成規(guī)模壁壘。
把秒拍作為現(xiàn)成的數(shù)據(jù)庫(kù),這對(duì)新壹算是一個(gè)地利,不僅因?yàn)槊肱挠?0億級(jí)規(guī)模的視頻素材和數(shù)據(jù),更因?yàn)槊肱哪転橐粠雱?chuàng)進(jìn)行版權(quán)授予,讓AI生成的視頻有版權(quán)保障。
后者簡(jiǎn)直解決了AIGC方面一直爭(zhēng)論不休的大問(wèn)題。
所以首款產(chǎn)品一幀秒創(chuàng),有了明確的應(yīng)用場(chǎng)景,也有了面向視頻內(nèi)容創(chuàng)作者、視頻自媒體營(yíng)銷的方向。
這是一個(gè)集合多種AIGC能力的工具,但是,無(wú)論是文生圖還是AI幫寫,最終的目的都?xì)w于一處——把它們作為素材應(yīng)用到視頻生產(chǎn)流程,讓視頻生產(chǎn)更加高效。
為了高效和低門檻,一幀秒創(chuàng)盡量做到去剪輯化,創(chuàng)作視頻的過(guò)程從開(kāi)放式變成了填空式。
雖然距離產(chǎn)出極致和精彩的視頻還有距離,但最直觀的是,哪怕完全不懂剪輯知識(shí)的人,也能上手制作視頻——甚至是批量制作。
△社交平臺(tái)的剪輯小白用戶評(píng)價(jià)
目前,一幀秒創(chuàng)方面也知道,自己生成的視頻還不能和人工剪輯的視頻媲美,但是足以應(yīng)對(duì)一些應(yīng)用場(chǎng)景,如科普類視頻生成效果是最好的,批量生產(chǎn)內(nèi)容可以應(yīng)用到抖音本地生活推廣。以及除了面向C端的高階功能訂閱模式,一幀秒創(chuàng)還有來(lái)自B端的商業(yè)合作,比如跟360搜索的合作,已經(jīng)獲得了不錯(cuò)的反饋。
對(duì)于一幀秒創(chuàng)當(dāng)前的初創(chuàng)狀態(tài),新壹也透露正在通過(guò)一些具體的解決方案改進(jìn)。
比如創(chuàng)作者集中的內(nèi)容類別,投入更多的素材分析和標(biāo)注成本;又比如推出私有化素材庫(kù),提高匹配率和視頻片段替換率。
雷濤表明了一幀秒創(chuàng)的思路,稱作為產(chǎn)品公司,新壹科技雖然沒(méi)辦法讓技術(shù)和硬件等基礎(chǔ)條件實(shí)現(xiàn)跨越式的發(fā)展,然而,能夠在每一階段適時(shí)提供符合當(dāng)時(shí)階段水平的應(yīng)用,“這已經(jīng)足夠去忙了”。
他多次以智能手機(jī)時(shí)代開(kāi)啟后,移動(dòng)互聯(lián)網(wǎng)的產(chǎn)品開(kāi)發(fā)機(jī)遇舉例,也多次用新能源、智能車變革進(jìn)程中的理想造車模式類比,話里話外,追求的不是一步到位,而是與技術(shù)基礎(chǔ)設(shè)施和整個(gè)行業(yè)生態(tài)一起成長(zhǎng)進(jìn)步,而最關(guān)鍵的是,必須躬身入局,不能站著觀望。
這其中自然有視頻老兵對(duì)新周期的敏銳洞察,但也多少有些不甘心。
如果你對(duì)2015年以來(lái)的互聯(lián)網(wǎng)江湖還有記憶,應(yīng)該多少能感知這種不甘心的合情合理。在如今字節(jié)獨(dú)大或抖音快手的雙雄格局之前,秒拍和一下科技,才是短視頻領(lǐng)域最火爆的明星公司。然而商場(chǎng)如戰(zhàn)場(chǎng),如今的結(jié)局和市場(chǎng)份額,已經(jīng)再清楚不過(guò)了。
或許“贏回來(lái)”的最好方法就是贏在未來(lái)、贏在下一個(gè)時(shí)代。
而下一個(gè)時(shí)代就是AIGC。連比爾·蓋茨都說(shuō),背后不亞于互聯(lián)網(wǎng)的發(fā)明。
面向這個(gè)全新的創(chuàng)新創(chuàng)業(yè)賽道,已經(jīng)分出了兩撥創(chuàng)業(yè)者,走出不同條路線。
一條是技術(shù)路線,訓(xùn)練大模型,把底層技術(shù)牢牢掌握在自身的手里,做底層,做平臺(tái)。但門檻極高,創(chuàng)業(yè)公司在底層大模型方面取得突破的難度和成本都會(huì)很高。
另一條就是面向需求和場(chǎng)景,走產(chǎn)品、應(yīng)用、工具平臺(tái)的路線,集成開(kāi)源和開(kāi)放的現(xiàn)有技術(shù),先入場(chǎng)再發(fā)展壯大,這也是更多中小創(chuàng)業(yè)者和開(kāi)發(fā)者最可見(jiàn)的機(jī)遇。
這兩種路線也不稀奇。
一如當(dāng)初蘋果做出了iOS系統(tǒng),有人對(duì)標(biāo)iOS,要研發(fā)新手機(jī)系統(tǒng),建立新生態(tài);也有許許多多的開(kāi)發(fā)者基于iOS做各種創(chuàng)造,在游戲、開(kāi)發(fā)、創(chuàng)作、工具類別下瘋狂推出各種適配iOS系統(tǒng)的App。
所以技術(shù)和應(yīng)用兩條道路,都能有玩家走到最后,完成商業(yè)化閉環(huán),選擇不同而已,沒(méi)有優(yōu)劣之分。
從來(lái)沒(méi)有事實(shí)能篤定表明,其中某一種能一統(tǒng)天下。
據(jù)透露,走產(chǎn)品應(yīng)用路線的一幀秒創(chuàng),已經(jīng)快速積累了近200萬(wàn)用戶,每日的視頻生成量在10萬(wàn)級(jí)——這算不算AIGC時(shí)代的船票還不好說(shuō),但至少讓外界看到變數(shù)發(fā)生的可能。
— 完 —
量子位 QbitAI · 頭條號(hào)簽約
關(guān)注我們,第一時(shí)間獲知前沿科技動(dòng)態(tài)
聯(lián)系客服