原創(chuàng)|王俞現(xiàn)(財(cái)經(jīng)作家,中移聯(lián)元宇宙產(chǎn)業(yè)委副秘書長、中國文產(chǎn)協(xié)元宇宙專委會高級專家)
沒有真正的金剛鉆,主辦方的這種安排,對他來說,簡直意味著作死,元界(ID:Metabod)為他捏了一把汗,但他乍一上臺,不疾不徐,按照自我語境,一環(huán)扣一環(huán),侃侃而談。
他認(rèn)為,數(shù)字人是元宇宙時代的基礎(chǔ)設(shè)施,但這一天還沒有到來。按照他的設(shè)想,這一天的到來,還需要五年甚至更長時間。
那數(shù)字人當(dāng)下存在的價值是什么?他給出的答案是流量擔(dān)當(dāng)!他說,從2017年開始,他與小伙伴就開始思考,如何不用昂貴的設(shè)備,或者依賴特別培訓(xùn)獲得技術(shù)經(jīng)驗(yàn),讓每個人都能擁有高級別的數(shù)字人。
這一年他們研發(fā)出人工智能數(shù)字人直播平臺——賽博演猿Cybactor。經(jīng)過不斷迭代,這套系統(tǒng)可以生成最高級別、可實(shí)時驅(qū)動、廉價的數(shù)字人。
2022年10月,他們將這套系統(tǒng)面向個人公開,用戶只需用一個普通攝像頭,就能夠?qū)崿F(xiàn)影視級別的面部、肢體及手勢動作的精準(zhǔn)捕捉。
“在這一點(diǎn)上,我們是全世界唯一能做到的。”他做出自我評價,看似主觀,卻有著深厚的技術(shù)做背景、底氣。
他如此告訴元界(ID:Metabod),“如果沒有我們的技術(shù),整個產(chǎn)業(yè)都無法想象用一個普通攝像頭去做電視臺級別的數(shù)字人直播?!?/span>
在他看來,這種高級別的數(shù)字人,在國內(nèi)數(shù)量特別少,不到300個,他們正在做的,是推出降維普及方案,每月599元就,。,可以讓每位直播人,擁有達(dá)到央視虛擬主播水準(zhǔn)的數(shù)字人。
他就是趙天奇,數(shù)字人AIGC平臺全球領(lǐng)軍企業(yè)——聚力維度創(chuàng)始人兼CEO,北京郵電大學(xué)博士、清華大學(xué)博士后畢業(yè),2011-2015年師從徐大雄院士,2015-2019年師從戴瓊海院士,英特爾、高通AI榮譽(yù)技術(shù)大使。
演講畢,一圈人圍著趙天奇加微信,這是任何其他演講者沒有達(dá)到的“待遇”。本期“中國元宇宙未來產(chǎn)業(yè)100人”訪談,元界(ID:Metabod)對話趙天奇。
這是一位將“挑戰(zhàn)全世界都沒做到的技術(shù)科研”,視為創(chuàng)業(yè)以來印象最深刻事情的、具有科學(xué)家底色的創(chuàng)業(yè)者。
目前,趙天奇和聚力維度,正在不遺余力地推動著行業(yè)向著預(yù)判的方向發(fā)展。不過,是美好想象,抑或臨界爆發(fā),還有不盡為人掌握的變量。
趙天奇,尋求報道:imerit(微信)
“中國元宇宙100人”訪談計(jì)劃
【指 導(dǎo)】
中國文化產(chǎn)業(yè)協(xié)會文化元宇宙專委會
中國移動通信聯(lián)合會元宇宙產(chǎn)業(yè)委
【牽頭平臺】
元界、央鏈直播、河南省數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)協(xié)會、超創(chuàng)者
【聯(lián)合發(fā)起】
元宇宙共識圈、樂生活與愛IT Plus、商業(yè)認(rèn)知研究院、尋一創(chuàng)投、綺觀商業(yè)Cstories、戰(zhàn)略投資家、CIBA新經(jīng)濟(jì)
一)
與時俱進(jìn),研發(fā)AI數(shù)字人直播平臺
元界:請簡要介紹一下公司發(fā)展歷程。
趙天奇:從2012年開始,聚力維度就圍繞虛擬內(nèi)容布局各個技術(shù)鏈條,開展研發(fā)工作。2016年聚力維度在3D內(nèi)容領(lǐng)域嶄露頭角,自主研發(fā)的人工智能3D內(nèi)容制作平臺“崢嶸”,獲得華為、三大運(yùn)營商等行業(yè)巨頭的一致認(rèn)可。2017年公司正式開展數(shù)字人業(yè)務(wù)線,自主研發(fā)了人工智能數(shù)字人直播平臺——“賽博演猿”,2022年10月正式推出公開版(個人版)軟件,2023年3月實(shí)現(xiàn)了云服務(wù)功能。
元界:作為公司的兩個產(chǎn)品,崢嶸、賽博演猿是公司在商業(yè)化道路上布局的兩個賽道嗎?賽博演猿的主要客戶群體是哪些?
趙天奇:崢嶸是解決3D顯示設(shè)備專有內(nèi)容不足問題的,其使3D資源從稀缺走向海量,屬于AIGC在3D顯示的賽道。賽博演猿是解決數(shù)字化內(nèi)容中高級數(shù)字人創(chuàng)作問題的,屬于AIGC在直播和視頻領(lǐng)域的賽道,后者更為通用。
賽博演猿目前定位的主要客戶群體,是需要通過直播和短視頻宣傳的主播和企業(yè)。
二)
數(shù)字人背后的流量密碼
元界:2021年全球進(jìn)入元宇宙時代,你對元宇宙在中國的發(fā)展有什么預(yù)判?你如何描述數(shù)字人在元宇宙時代的價值?數(shù)字人的發(fā)展與元宇宙的發(fā)展有什么對應(yīng)關(guān)系?你預(yù)測今年年底數(shù)字人達(dá)到10萬,其依據(jù)是什么?
趙天奇:元宇宙在中國發(fā)展會從垂直領(lǐng)域開始落地,5-10之后開始通往通用領(lǐng)域,即先產(chǎn)業(yè)、后大眾的發(fā)展模式。
作為一個自然世界中的人,我們不能進(jìn)入原始的世界里面,但數(shù)字人扮演了這樣一個角色。數(shù)字人可以讓每個人進(jìn)入元宇宙,元宇宙場景可以讓數(shù)字人技術(shù)發(fā)揮出更多價值。從長了說,數(shù)字人是元宇宙終極到來時刻的基礎(chǔ)建設(shè)。
如果我們每個人都擁有VR頭盔,不用現(xiàn)實(shí)生活中在一起,也可以完成我們生活中的絕大多數(shù)的事情、工作和娛樂,那么這個時刻就到來了,但從現(xiàn)在看,這個時間還需要五年甚至更長的時間。
但數(shù)字人技術(shù)已經(jīng)成熟,現(xiàn)在只需產(chǎn)業(yè)推廣就可以快速擴(kuò)大,因此我判斷,到年底數(shù)字人可以達(dá)到10萬人的應(yīng)用規(guī)模。
元界:現(xiàn)在數(shù)字人還不是基建,那它的價值是什么?
趙天奇:它其實(shí)是一個流量密碼。我們現(xiàn)在打開新媒體的平臺,不管是抖音、快手、B站,如果你看到一個東西是你今天走在大街上、在你平時的辦公室或生活里,就能看得到的,你肯定不想看。
現(xiàn)在整個行業(yè)背后的邏輯就是流量密碼,數(shù)字人具有創(chuàng)意的無限可能,可謂是無極限。其新奇的形象、超現(xiàn)實(shí)的能力,以及整個內(nèi)容表現(xiàn)形式,可以帶來比真人多得多的流量。
元界:聚力維度也在做虛擬直播的推廣嘗試和商用,你們發(fā)現(xiàn)數(shù)字人直播里面藏著什么樣的流量密碼?哪些類型客戶正在為此買單?
趙天奇:流量密碼主要就在數(shù)字人的超越現(xiàn)實(shí)上,因?yàn)椴皇乾F(xiàn)實(shí),所以可以更好看,可以更新奇,形象可以是非人,可以有特效,可以有功能,可以遠(yuǎn)程互動等。
這些超現(xiàn)實(shí),就是我們看數(shù)字人直播和短視頻的原因,這就是流量密碼。目前各大企業(yè),包括電視臺、品牌方、運(yùn)營商、廣告制作商以及主播,都在為此買單。
元界:你對短視頻和直播領(lǐng)域數(shù)字人的應(yīng)用發(fā)展,有什么直觀判斷?
趙天奇:我認(rèn)為短視頻和直播領(lǐng)域的數(shù)字人下一步會有指數(shù)級增長。從幾百快速發(fā)展到幾千幾萬的數(shù)量規(guī)模。
元界:價格會是數(shù)字人產(chǎn)業(yè)發(fā)展的門檻嗎?面對越來越多價格便宜的數(shù)字人出現(xiàn),會出現(xiàn)大家爭相擁有自己的數(shù)字人的場景嗎?
趙天奇:價格過去是數(shù)字人產(chǎn)業(yè)發(fā)展的主要門檻,現(xiàn)在價格便宜的數(shù)字人解決方案,很多降低了質(zhì)量。要確保質(zhì)量不降,只降低價格才行。價格只是一個方面,只要虛擬主播的流量密碼被大家發(fā)現(xiàn),需要流量的企業(yè)和主播都會爭相使用,這不是一個行業(yè),是所有需要宣傳和流量的行業(yè)都需要的。
三)
全球唯一的技術(shù)底氣
元界:數(shù)字人產(chǎn)業(yè)發(fā)展需要什么樣的技術(shù)底座?這個行業(yè)是否存在卡脖子的問題?
趙天奇:對于真人驅(qū)動數(shù)字人產(chǎn)業(yè)來說,數(shù)字人技術(shù)底座就是建模、驅(qū)動、渲染、交互。這個行業(yè)所謂的卡脖子問題就是技術(shù)不解決,行業(yè)無法壯大的問題。關(guān)于驅(qū)動方面我們已經(jīng)解決了,目前還有半個問題就是模型問題。
元界:你說公司在驅(qū)動和建模上已經(jīng)取得一些突破,是什么突破?在這兩個領(lǐng)域及其它領(lǐng)域,還存在哪些有待突破的技術(shù)瓶頸?
趙天奇:在驅(qū)動上,我們實(shí)現(xiàn)一個普通攝像頭就能對人表情、動作、手勢的影視級捕捉。在建模上,我們可以用AIGC來自動生成高顏值多樣性可驅(qū)動的數(shù)字人臉。
后邊需要繼續(xù)解決的問題還有AIGC生成非人角色問題、數(shù)字人復(fù)雜交互問題。
元界:這里面蘊(yùn)含著哪些核心技術(shù)?公司怎么進(jìn)入了這些核心技術(shù)領(lǐng)域?
趙天奇:核心在于人工智能技術(shù)與影視制作產(chǎn)業(yè)的結(jié)合創(chuàng)新,行業(yè)的發(fā)展推助我們進(jìn)入了這些技術(shù)領(lǐng)域。
我們在2017年開始研究數(shù)字人技術(shù)之前,就已經(jīng)完成了人工智能和影視結(jié)合的人工智能2D轉(zhuǎn)3D技術(shù),所以對于這種交叉賽道的創(chuàng)新,非常熟悉。
我們又針對這個專有方向,在數(shù)據(jù)采集、標(biāo)注、模型訓(xùn)練、優(yōu)化上,科研了6年時間。在每個環(huán)節(jié)都有創(chuàng)新,這才實(shí)現(xiàn)了用普通攝像頭達(dá)成和百萬級動捕設(shè)備同等的效果。
行業(yè)水漲船高,我們不斷進(jìn)入數(shù)字人高級別市場,每一個介入這一市場的企業(yè)都面臨著高成本、高門檻的雙重壓力。成本,還主要來自于建模和驅(qū)動。為此,聚力維度從2017年初就動了一個念想,能不能讓每一個人都能通過一個平臺,生成高級別、可實(shí)時驅(qū)動、廉價的數(shù)字人創(chuàng)建,也不用昂貴的設(shè)備,或者特別依賴培訓(xùn)獲得技術(shù)經(jīng)驗(yàn)。
元界:這是賽博演猿的價值所在,那公司在技術(shù)上達(dá)到了怎樣的水準(zhǔn)?
趙天奇:我們能夠?qū)崿F(xiàn)影視級別的面部、肢體及手勢動作的精準(zhǔn)捕捉。在這一點(diǎn)上,我們是全世界唯一能做到。
我一直會做一個對比,蘋果做的數(shù)字人,兩只舌頭只能往前伸,我們不僅可以往前伸,而且可以轉(zhuǎn)圈伸,可以舔到嘴邊任何一個部位。
在技術(shù)水平上,我們基于自研的人工智能算法,無需標(biāo)記點(diǎn)、無需適配,僅需單個普通RGB攝像頭,即可精準(zhǔn)捕捉上千個面部微表情,并且達(dá)到全身肢體動態(tài)捕捉,從而實(shí)現(xiàn)用普通攝像頭達(dá)成和百萬級動捕設(shè)備同等的效果。
該技術(shù)是目前全世界唯一的免穿戴、低成本、高質(zhì)量的單目攝像頭動捕技術(shù),以行業(yè)領(lǐng)先水準(zhǔn)解決了數(shù)字人微表情逼真還原、無穿戴數(shù)字人動捕等行業(yè)難題。
在建模方面,聚力維度擁有行業(yè)頂級建模技術(shù),通過真人掃描,匹配原畫雕刻,生動呈現(xiàn)用戶最想要的人物形象。
在無特殊具象定制需求的情況下,我們采用AIGC技術(shù),可以高效率、低成本生成上百萬個行業(yè)價值在50萬元級別的數(shù)字人形象,讓每個人都可以實(shí)時控制高級別數(shù)字人,完成短視頻、直播、會議、綜藝等各類元宇宙形態(tài)的內(nèi)容生產(chǎn),滿足用戶輕量化、隨時隨地虛擬直播的需要。
四)
AI驅(qū)動和真人驅(qū)動,是兩條賽道
元界:在你看來,數(shù)字人行業(yè)如何分類?未來走向何方?
趙天奇:數(shù)字人行業(yè)主要分為兩類:真人驅(qū)動和AI驅(qū)動。真人驅(qū)動是為了解決新奇內(nèi)容,是為了流量;AI驅(qū)動是為了解決低端工作由AI取代、節(jié)省人工的問題。
真人驅(qū)動數(shù)字人之前,只有用傳統(tǒng)捕捉設(shè)備的方案,現(xiàn)在剛剛進(jìn)入第二階段,普通人也可以用得起,用視覺捕捉來驅(qū)動高級別數(shù)字人。
元界:數(shù)字人市場,中外各有哪些優(yōu)勢?
趙天奇:中國數(shù)字人市場目前在AI驅(qū)動上沒有國外的ChatGPT強(qiáng)。在真人驅(qū)動上,我們是唯一能做到普通攝像頭捕捉,并達(dá)到影視級效果的。
我曾說,如果有第二家企業(yè)想追上聚力維度的技術(shù)水平,至少也要花費(fèi)兩三年的時間,這是從整個世界來說的。我們在這個專業(yè)領(lǐng)域早于全世界所有公司,擁有獨(dú)特的行業(yè)積累,又有5年的先發(fā)優(yōu)勢,所以我們能做到全世界斷檔式領(lǐng)先。
如果沒有我們的技術(shù),整個產(chǎn)業(yè)都無法去想象一個普通攝像頭去做電視臺級別的數(shù)字人直播。
另外,形成這種最高級別的數(shù)字人,行業(yè)價值幾十萬。我們生成的都能達(dá)到這個級別,價格不用幾十萬,而且具有多樣性。
最關(guān)鍵的是,可以驅(qū)動現(xiàn)在用生成圖片的方式生成的美女帥哥們所形成的數(shù)字人,都是不能用的,但是我們這可以,而且發(fā)型、衣服等都可以自定義,讓每一個人真正用得起,而且是高級別的,還可以把音量、重點(diǎn)、語速、情緒、情感這些東西都保留下來。
元界:公司的數(shù)字人與英偉達(dá)的數(shù)字人有何優(yōu)劣?是否存在技術(shù)方向不一樣的問題?
趙天奇:我們的數(shù)字人主要解決驅(qū)動、建模問題,英偉達(dá)主要是引擎和AI驅(qū)動,所以不是誰更好的問題,技術(shù)路線不同,環(huán)節(jié)不同。
關(guān)于痛點(diǎn)與競爭
元界:賽博演猿還有哪些地方有待改進(jìn)?在商業(yè)化上公司的痛點(diǎn)是什么?
趙天奇:目前還需要改進(jìn)的主要是根據(jù)垂直場景的功能開發(fā),比如直播交互。目前我們公司技術(shù)上已經(jīng)解決了產(chǎn)業(yè)問題,在商業(yè)化上,聚力維度主要考慮的就是如何把顛覆性新產(chǎn)品通過用戶教育和推廣傳播給整個生態(tài),這也是公司主要的痛點(diǎn)。
元界:下一步會如何解決這一痛點(diǎn)?
趙天奇:我們會繼續(xù)采用自己直播和渠道合作的方式,加大推廣力度。我們也歡迎大家跟我們聯(lián)合,為此推出了數(shù)字人加速器計(jì)劃,第一批招募60家企業(yè)。我們還要聚焦賦能建模師,讓他們按照我們的標(biāo)準(zhǔn)去建模。CG模型網(wǎng)已經(jīng)跟我們達(dá)成戰(zhàn)略合作,它們旗下大概有200萬位建模師。
另外,整個產(chǎn)業(yè)高級別的數(shù)字人,還特別少,應(yīng)該說還不到300人。我們在思考,如何讓像央視這種高級別的虛擬主播,普通的主播也用得起。為此,我們推出每月599元就可以達(dá)到跟央視同樣水平的、人人可用的高端數(shù)字人。你想做什么樣的內(nèi)容,想擁有什么樣的流量就可以了。只有創(chuàng)意能夠能夠阻擋你,其它東西都阻擋不了。
元界:大元宇宙階段,所有人都擁有數(shù)字人,真正實(shí)現(xiàn)生活、娛樂、工作等方方面面都在元宇宙。除了空間不同,在你看來,這與我們當(dāng)下都離不開微信生態(tài)圈,有什么根本不同?
趙天奇:大元宇宙階段,我們都帶上VR頭盔,在一個數(shù)字世界里娛樂和工作?;ハ鄠鬏?shù)男畔⑹?D沉浸的,所以可以做除了物理接觸以外所有的事。而目前手機(jī)微信時代只能傳輸小屏幕的圖像文字信息,所以有根本不同。
元界:公司會深耕數(shù)字人,還是也會向其它元宇宙領(lǐng)域發(fā)展?單純發(fā)展數(shù)字人會不會面臨被其它公司降維打擊的可能性?
趙天奇:我們會深耕數(shù)字人方向,應(yīng)用在直播元宇宙生態(tài)上。在大元宇宙到來的時候我們應(yīng)該是與做VR設(shè)備、社交軟件等公司形成組合關(guān)系,除非是對手的數(shù)字人技術(shù)和生態(tài)比我更強(qiáng),否則不會被降維打擊。
六)
初衷、使命、商業(yè)哲學(xué)與融資
元界:你創(chuàng)業(yè)的初衷是什么?目前如何定位聚力維度?有什么愿景、使命?
趙天奇:我的初衷是,用人工智能讓藝術(shù)創(chuàng)作也能插上科技的翅膀飛向自動化。具體來說就是讓每個人只要有創(chuàng)作能力就可以完成影視內(nèi)容的直播和視頻。目前在技術(shù)上已經(jīng)達(dá)到了,下一步要在產(chǎn)業(yè)上海量落地。
聚力維度定位是數(shù)字人AIGC平臺全球領(lǐng)軍者,愿景是成為元宇宙時代的數(shù)字人頭部服務(wù)商,服務(wù)超百萬個人消費(fèi)者,使命是讓每個人用上新奇、有流量的數(shù)字人。
元界:創(chuàng)業(yè)以來你印象最為深刻的事情是什么?你信奉什么樣的商業(yè)哲學(xué),并怎么體現(xiàn)在企業(yè)內(nèi)部?
趙天奇:最深刻的事就是挑戰(zhàn)全世界都沒做到的技術(shù)科研,但還遲遲做不出來,但有一天終于迎來關(guān)鍵突破的時刻。
我信奉的商業(yè)哲學(xué)是價值,是科研。人類走到今天就是靠科學(xué)的發(fā)展,不斷的創(chuàng)造前所未有的新價值,這不僅是我的商業(yè)哲學(xué),也是人生的意義。我們企業(yè)的小伙伴也都以創(chuàng)造前所未有的科技創(chuàng)新價值,為使命和榮譽(yù)。
元界:目前公司團(tuán)隊(duì)情況如何?是否還在融資?你希望提醒投資者關(guān)注公司的哪些點(diǎn)、線或面?
趙天奇:公司目前人員規(guī)模80人,企業(yè)研發(fā)人員占比超過一半,團(tuán)隊(duì)分為科研、開發(fā)、測試、業(yè)務(wù)以及運(yùn)營團(tuán)隊(duì)。
我們主要是看哪些投資公司理解并認(rèn)可真人驅(qū)動數(shù)字人賽道,我們希望組合更多資源,一起把這個產(chǎn)業(yè)數(shù)字人數(shù)量從百級發(fā)展到百萬級。
聯(lián)系客服