導(dǎo)語(yǔ):一方面是圍繞“價(jià)值創(chuàng)造”的務(wù)實(shí)主義,一方面是基于更長(zhǎng)遠(yuǎn)未來的“技術(shù)追求”,這共同奠定了京東在產(chǎn)業(yè)大模型領(lǐng)域的理念領(lǐng)先與成果領(lǐng)先。
路言 | 作者 礪石商業(yè)評(píng)論 | 出品
1
大模型時(shí)代“新共識(shí)”
隨著ChatGPT的橫空出世,大模型便一直是2023年上半年中國(guó)科技產(chǎn)業(yè)的最熱門詞匯。不過,在進(jìn)入下半年后,大模型領(lǐng)域卻發(fā)生了一個(gè)新的變化,即“產(chǎn)業(yè)大模型”正代替通用大模型成為新的方向共識(shí)。
在此背后是,隨著公眾對(duì)大模型的研究越來越多,人們便越來越意識(shí)到通用大模型所采用的通用信息存在一些錯(cuò)誤、謠言與偏見,且專業(yè)知識(shí)與行業(yè)數(shù)據(jù)積累不足,導(dǎo)致該類模型的數(shù)據(jù)“噪音”過大,行業(yè)針對(duì)性與精準(zhǔn)度不足,無法創(chuàng)造出深層次的價(jià)值。
在產(chǎn)業(yè)場(chǎng)景中,專業(yè)服務(wù)要求高、容錯(cuò)性低,需要能夠在實(shí)際場(chǎng)景中真正解決具體的問題。因此,企業(yè)使用的大模型必須可信、可用、可控,而且最好是經(jīng)過反復(fù)與充分測(cè)試。
這一行業(yè)變化讓筆者不得不佩服京東在大模型領(lǐng)域的前瞻判斷。近半年,筆者一直對(duì)大模型領(lǐng)域各個(gè)企業(yè)的進(jìn)展保持著密切的關(guān)注,在大模型剛開始在中國(guó)興起時(shí),類似百度文心一言、阿里通義千問等大多數(shù)企業(yè)都是對(duì)標(biāo)OpenAI推出的ChatGPT,意在打造一個(gè)類似的無所不能的通用大模型。
而當(dāng)時(shí)只有京東認(rèn)為產(chǎn)業(yè)才是大模型的最終歸宿,并在國(guó)內(nèi)旗幟鮮明地提出了要做“產(chǎn)業(yè)大模型”的戰(zhàn)略路徑,這讓筆者印象頗為深刻。京東CEO許冉后來將京東此次從產(chǎn)業(yè)端切入大模型,比喻為“從北坡攀爬技術(shù)珠峰”,道路雖然更加艱難,卻有更波瀾壯闊的風(fēng)景。
時(shí)至今日,京東對(duì)產(chǎn)業(yè)大模型的探索逐漸成為大多數(shù)深度思考者的共識(shí)。不過,在其他企業(yè)陸續(xù)選擇跟進(jìn)這一戰(zhàn)略時(shí),京東又率先拿出了實(shí)際成果。7月13日,京東在北京召開了“2023京東全球科技探索者大會(huì)暨京東云峰會(huì)”(下稱:JDD),會(huì)上京東推出了被業(yè)界廣泛關(guān)注的京東言犀大模型和言犀大模型開放計(jì)算平臺(tái)。
那么,京東的大模型有什么與眾不同呢?
從官方表述來看,京東言犀大模型是從京東優(yōu)質(zhì)的產(chǎn)業(yè)場(chǎng)景與數(shù)據(jù)中錘煉而來,具備更強(qiáng)的產(chǎn)業(yè)屬性。在訓(xùn)練時(shí)便使用了70%通用域數(shù)據(jù)與30%京東數(shù)智供應(yīng)鏈原生數(shù)據(jù)。
2
“價(jià)值務(wù)實(shí)”下的京東大模型
除了官方表述,筆者認(rèn)為要想更深入了解京東大模型的差異化,首先需要了解京東在大模型底層理念上的思考,這才是產(chǎn)品差異化的根源。
今年早期,一些在大模型領(lǐng)域有所積累的企業(yè),在產(chǎn)品尚不成熟時(shí)便急于推出自己的大模型產(chǎn)品;另外一些缺乏技術(shù)積累的企業(yè),則因?yàn)槿狈I(yè)判斷力,只能簡(jiǎn)單粗暴地直接模仿ChatGPT。歸納這兩類企業(yè)的本質(zhì),都只是將做出大模型作為目的本身,并借此來?yè)屨驾浾撽P(guān)注與制造資本故事,而沒有從“價(jià)值創(chuàng)造”的角度去思考大模型的真實(shí)應(yīng)用場(chǎng)景。
而京東得益于其長(zhǎng)期深耕實(shí)體經(jīng)濟(jì)的務(wù)實(shí)思維,其一直堅(jiān)持“創(chuàng)造明確的價(jià)值應(yīng)當(dāng)是技術(shù)的目標(biāo)”,所以天然便不會(huì)將單純的做出“大模型”作為目的,而只是將其視為不斷優(yōu)化“成本、效率、體驗(yàn)”的一種工具。京東集團(tuán)技術(shù)委員會(huì)主席,京東云事業(yè)群總裁曹鵬在接受采訪時(shí)表示,“技術(shù)本身是沒有辦法直接產(chǎn)生價(jià)值的,技術(shù)只有放到場(chǎng)景里才能夠產(chǎn)生實(shí)際的價(jià)值”。
“寫寫詩(shī),聊聊天”并不能滿足產(chǎn)業(yè)需求。JDD上,京東正式公布了對(duì)大模型價(jià)值的理解,并凝練成一個(gè)公式:“大模型的價(jià)值=算法×算力×數(shù)據(jù)×產(chǎn)業(yè)厚度的平方”。算法、算力與數(shù)據(jù)作為人工智能的三要素,大家都頗為熟悉,產(chǎn)業(yè)厚度則是指能在多少產(chǎn)業(yè)場(chǎng)景中切實(shí)應(yīng)用,為社會(huì)真正創(chuàng)造價(jià)值。
理念的落地,還需要借助資源與能力的優(yōu)勢(shì)。而京東在數(shù)字供應(yīng)鏈領(lǐng)域的長(zhǎng)期深耕,為京東產(chǎn)業(yè)大模型的落地提供了差異化的數(shù)據(jù)優(yōu)勢(shì)與能力優(yōu)勢(shì)。
在數(shù)據(jù)方面,京東采用30%的數(shù)智供應(yīng)鏈原生數(shù)據(jù),涵蓋了旗下零售、物流、科技、金融、產(chǎn)發(fā)、工業(yè)、保險(xiǎn)與國(guó)際等核心業(yè)務(wù)。數(shù)據(jù)本身是驅(qū)動(dòng)人工智能的重要力量,例如ChatGPT自發(fā)布以來,通過大量人類反饋的交互數(shù)據(jù),效果越來越好。這種數(shù)據(jù)只有在交互中才會(huì)產(chǎn)生,需要?jiǎng)討B(tài)而非靜態(tài)的數(shù)據(jù),很難在互聯(lián)網(wǎng)上獲取,這是京東的獨(dú)特優(yōu)勢(shì)。在能力方面,京東大模型則充分融合京東在數(shù)字基礎(chǔ)設(shè)施、產(chǎn)業(yè)協(xié)同與城市智能化管理領(lǐng)域的優(yōu)勢(shì)積累。
這些源于產(chǎn)業(yè)和內(nèi)部業(yè)務(wù)場(chǎng)景的“人無我有”的數(shù)據(jù)與能力,最終帶來了京東大模型的差異化。目前,這種差異化成果已經(jīng)在京東的內(nèi)部業(yè)務(wù)場(chǎng)景得到充分檢驗(yàn)。
例如,在零售領(lǐng)域,京東商城的消費(fèi)者可以從過去通過關(guān)鍵詞搜索的交互方式,轉(zhuǎn)向類似現(xiàn)場(chǎng)導(dǎo)購(gòu)的問答式交互。當(dāng)用戶提問“我想去露營(yíng)需要什么裝備”時(shí),系統(tǒng)就會(huì)自動(dòng)推薦帳篷、燒烤架與登山鞋等商品。
在健康領(lǐng)域,京東健康利用大模型可以對(duì)用戶病史信息了解地更透徹和全面,保證輔助診療結(jié)果能夠切合用戶自身特點(diǎn),從而提高診療效果。目前,健康助手及輔助診療已涵蓋超千種疾病專業(yè)性服務(wù),20種評(píng)價(jià)標(biāo)準(zhǔn)保障醫(yī)療安全。
在物流領(lǐng)域,京東物流超腦目前基于多模態(tài)大模型很好地實(shí)現(xiàn)了實(shí)時(shí)交互、根因分析和智能決策,未來有望具備實(shí)時(shí)自動(dòng)生成全局最優(yōu)的供應(yīng)鏈解決方案的能力。一個(gè)典型的應(yīng)用場(chǎng)景,在對(duì)倉(cāng)庫(kù)布局進(jìn)行分析時(shí),只要輸入“請(qǐng)分析在今年雙11大促的布局堵點(diǎn)”,融入大模型技術(shù)的系統(tǒng)便會(huì)給出回答,“效率堵點(diǎn)為地狼貨架數(shù)目不夠,建議增加一排貨架”,這大大減少了傳統(tǒng)方法花在調(diào)研、分析上的成本。
在當(dāng)前較為流行的數(shù)字人方面,融合大模型技術(shù)的京東云言犀多模態(tài)數(shù)字人,可以通過提供極少量樣本素材,以對(duì)話交互模式實(shí)現(xiàn)從形象、音色、背景視覺、知識(shí)庫(kù)到短視頻等全鏈路內(nèi)容的自動(dòng)生成,支持5分鐘簡(jiǎn)易拍攝,支持生成大姿態(tài)(如側(cè)臉/走動(dòng)/手勢(shì)),支持動(dòng)態(tài)局部高清與語(yǔ)義驅(qū)動(dòng)的肢體動(dòng)作編排,進(jìn)一步降低操作門檻與操作難度,讓更多中小商家與個(gè)人能夠用得起、用得上數(shù)字人服務(wù)。今年618期間,言犀虛擬主播開播商家較去年11.11增幅超5倍,帶動(dòng)商家GMV較去年11.11增幅超246%,大幅為品牌直播間降本提效。
雖然京東大模型已經(jīng)是行業(yè)內(nèi)具有成熟應(yīng)用實(shí)踐的大模型產(chǎn)品,但京東依然秉持著一貫的務(wù)實(shí)主義,沒有急于大規(guī)模對(duì)外開放,而是制定了京東言犀大模型的“三步走”戰(zhàn)略。
第一步,推出京東言犀大模型的基座模型與“言犀AI開發(fā)計(jì)算平臺(tái)”;第二步,讓大模型在京東內(nèi)部高復(fù)雜場(chǎng)景進(jìn)行大規(guī)模錘煉;最后,大模型在內(nèi)部應(yīng)用中能夠明確創(chuàng)造價(jià)值后,才針對(duì)嚴(yán)肅商業(yè)場(chǎng)景將融合行業(yè)解決方案對(duì)外輸出。
而在對(duì)外輸出上,京東也有著清晰的思考,即優(yōu)先在數(shù)字化領(lǐng)先的場(chǎng)景落地。例如,制造產(chǎn)業(yè)的數(shù)智化供應(yīng)鏈、城市智慧管理、電商數(shù)字人、金融機(jī)構(gòu)數(shù)智營(yíng)銷與大型央企的集團(tuán)化管理,數(shù)字化基礎(chǔ)都較為扎實(shí),會(huì)更利于大模型能力的釋放。這種務(wù)實(shí)的戰(zhàn)略,也將讓京東的大模型團(tuán)隊(duì)卸掉短期的業(yè)績(jī)包袱,真正做出好的、有價(jià)值的產(chǎn)品與服務(wù)。
目前,針對(duì)大模型融合解決方案的對(duì)外輸出,京東也發(fā)布了支持企業(yè)客戶專用模型研發(fā)的三大基礎(chǔ)設(shè)施、兩大平臺(tái)與五大行業(yè)應(yīng)用。
三大基礎(chǔ)設(shè)施分別是言犀大模型開放計(jì)算平臺(tái)、向量數(shù)據(jù)庫(kù)與高性能的算力基礎(chǔ)設(shè)施。兩大平臺(tái)分別是針對(duì)數(shù)據(jù)與智能交互兩個(gè)核心能力的優(yōu)加DaaS3.0與言犀智能服務(wù)3.0。五大行業(yè)應(yīng)用分別是面向零售、金融、城市、健康與物流領(lǐng)域的專屬方案。
其中,最值得一提的是言犀大模型開放計(jì)算平臺(tái),其沉淀了京東在零售、物流、健康、金融等行業(yè)多年積累的知識(shí),集成了京東技術(shù)團(tuán)隊(duì)研發(fā)的超100種場(chǎng)景的AI算法和工具,打造了低代碼AI平臺(tái),可以為用戶提供從數(shù)據(jù)模型到應(yīng)用服務(wù)的全周期管理,實(shí)現(xiàn)真正的MaaS(模型即服務(wù))。
過去,企業(yè)需要10余人的科學(xué)家團(tuán)隊(duì)工作,現(xiàn)在只需要1-2個(gè)算法人員,即可通過京東言犀AI開發(fā)計(jì)算平臺(tái)完成從數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練到模型部署的全流程,訓(xùn)練效率提升2倍,推理提效6.2倍,成本節(jié)約近90%。
而對(duì)于大多數(shù)企業(yè)來說,自建大模型不僅周期長(zhǎng),效率低,成本高。經(jīng)過內(nèi)部復(fù)雜場(chǎng)景充分檢驗(yàn)的京東大模型融合解決方案,則無疑是構(gòu)建企業(yè)專用大模型的一種“最優(yōu)解”,其勢(shì)必會(huì)受到那些對(duì)大模型“望眼欲穿”的企業(yè)客戶的信任與期待,我們也對(duì)京東大模型在未來的大規(guī)模開放拭目以待。
3
技術(shù)追求下的復(fù)利效應(yīng)
除了注重“價(jià)值創(chuàng)造”的務(wù)實(shí)思維,京東對(duì)“成本、效率、體驗(yàn)、可信、普惠、突破”的技術(shù)追求是其在產(chǎn)業(yè)大模型領(lǐng)域拔得頭籌的另外一個(gè)重要原因。
不同于很多企業(yè)的跟風(fēng),京東在ChatGPT走紅之前,其實(shí)就已經(jīng)在大模型領(lǐng)域完成了最核心的技術(shù)積累。例如在算力方面,京東于2021年在重慶落地了全國(guó)首個(gè)基于SuperPOD架構(gòu)的超大規(guī)模計(jì)算集群——天琴α,算力總規(guī)模達(dá)到135TFLOPS(每秒浮點(diǎn)運(yùn)算次數(shù)),推理提速6.2倍,推理成本節(jié)省90%,是當(dāng)時(shí)國(guó)內(nèi)最大的超算集群。
在算力基礎(chǔ)設(shè)施構(gòu)建完成的同時(shí),京東云言犀團(tuán)隊(duì)在算法上也取得了重大突破,尤其是具有自主產(chǎn)權(quán)的“知識(shí)注入的預(yù)訓(xùn)練語(yǔ)言模型”K-PLUG的提出,增強(qiáng)了京東大模型輸出內(nèi)容的可信。
目前,K-PLUG生成的商品文案已覆蓋京東超3000個(gè)品類,累計(jì)生成30億字,人工審過率超過95%,帶來超過3億元GMV,助力品牌降本增效。
在解決泛化問題上,2022年推出百億級(jí)模型Vega,并于2023年在通用語(yǔ)言理解基礎(chǔ)模型方面對(duì)織女大模型進(jìn)行再升級(jí),提出規(guī)模更大、性能更強(qiáng)、遷移性更好的Vega v2模型。該模型支持3D并行訓(xùn)練,能實(shí)現(xiàn)高效推理與云邊協(xié)同,能夠廣泛應(yīng)用于情感分析、語(yǔ)義匹配、語(yǔ)法糾錯(cuò)、智能問答、常識(shí)推理等多種下游自然語(yǔ)言處理任務(wù)。在國(guó)際權(quán)威的復(fù)雜語(yǔ)言理解任務(wù)評(píng)測(cè)SuperGLUE榜單上,Vega v2模型以平均分91.3的成績(jī)登頂全球榜首。
Vega系列模型的奪冠證明了京東的多語(yǔ)言自然語(yǔ)言處理技術(shù)能力在超級(jí)深度學(xué)習(xí)領(lǐng)域的領(lǐng)先性。
在上述模型訓(xùn)練的過程中,京東在任務(wù)型對(duì)話、語(yǔ)義理解、語(yǔ)言生成等領(lǐng)域的能力都不斷成熟,這些能力最終帶來2023年更加成熟的言犀千億大模型。所以,京東在產(chǎn)業(yè)大模型領(lǐng)域的脫穎而出,絕非是因?yàn)閷?duì)GPT熱潮的跟風(fēng)與效仿,而是源于京東的技術(shù)追求所帶來的復(fù)利效應(yīng)。
4
結(jié)語(yǔ)
《礪石商業(yè)評(píng)論》在長(zhǎng)期的商業(yè)研究過程中發(fā)現(xiàn),商業(yè)界不是比拼誰(shuí)走得更早,更快,而是比拼誰(shuí)能走得更久,更遠(yuǎn)。
京東集團(tuán)CEO許冉在發(fā)布會(huì)演講中也表示,京東堅(jiān)持做“難而正確的事”,堅(jiān)持做實(shí)事、有價(jià)值的事和長(zhǎng)期的事,“我們眼中的人工智能,是一場(chǎng)非常嚴(yán)肅的技術(shù)革命,需要具備長(zhǎng)期主義的心態(tài)。京東不會(huì)把沒有實(shí)現(xiàn)'色香味俱全’的菜肴端上餐桌,在內(nèi)部的關(guān)鍵場(chǎng)景完成了歷練和實(shí)踐的大模型,京東才會(huì)開放給合作伙伴,帶動(dòng)整個(gè)行業(yè)降本增效”。
很明顯,這一輪角逐大模型落地的難點(diǎn)并不在于技術(shù)追趕,而在于產(chǎn)業(yè)突破。
京東集團(tuán)技術(shù)委員主席、京東云總裁曹鵬在采訪中也表示,“大模型的角逐是一場(chǎng)長(zhǎng)跑,一個(gè)技術(shù)在產(chǎn)業(yè)里產(chǎn)生價(jià)值需要長(zhǎng)周期的積累”。
一方面是圍繞“價(jià)值創(chuàng)造”的務(wù)實(shí)主義,一方面是基于更長(zhǎng)遠(yuǎn)未來的“技術(shù)追求”。在這樣的底層思維模式下,筆者相信京東大模型也將復(fù)制京東生態(tài)內(nèi)其他成功業(yè)務(wù)的進(jìn)化與蝶變過程。
在自身進(jìn)化與蝶變的過程中,其也將幫助千行百業(yè)的企業(yè)家們,盡快破除對(duì)大模型的陌生感與距離感,加速在研發(fā)、生產(chǎn)、銷售與服務(wù)等具體業(yè)務(wù)場(chǎng)景的落地應(yīng)用,切實(shí)享受到大模型為企業(yè)降本增效帶來的價(jià)值。
就像之前互聯(lián)網(wǎng)時(shí)代已經(jīng)證實(shí)的那樣,誰(shuí)能率先利用好互聯(lián)網(wǎng)技術(shù)完成企業(yè)業(yè)務(wù)模式的升級(jí)與重塑,誰(shuí)就在過去20年間獲得了最大的紅利,而在人工智能技術(shù)時(shí)代亦是如此,誰(shuí)能率先在企業(yè)業(yè)務(wù)場(chǎng)景中應(yīng)用好大模型為核心的人工智能技術(shù),誰(shuí)也將有望獲得未來的最大紅利。
聯(lián)系客服