7月13日,京東言犀大模型在2023京東全球科技探索者大會暨京東云峰會上推出。與通用大模型相比,這一源于產(chǎn)業(yè)、服務產(chǎn)業(yè)的大模型,融合70%通用數(shù)據(jù)與30%數(shù)智供應鏈原生數(shù)據(jù),具有“更高產(chǎn)業(yè)屬性、更強泛化能力、更多安全保障”的優(yōu)勢,致力于深入零售、物流、金融、健康、政務等知識密集型、任務型產(chǎn)業(yè)場景,解決真實產(chǎn)業(yè)問題。
為夯實產(chǎn)業(yè)應用,京東推出了一套大模型的完整工具,包括支撐大模型研發(fā)的基礎設施——言犀AI開發(fā)計算平臺、向量數(shù)據(jù)庫、混合多云操作系統(tǒng)云艦、高性能存儲平臺云海、軟硬一體虛擬化引擎京剛等核心產(chǎn)品。
依托京東言犀大模型,以及京東在產(chǎn)業(yè)和供應鏈側的優(yōu)勢,京東還發(fā)布了兩大服務平臺,包括全新升級的優(yōu)加DaaS和言犀智能服務平臺,以及面向零售、金融、城市、健康、物流五大領域的行業(yè)解決方案。
京東集團CEO許冉表示:“京東的大模型技術演進,遵循了京東的技術追求:成本、效率、體驗、可信、普惠、突破。成本、效率和體驗是從京東的經(jīng)營理念傳承而來,也是零售的第一性原理。可信、普惠和突破則是技術服務于產(chǎn)業(yè)和社會的承諾。”
京東相信,京東關于技術追求的內(nèi)涵,在以大模型為代表的AI技術領域,能夠讓產(chǎn)業(yè)伙伴更加放心和低門檻地使用技術創(chuàng)新的成果,幫助技術走出實驗室和公司的圍墻,真正推動行業(yè)生產(chǎn)效率的提升,在產(chǎn)業(yè)場景發(fā)揮更大價值。
最懂產(chǎn)業(yè)的大模型
用產(chǎn)業(yè)數(shù)據(jù)和Know-how創(chuàng)造價值
“大模型真正實現(xiàn)自己的價值,一定是在產(chǎn)業(yè)應用中?!痹S冉表示,大模型的價值=算法×算力×數(shù)據(jù)×產(chǎn)業(yè)厚度2“前三個指標固然重要,但技術在產(chǎn)業(yè)場景落地應用,創(chuàng)造實際價值才是關鍵。當產(chǎn)業(yè)效率和產(chǎn)業(yè)的邊界拓展得到質(zhì)的提升以后,大模型才有了更重要的實際價值和意義,這將不亞于又一次工業(yè)革命。”
“從產(chǎn)業(yè)端切入大模型,如同從北坡攀登技術珠峰,道路雖然更加艱難,卻有更波瀾壯闊的風景?!痹S冉說。
產(chǎn)業(yè)場景是京東非常擅長的領域。京東作為一家新型實體企業(yè),自身發(fā)展就來自產(chǎn)業(yè)場景歷練,擁有包括零售、物流、科技、健康、工業(yè)、產(chǎn)發(fā)等豐富的產(chǎn)業(yè)布局。這為京東積累下每年數(shù)百億條優(yōu)質(zhì)交互數(shù)據(jù),訓練言犀大模型的數(shù)據(jù)庫,就由70%通用數(shù)據(jù)和30%供應鏈原生數(shù)據(jù)組成。
深厚的產(chǎn)業(yè)數(shù)據(jù)積累,以及千行百業(yè)Know-How,成為京東布局大模型的核心優(yōu)勢,訓練出的大模型天然具備“產(chǎn)業(yè)基因”。此外,言犀大模型還具備行業(yè)泛化能力,并能夠保障客戶在云上云下安全使用。
“數(shù)智供應鏈訓練了產(chǎn)業(yè)大模型,而大模型則依托供應鏈深入產(chǎn)業(yè)”,京東集團技術委員會主席、京東云事業(yè)部總裁曹鵬如是說。
對于大模型的應用實踐,京東也有明確的“三步走”規(guī)劃。目前,京東云已經(jīng)基于內(nèi)部實踐構建了通用大模型;到今年年底這段時間,京東將經(jīng)由高復雜場景大規(guī)模錘煉,迭代出扎實的產(chǎn)業(yè)服務;預計在2024年初,會將大模型能力向外部嚴肅商業(yè)場景開放。目前,京東已經(jīng)走到第二步,并在內(nèi)部取得了豐富的實踐成果。
“某種意義上,我們的大模型相當于既做了通識教育,又讀了四年專業(yè)性的本科教育”, 京東探索研究院院長、京東科技智能服務與產(chǎn)品部總裁何曉冬博士表示。大模型的難點不在技術追趕,而是產(chǎn)業(yè)突破。京東言犀大模型的產(chǎn)業(yè)實踐,是京東非常關注的部分。
構建大模型“訓練營”和“彈藥庫”打通技術落地每一步
京東從很早就開始布局大模型。2021年,京東就推出十億級模型K-PLUG,2022年推出百億級模型Vega,本次大會則展示了千億級模型。
正是提早布局,讓京東形成了一套大模型的完整工具鏈:言犀AI開發(fā)計算平臺、向量數(shù)據(jù)庫,以及全新升級的基礎設施云艦、云海和京剛。
京東的言犀AI開發(fā)計算平臺,能夠為客戶的大模型開發(fā)和行業(yè)應用開發(fā),提供定制化解決方案。它既具備行業(yè)知識庫,沉淀了京東自己的零售、物流、健康、金融等行業(yè)Know-How,又具備100多種訓練和推理優(yōu)化工具,能將通用模型迅速轉化為專業(yè)模型。
在大會現(xiàn)場,京東演示了將通用大模型轉化為健康產(chǎn)業(yè)大模型的操作。通常,客戶完成這套流程,從數(shù)據(jù)準備、模型訓練到模型部署,需要10余名科學家花費一周時間。但利用言犀AI開發(fā)計算平臺,只需要1-2名算法人員,在數(shù)分鐘就能完成。通過平臺模型加速工具的優(yōu)化,還能節(jié)省90%的推理成本。
京東健康發(fā)布的京醫(yī)千詢大模型,就是建立在京東言犀通用大模型基礎之上,能快速完成在醫(yī)療健康領域各個場景的遷移和學習,從而實現(xiàn)產(chǎn)品和解決方案的全面AI化部署,能為遠程醫(yī)療服務提供堅實的技術底座。
此外,京東還展示了金融領域AI營銷運營平臺。使用者通過簡單的對話,就能一站式生成營銷活動,覆蓋運營策略制定、營銷人物調(diào)度編排、搭建活動頁面、批量生成營銷文案和素材、數(shù)字化投放等方面。過去這套流程需要產(chǎn)品、研發(fā)、算法、設計、分析師5類職能人員,如今減少到1人;過去流程需要2000次人機交互,也減少到少于50次。在大模型能力的加持下,營銷方案的生產(chǎn)效率有了百倍提高。
在電商領域,京東云AIGC內(nèi)容營銷平臺也大有作為。從一張商品圖出發(fā),它能夠理解商品特征,快速勝場電商運營需要的商品主圖、營銷海報圖和商詳圖等,滿足商家快速開店和營銷的需求。有了人工智能的加持,每套圖的制作成本能降低90%,制作周期也從7天縮短到半天。
以財富場景為例,目前京東機構基金代銷系統(tǒng)中已經(jīng)上線言犀有方模塊,給機構客戶提供更便捷的基金篩選和投研分析功能。
如果說言犀AI開發(fā)計算平臺是大模型的“訓練營”,向量數(shù)據(jù)庫則是大模型的“彈藥庫”,是大模型使用數(shù)據(jù)的橋梁。京東從2019年開始研發(fā)向量數(shù)據(jù)庫,歷經(jīng)電商大促場景磨練,向量數(shù)據(jù)庫Vearch已經(jīng)能支撐百億級高性能檢索,延時降低到毫秒級,可用性達到99.99%,已經(jīng)服務超過100家大中型企業(yè)用戶。京東將向量數(shù)據(jù)庫用于大模型預訓練,將推理成本降低了80%。
對大模型所需的計算資源,京東也做出了充分的準備。在重慶太陽島,京東全國首個超算中心——天琴α集群正日夜不停地運轉,推理速度較過去提升6.2倍,推理成本節(jié)約90%,成為技術創(chuàng)新背后強大的算力支撐。
京東云的三個核心產(chǎn)品,此次也迎來升級:全新升級的混合多云操作系統(tǒng)云艦,將GPU/NPU的資源成本降低50%,并提供行業(yè)最高的業(yè)務連續(xù)性承諾。高性能存儲平臺云海,將單集群每秒讀寫性能提升5倍,達到千萬級;時延降低50%,達到百微秒級;使用成本則降低30%。軟硬一體的虛擬化引擎京剛,將虛擬化卸載到智能網(wǎng)卡中,虛擬化損耗降至0,網(wǎng)絡性能提升高達4倍,并支持100Gb VPC網(wǎng)絡,云硬盤單實例性能突破百萬IOPS。
升級多場景解決方案技術創(chuàng)新讓產(chǎn)業(yè)受益
伴隨技術進步,產(chǎn)業(yè)應用已經(jīng)從流程驅(qū)動和數(shù)據(jù)驅(qū)動,進化到知識驅(qū)動階段。京東也升級了兩個能夠積累高質(zhì)量行業(yè)數(shù)據(jù)的平臺:全新的優(yōu)加DaaS和言犀智能服務,來支撐產(chǎn)業(yè)應用對數(shù)據(jù)的新需求。
新升級的優(yōu)加DaaS具備三個優(yōu)勢:更多維,既包括企業(yè)自身的數(shù)據(jù),也能實現(xiàn)企業(yè)和京東及生態(tài)數(shù)據(jù)的安全互通和融合;更易用,大幅提高交互體驗、降低使用門檻,用簡單描述即可生成答案;更簡單,串聯(lián)數(shù)據(jù)開發(fā)平臺、數(shù)據(jù)服務平臺、數(shù)據(jù)可視化平臺等的原子能力,將原本復雜系統(tǒng)間的操作簡化。
言犀智能服務升級后,也具備了更豐富的交互渠道,覆蓋從智能客服到直播間,從移動終端到線下智能端;更生動的交互效果,支持語音、視頻、文字等方式;更專業(yè)的交互內(nèi)容,生成的專業(yè)領域交互內(nèi)容,更加可控、可用。目前,它已經(jīng)服務于12345熱線、銀行數(shù)字員工、專家診斷場景等嚴肅場景。
技術要實現(xiàn)產(chǎn)業(yè)價值,供應鏈是重要的抓手。京東云深入全渠道一盤貨、供應鏈金融科技、產(chǎn)業(yè)協(xié)同、數(shù)據(jù)中臺、數(shù)字倉庫等20多個數(shù)字化場景,已經(jīng)服務100座城市、2500+家大型企業(yè)、944家金融機構和超250萬家中小微企業(yè)。這些千行百業(yè)的數(shù)字化實踐,成就了最懂產(chǎn)業(yè)的云。
“智能化優(yōu)先在數(shù)字化領先的行業(yè)發(fā)生”,京東集團副總裁、京東科技產(chǎn)品與解決方案總裁高禮強表示。在零售、金融、城市、物流等多個場景,京東都發(fā)布了全新的智能化解決方案,借助大模型能力實現(xiàn)服務能力的升級。
在本次大會上,京東物流發(fā)布了一站式數(shù)智化供應鏈數(shù)據(jù)管理平臺京慧3.0,在大模型的加持下,其銷量預測、庫存、供應及補貨計劃方面更具表現(xiàn)力,其交互式供應鏈控制塔能夠幫助用戶快速定位并解決供應鏈問題,實現(xiàn)降本增效。
過去人工智能的發(fā)展歷程,曾經(jīng)數(shù)次達到應用爆發(fā)的邊緣,但很多都沒有創(chuàng)造出很大的價值,技術沒有在產(chǎn)業(yè)端形成扎實的應用是重要的原因之一。作為新型實體企業(yè),京東一直根植并服務于實體經(jīng)濟,在大模型的產(chǎn)業(yè)應用過程中更是憑借扎實的產(chǎn)業(yè)積累,勾畫了一條以實助實的產(chǎn)業(yè)價值創(chuàng)造路徑。
在大會現(xiàn)場,京東宣布攜手零售和金融行業(yè)伙伴,在零售場景探索供應鏈優(yōu)化、顧客體驗、營銷降本增效等方面,在金融場景探索金融客服、智能投顧、產(chǎn)品營銷等方面,共建零售和金融行業(yè)的大模型創(chuàng)新應用。
正如許冉所說:“京東發(fā)展大模型的旅程,注定會與產(chǎn)業(yè)伙伴攜手同行。京東會與產(chǎn)業(yè)伙伴緊密合作,通過技術創(chuàng)新持續(xù)為產(chǎn)業(yè)高質(zhì)量發(fā)展貢獻力量。
聯(lián)系客服