雷鋒網(wǎng)將聯(lián)合英偉達(dá) DLI ,面向 AI 技術(shù)從業(yè)者,特別推出深度學(xué)習(xí)課程,對(duì)深度學(xué)習(xí)和英偉達(dá) GPU 加速技術(shù)感興趣的朋友可以參閱文末介紹!
編者按:北京時(shí)間 5 月 11 日 00:00,萬(wàn)眾矚目的英偉達(dá) CEO 黃仁勛 Keynote 演講,在加州圣何塞舉行。全場(chǎng)長(zhǎng)達(dá)兩個(gè)多小時(shí),本場(chǎng)主題演講的話(huà)題涉獵面其實(shí)很廣: VR、Volta、超算、GPU 云服務(wù)、自動(dòng)駕駛芯片、以及機(jī)器人訓(xùn)練。英偉達(dá)也恰恰在 GTC 舉辦的同時(shí),公布了 2017 年第一季度的財(cái)報(bào)。財(cái)務(wù)數(shù)據(jù)顯示,NVIDIA 在 2017 第一季度營(yíng)收同比增長(zhǎng) 48%,達(dá)到 19.4 億美元??磥?lái),英偉達(dá)已經(jīng)如同老黃所說(shuō),已完全轉(zhuǎn)型成為領(lǐng)先的 AI 企業(yè)。
今年的 NVIDIA GTC 開(kāi)發(fā)者大會(huì),與往年頗有些不同。
北京時(shí)間 5 月 11 日 00:00,萬(wàn)眾矚目的英偉達(dá) CEO 黃仁勛 Keynote 演講,在加州圣何塞舉行。全場(chǎng)長(zhǎng)達(dá)兩個(gè)多小時(shí),雷鋒網(wǎng)記者在媒體中第一位入場(chǎng),坐在了前排中央。然而,整場(chǎng)演講下來(lái),老黃并沒(méi)有一句提到游戲。
本場(chǎng)主題演講的話(huà)題涉獵面其實(shí)很廣: VR、Volta、超算、GPU 云服務(wù)、自動(dòng)駕駛芯片、以及機(jī)器人訓(xùn)練。但是,所有這些話(huà)題都有一個(gè)共同點(diǎn):要么基于 AI、深度學(xué)習(xí)技術(shù)、要么為 AI、深度學(xué)習(xí)技術(shù)服務(wù)。
英偉達(dá)也恰恰在 GTC 舉辦的同時(shí),公布了 2017 年第一季度的財(cái)報(bào)。財(cái)務(wù)數(shù)據(jù)顯示,NVIDIA 在 2017 第一季度營(yíng)收同比增長(zhǎng) 48%,達(dá)到 19.4 億美元。在過(guò)去一年里,NVIDIA 致力于深度學(xué)習(xí)的計(jì)算系統(tǒng)解決方案極大推動(dòng)了語(yǔ)音識(shí)別、機(jī)器視覺(jué)、虛擬助手、自動(dòng)駕駛等領(lǐng)域的發(fā)展,而其在各行各業(yè)的核心開(kāi)發(fā)者也成為這家 “核彈公司” 源源不斷的增長(zhǎng)動(dòng)力。
發(fā)布五大革命性產(chǎn)品
看來(lái),英偉達(dá)已經(jīng)如同老黃所說(shuō),已完全轉(zhuǎn)型成為領(lǐng)先的 AI 企業(yè)。本屆 GTC 的主題,便是 AI & 深度學(xué)習(xí)。當(dāng)然,還有劃時(shí)代的深度學(xué)習(xí)硬件 Volta。下面,便是本屆 GTC 英偉達(dá)發(fā)布的五大革命性產(chǎn)品:Project Holodeck、Volta、英偉達(dá) GPU 云、Xavier DLA,以及 Isaac 機(jī)器人模擬機(jī)。
Project Holodeck
Project Holodeck 是老黃發(fā)布的第一個(gè)產(chǎn)品,堪稱(chēng)是本屆 GTC 的開(kāi)胃菜。它將 VR 和 AI 的頂尖技術(shù)相結(jié)合,所構(gòu)建的 VR 社交、工作空間。它有三大特點(diǎn):
照片級(jí)逼真的視覺(jué)
物理交互
協(xié)作
其中最大的亮點(diǎn),無(wú)疑是物理交互體驗(yàn)。老黃表示,虛擬共享空間必須要遵從物理定律,否則就無(wú)從營(yíng)造真實(shí)世界般的沉浸感。相比之下,同屬 VR 社交空間應(yīng)用的 Facebook Spaces,并沒(méi)有這么強(qiáng)調(diào)物理屬性。
英偉達(dá)與頂級(jí)跑車(chē)制造商科尼塞克合作,請(qǐng)科尼塞克創(chuàng)始人 Christian Koenigsegg 甚至利用 VR 化身(上圖中的虛擬人)“現(xiàn)身” 說(shuō)法。
演示中,有兩個(gè)細(xì)節(jié)值得我們注意:
當(dāng) VR 化身觸摸方向盤(pán)時(shí),其 “手掌” 并不會(huì)像網(wǎng)游那樣穿過(guò)方向盤(pán),而是能實(shí)實(shí)在在地握住它。雷鋒網(wǎng)獲知,用戶(hù)還能在 Project Holodeck 里舉起東西。這充分展示了 “物理交互”。
Project Holodeck 導(dǎo)入了科尼塞克最新車(chē)型(上圖)的全部三維數(shù)據(jù)——不僅僅是外觀(guān),還有內(nèi)飾、零件。隨老黃一聲令下,整部車(chē)分解成一個(gè)個(gè)的獨(dú)立零件;展示了讓 VR “不止于社交” 的可能性。
Project Holodeck 將于 9 月開(kāi)放早鳥(niǎo)體驗(yàn)。
Volta 架構(gòu)
沒(méi)錯(cuò),Volta 終于來(lái)了。繼 Pascal (帕斯卡)之后的新一代 GPU 架構(gòu),在萬(wàn)眾期待下亮相。對(duì)于絕大多數(shù)觀(guān)眾,不論 GTC 推出了多少 AI 工具,都無(wú)法遮掩 Volta 作為本屆大會(huì)心臟的事實(shí)。
畢竟,英偉達(dá)今后二至三年的 GPU 產(chǎn)品線(xiàn),全都要由 Volta 供血。雖然 Volta 架構(gòu)的游戲顯卡最快在今年底才可能與大家見(jiàn)面,但通過(guò)深度學(xué)習(xí)卡,也可一窺 Volta 的滿(mǎn)血性能。那么在本屆 GTC,英偉達(dá)推出了哪些基于 Volta 的產(chǎn)品?
答案是 Tesla V100,以及基于它的深度學(xué)習(xí)計(jì)算機(jī) DGX-1 和 DGX Station。
Tesla V100
“迄今為止英偉達(dá)難度最高、最復(fù)雜的項(xiàng)目;
耗費(fèi)數(shù)千工程師數(shù)年光陰來(lái)完成;
全世界有史以來(lái)最昂貴的計(jì)算機(jī)項(xiàng)目(研發(fā)支出為 30 億美元)。”
說(shuō)的就是 Tesla V100,基于新一代 Volta 架構(gòu)。但英偉達(dá)在它身上實(shí)現(xiàn)的壯舉遠(yuǎn)不止與此:
Tesla V100 的芯片面積是驚人的 815 平方毫米,約等于一塊 Apple Watch,真正達(dá)到光刻技術(shù)的極限。老黃說(shuō):“不可能做出比這再大的 GPU 芯片…… 我把這看做是幾乎‘不可能實(shí)現(xiàn)的’,是制造技術(shù)的一項(xiàng)不可思議的驚人績(jī)業(yè)。”
來(lái)自三星的 16GB HBM2 顯存,帶寬達(dá)到驚人的 900 GB/s。
詳細(xì)規(guī)格見(jiàn)下圖:
相比 Pascal,Volta 有全新的張量運(yùn)算指令,這就是 Tensor Core。
它既是指令也是數(shù)據(jù)格式,是 4*4 的矩陣處理陣列。它使得 Volta 的訓(xùn)練吞吐量達(dá)到了 Pascal 的 12 倍,推理吞吐量達(dá)到 6 倍。借助它,Tesla V100 的張量運(yùn)算能力達(dá)到 120 TFLOPS。
它是 Volta 的高性能神經(jīng)網(wǎng)絡(luò)推理引擎,或者說(shuō)編譯器。目的是為推理運(yùn)算快速地優(yōu)化、驗(yàn)證、部署訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)。
老黃解釋道:” 訓(xùn)練完成之后,用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的框架會(huì)生成圖。圖需要為你使用的處理器進(jìn)行優(yōu)化、編譯。我們把這稱(chēng)為 TensorRT。“
眾所周知,深度學(xué)習(xí)運(yùn)算可被分為訓(xùn)練和推理兩部分。從前, N 卡只關(guān)注訓(xùn)練,而在 Tesla V100 上,英偉達(dá)終于對(duì)推理 “動(dòng)真格”。老黃表示,從 Volta 開(kāi)始,英偉達(dá) GPU 將對(duì)訓(xùn)練、推理兼顧,可謂是革命性的突破。如圖所示,Tesla V100 的推理運(yùn)算速度是 Skylake CPU 的十余倍不止。CPU、FPGA 和 TPU 們怕了么?
這是 Tesla K80、P100 與 V100 三代架構(gòu)的性能對(duì)比。在 Caffe2、Microsoft Cognitive Toolkit(CNTK)、MXnet 三大框架上,V100 取得了數(shù)倍的性能提升。以 Caffe2 為例,訓(xùn)練時(shí)間由 K80 的 40 多小時(shí),縮減到 V100 的不到 10 小時(shí)。
DGX-1V、DGX Station 和 HGX-1
深度學(xué)習(xí)超級(jí)計(jì)算機(jī) DGX-1 也把 GPU 升級(jí)為 Volta,這便是 DGX-1V。
它內(nèi)置八塊 Tesla V100,運(yùn)算能力為驚人的 960 Tensor TFLOPS。老黃表示,過(guò)去 Titan X 需花費(fèi)八天訓(xùn)練的神經(jīng)網(wǎng)絡(luò),用 DGX-1V 只需八個(gè)小時(shí)。它相當(dāng)于是 “把 400 個(gè)服務(wù)器裝進(jìn)一個(gè)盒子里”。
售價(jià) 149000 美元,即日起接受預(yù)定,第三季度出貨。
DGX Station 則是縮小版的 DGX-1V,老黃稱(chēng)其為 “Personal DGX”,堪稱(chēng)是終極深度學(xué)習(xí) PC。英偉達(dá)內(nèi)部已經(jīng)使用很久,每個(gè)工程師要么有 DGX-1V,要么有 DGX Station,再要么兩個(gè)都有。這次,老黃決心把它推向市場(chǎng)。
它內(nèi)置四塊 Tesla V100,運(yùn)算力因而是 DGX-1V 的一半。1500W 功耗,使用水冷。售價(jià) 69000 美刀。
另外一個(gè)基于 Tesla V100 的新硬件產(chǎn)品是 HGX-1。這是英偉達(dá)與微軟合作開(kāi)發(fā)的公有云服務(wù)器。老黃聲稱(chēng),這是業(yè)內(nèi)首個(gè)堪稱(chēng)標(biāo)桿的云圖形加速器。它內(nèi)置八塊 Tesla V100,設(shè)計(jì)時(shí)就考慮了公有云服務(wù)器必需的多種任務(wù)處理與全能性。
英偉達(dá) GPU 云
“這是世界上首個(gè)混合深度學(xué)習(xí)云平臺(tái)”,老黃說(shuō)。
每一名深度學(xué)習(xí)工程師大概都深有體會(huì):在一臺(tái)設(shè)備上創(chuàng)建、設(shè)置開(kāi)發(fā)環(huán)境并不是一件省心的事。這花費(fèi)的時(shí)間可能是整整一天,可能是一個(gè)星期、一個(gè)月,也可能灰心喪氣干脆放棄。
為解決這一開(kāi)發(fā)者的痛點(diǎn),英偉達(dá)推出了 GPU 云。它的亮點(diǎn)非常直接——在幾分鐘內(nèi)設(shè)置好本地開(kāi)發(fā)環(huán)境。而這,只需要打包下載一整套英偉達(dá)優(yōu)化、整合好的深度學(xué)習(xí)軟件包。開(kāi)發(fā)者所有需要的庫(kù)和框架都包含在內(nèi),并且用容器 NVDocker 隔離。
它支持全部深度學(xué)習(xí)開(kāi)發(fā)框架。當(dāng)然,為利用云端成白上千 GPU 的強(qiáng)大計(jì)算力,開(kāi)發(fā)者可一鍵在英偉達(dá) GPU 云設(shè)立開(kāi)發(fā)環(huán)境,上傳工作進(jìn)度。
英偉達(dá) GPU 云 將在七月公測(cè)。
開(kāi)源 Xavier DLA
Xavier 是英偉達(dá)的自動(dòng)駕駛 AI 處理器。它的創(chuàng)新之處在于,整合了 CPU、GPU 以及 DLA 三大處理器的優(yōu)點(diǎn):
雷鋒網(wǎng)注:DLA 即深度學(xué)習(xí)加速器,前段時(shí)間很火的谷歌 TPU,便是 DLA。
Xavier 同時(shí)具備 CPU 的單線(xiàn)程性能,CUDA 的并行加速能力,以及 DLA 的計(jì)算機(jī)視覺(jué)特殊功能。
老黃宣布,為加速深度學(xué)習(xí)技術(shù)的普及和進(jìn)步,將開(kāi)源 Xavier DLA 供所有開(kāi)發(fā)者使用、修改。初期版本將在 7 月開(kāi)放,完整版本將于 9 月公開(kāi)。
Isaac 機(jī)器人模擬機(jī)
Isaac (艾薩克)這個(gè)名字,來(lái)自于兩個(gè)人:一是象征物理學(xué)的艾薩克 · 牛頓,二是象征 AI 的艾薩克 · 阿西莫夫。這是英偉達(dá)傾力打造的終極機(jī)器人 AI 虛擬訓(xùn)練環(huán)境。
在真實(shí)世界人為訓(xùn)練機(jī)器人有先天的局限性:人力成本過(guò)高,風(fēng)險(xiǎn)大,耗時(shí)長(zhǎng),效率極低。解決的方案,便是在虛擬環(huán)境進(jìn)行機(jī)器人訓(xùn)練。這有點(diǎn)類(lèi)似于訓(xùn)練智能體的模擬器 Deepmind Lab 和 OpenAI Gym。事實(shí)上,Isaac 直接連通 OpenAI Gym,借助后者的強(qiáng)化學(xué)習(xí)功能。
充分利用了英偉達(dá)在物理引擎上的造詣,老黃表示,Isaac 的目標(biāo)是打造一個(gè)遵從物理定律的 “alternate universe”(替代空間)。虛擬訓(xùn)練空間將完全遵從現(xiàn)實(shí)世界的物理定律,除了時(shí)間。理想的情況是,在模擬機(jī)中學(xué)習(xí)過(guò)的機(jī)器人,就相當(dāng)于已經(jīng)預(yù)訓(xùn)練過(guò)。
而在時(shí)間上,機(jī)器人 AI 將以多重 “分身” 在 Isaac 中進(jìn)行訓(xùn)練,每輪訓(xùn)練中最聰明的那一個(gè),將進(jìn)入下一輪分配給每個(gè)智能體;再?gòu)闹羞x出表現(xiàn)最好的那一個(gè)進(jìn)入下一輪,取代上一輪的所有智能體……
如此往復(fù),以訓(xùn)練出最聰明的機(jī)器人 AI。
后摩爾定律時(shí)代的新出路
與 GTC 第一天的內(nèi)容集中在圖像處理不同,在兩個(gè)小時(shí)的演講中里,只有在開(kāi)場(chǎng)不久列舉深度學(xué)習(xí)對(duì)圖像處理效果的改善以及中途演示《最終幻想》兩處與圖像處理有關(guān),其他的時(shí)間中,老黃大談特談的是 AI,是深度學(xué)習(xí),是計(jì)算能力,是數(shù)據(jù)中心,是為開(kāi)發(fā)者提供更有效的硬件與平臺(tái)。
在 2016 年,得益于人工智能紅利,英偉達(dá)股價(jià)累計(jì)漲幅接近 200%,成為標(biāo)普 500 指數(shù)漲幅第一名。而在這次 GTC 大會(huì)上,老黃的演講再一次贏得了資本市場(chǎng)——在演講中,英偉達(dá)的股價(jià)一直上升,到收盤(pán)時(shí)漲幅為 17.83%,市值達(dá)到了 720 億美元。
如同黃仁勛開(kāi)場(chǎng)所言:我們需要找到摩爾定律之后的路。在摩爾定律實(shí)效、微處理器增速降低到每年 10% 的今天,GPU 計(jì)算的崛起已經(jīng)在引領(lǐng)著人工智能的革命。有這樣一組數(shù)據(jù)可以佐證:在過(guò)去 5 年中,GTC 參會(huì)者增加了 3 倍,增長(zhǎng)到 7000 人;GPU 開(kāi)發(fā)者增長(zhǎng) 11 倍,增長(zhǎng)到超過(guò) 50 萬(wàn)人...... 而這一切對(duì)于英偉達(dá)來(lái)說(shuō)只是一個(gè)時(shí)代的開(kāi)始。
聯(lián)系客服