隨著自動(dòng)駕駛作為汽車行業(yè)發(fā)展趨勢以及相關(guān)芯片引起高度重視,一下子異構(gòu)計(jì)算芯片成為了行業(yè)熱點(diǎn)。很多朋友對(duì)什么是異構(gòu)計(jì)算芯片很感興趣,跟著小星詳細(xì)了解一下異構(gòu)計(jì)算的技術(shù)細(xì)節(jié)、未來趨勢和在汽車自動(dòng)駕駛中的應(yīng)用吧。
什么是異構(gòu)計(jì)算
↑異構(gòu)計(jì)算架構(gòu)靈活性和效率
異構(gòu)計(jì)算“Heterogeneous Computing”是一種特殊的并行分布式計(jì)算系統(tǒng)。它能夠經(jīng)濟(jì)有效地實(shí)現(xiàn)高計(jì)算能力,可擴(kuò)展性強(qiáng),能夠非常高效地利用計(jì)算資源。與之相對(duì)的概念就是同構(gòu)計(jì)算“Homogeneous Computing”,也就是為大家熟知的多核理念。為了突破計(jì)算算力受制于功耗的瓶頸,多核CPU技術(shù)得到越來越多的應(yīng)用。強(qiáng)大的CPU采用越來越多的CPU內(nèi)核這就是傳統(tǒng)同構(gòu)計(jì)算系統(tǒng)。很快人們就發(fā)現(xiàn)在AI人工智能和自動(dòng)駕駛爆炸式增長的計(jì)算需求下,傳統(tǒng)同構(gòu)計(jì)算系統(tǒng)已經(jīng)無法滿足要求,GPU、DSP、FPGA和ASIC由于特定需求下高效性越來越多的被應(yīng)用。而異構(gòu)計(jì)算技術(shù)應(yīng)運(yùn)而生,像一個(gè)大廚將CPU、GPU、DSP、FPGA和ASIC這些優(yōu)良食材制成一道融合各方口味特點(diǎn)的佳肴。
↑自動(dòng)駕駛的異構(gòu)計(jì)算系統(tǒng)需求
比如自動(dòng)駕駛中的攝像頭視覺圖像處理的計(jì)算需求為例,它分為圖像獲取、特征抽取、特征處理、模式識(shí)別和動(dòng)作反饋等步驟。其中對(duì)大量圖像數(shù)據(jù)的高速并行實(shí)時(shí)處理比如像素處理、圖像金字塔和梯度檢測等需要GPU和ISP圖像信號(hào)處理器這樣專用內(nèi)核來高速計(jì)算。而DSP和專用加速器則偏向卷積或傅里葉等數(shù)學(xué)計(jì)算加速,CPU更傾向通用計(jì)算和復(fù)雜動(dòng)作反饋決策。依托異構(gòu)計(jì)算技術(shù)能夠整合這些不同架構(gòu)的內(nèi)核到單一芯片中從而適配自動(dòng)駕駛的復(fù)雜計(jì)算要求。
其實(shí)現(xiàn)在的AI芯片越來越像人腦,而人腦本身就是典型的異構(gòu)架構(gòu)。左腦負(fù)責(zé)語言和邏輯,右腦負(fù)責(zé)情感和創(chuàng)造,小腦負(fù)責(zé)運(yùn)動(dòng)和應(yīng)激反應(yīng),各有分工且都不可或缺。
異構(gòu)計(jì)算芯片典型案例
↑異構(gòu)計(jì)算芯片蘋果M1
那么到底什么樣的芯片是典型的異構(gòu)計(jì)算芯片呢?
讓我們來舉個(gè)例子。蘋果最新款的Mac Book Air采用了自研芯片蘋果M1替代傳統(tǒng)的CPU、DDR4內(nèi)存、IO接口芯片、蘋果T2加密芯片和雷電Thunderbolt接口控制芯片的諸多功能。蘋果M1集成了8個(gè)CPU內(nèi)核、8個(gè)GPU核心和16個(gè)神經(jīng)網(wǎng)絡(luò)加速引擎。并且這些不同架構(gòu)的內(nèi)核可以通過標(biāo)準(zhǔn)內(nèi)存訪問架構(gòu)UMA進(jìn)行高速數(shù)據(jù)共享。是異構(gòu)計(jì)算技術(shù)使得如此多不同類型的計(jì)算核心可以高效協(xié)同。蘋果M1以優(yōu)異的性能功耗比開創(chuàng)了自研異構(gòu)計(jì)算芯片在筆記本電腦市場商用的先河。
異構(gòu)計(jì)算在自動(dòng)駕駛中的迭代
↑攝像頭采集圖像進(jìn)行分層學(xué)習(xí)
特斯拉等車廠率先實(shí)施人工智能的駕駛輔助系統(tǒng)。其中人工智能的核心技術(shù)為深度學(xué)習(xí)Deep Neural Networks (DNN)。通過對(duì)攝像頭采集圖像進(jìn)行分層學(xué)習(xí),從圖像中可以抽取相應(yīng)的目標(biāo)位置,路線規(guī)劃。從而通過深度學(xué)習(xí),規(guī)劃出的路徑不再完全依靠車道線,而是基于對(duì)于前方目標(biāo)辨認(rèn)標(biāo)識(shí)出的安全空間。
↑奧迪自動(dòng)駕駛控制器zFAS
而自動(dòng)駕駛控制器當(dāng)中的計(jì)算平臺(tái)為了實(shí)現(xiàn)人工智能的需求,實(shí)際上有一個(gè)迭代演進(jìn)的過程。我們以率先量產(chǎn)L3自動(dòng)駕駛的奧迪A8L為例。其自動(dòng)駕駛的核心自動(dòng)駕駛控制器zFAS采用了大量不同架構(gòu)的計(jì)算芯片實(shí)現(xiàn)1個(gè)激光雷達(dá)、5個(gè)毫米波雷達(dá)和3個(gè)攝像頭的信號(hào)處理和決策。等效算力在2TOPS左右。其核心處理器包括
-Tegra K1 來自 NVIDIA,用于人工智能機(jī)器學(xué)習(xí)
-Aurix 來自 Infineon,用于提供符合功能安全和信息安全的駕駛輔助管理
-Cyclon V 來自 Altera,用于基于FPGA技術(shù)高速處理信號(hào)融合
-EyeQ3來自Mobileye,,用于進(jìn)行視覺信號(hào)處理
↑特斯拉Autopilot2.0域控制器CCM中央計(jì)算模塊
特斯拉演進(jìn)至Autopilot2.0則將駕駛輔助的控制都合并到了CCM中央計(jì)算模塊當(dāng)中。CCM就像車載的強(qiáng)力大腦,它高速處理1個(gè)毫米波雷達(dá)和8個(gè)攝像頭信號(hào),算力提升至10TOPS。但它仍采用分立的SOC和GPU架構(gòu),包含如下組成部件:
-Parker SOC + Pascal GPU 來自 NVIDIA,用于人工智能機(jī)器學(xué)習(xí)
-Aurix 來自 Infineon,用于提供符合功能安全和信息安全的駕駛輔助管理
-Ethernet Switch 來自 Marvel,用于基于以太網(wǎng)技術(shù)的高速信號(hào)交互
↑特斯拉Autopilot3.0域控制器采用自研異構(gòu)芯片FSD
而迭代至Autopilot3.0可以說是自動(dòng)駕駛中央計(jì)算模塊的分水嶺和里程碑。因?yàn)椴捎米匝挟悩?gòu)芯片FSD,使得芯片內(nèi)部集成了3個(gè)四ARM A72 CPU核心加GPU和2組神經(jīng)網(wǎng)絡(luò)處理單元NPU。它能更高速且低能耗地處理1個(gè)毫米波雷達(dá)和8個(gè)攝像頭信號(hào),系統(tǒng)算力大幅提升至144TOPS。這其中異構(gòu)計(jì)算架構(gòu)功不可沒。
↑英偉達(dá)自動(dòng)駕駛異構(gòu)芯片
作為通用圖形處理單元GPU領(lǐng)軍者英偉達(dá)NVIDIA很快意識(shí)到了深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)DNN在自動(dòng)駕駛中的崛起和應(yīng)用挑戰(zhàn)。從而基于異構(gòu)計(jì)算架構(gòu)推出了一系列定制的SOC芯片。比如小鵬P7采用的Xavier芯片算力為30TOPS,它具有強(qiáng)大的八核ARM64處理核心和512核Volta GPU,并且能夠達(dá)到汽車安全所需要功能安全ASIL-D(最高等級(jí))的級(jí)別。相對(duì)整車級(jí)別優(yōu)化了功耗性能比。而即將量產(chǎn)的蔚來ET7配備了ADAM超算平臺(tái),算力達(dá)到1016TOPS。ADAM超算平臺(tái)采用了4組英偉達(dá)最新的Orin自動(dòng)駕駛異構(gòu)計(jì)算技術(shù)SOC芯片。每組Orin芯片集成了12個(gè)ARM A76 CPU核心和算力在200TOPS左右的GPU內(nèi)核。
↑英偉達(dá)異構(gòu)計(jì)算軟件架構(gòu)CUDA
有了優(yōu)秀的異構(gòu)計(jì)算架構(gòu)組成的芯片,還需要能夠高效協(xié)調(diào)異構(gòu)芯片中不同類型計(jì)算核心的軟件架構(gòu)才能讓自動(dòng)駕駛?cè)缁⑻硪?。為此英偉達(dá)開發(fā)了專用的異構(gòu)計(jì)算軟件架構(gòu)CUDA,而其他廠商則抱團(tuán)組成異構(gòu)計(jì)算軟件聯(lián)盟并推出了相應(yīng)的OPENCL軟件架構(gòu)。有了高效的軟件平臺(tái),廣大的開發(fā)者能夠快速的將人工智能算法適配到相應(yīng)的硬件計(jì)算資源,這是異構(gòu)技術(shù)技術(shù)在自動(dòng)駕駛領(lǐng)域高速發(fā)展的關(guān)鍵。
綜上所述,依托異構(gòu)計(jì)算技術(shù)能夠整合CPU、GPU、DSP、FPGA和ASIC不同架構(gòu)的內(nèi)核到單一芯片中從而適配自動(dòng)駕駛的復(fù)雜計(jì)算要求。而自動(dòng)駕駛也經(jīng)歷了從復(fù)雜分立到高度集成異構(gòu)計(jì)算芯片方案的演進(jìn)。基于異構(gòu)計(jì)算技術(shù)不僅系統(tǒng)算力更強(qiáng),而且定制的軟件架構(gòu)能夠加速自動(dòng)駕駛算法快速高效的適配。希望今天小星的介紹能讓大家對(duì)異構(gòu)計(jì)算相關(guān)技術(shù)細(xì)節(jié)有個(gè)深入的了解。
聯(lián)系客服