前言:
談及無人車硬件,通常大家直接看到的是安裝在車身周邊的傳感器,特別是曾經(jīng)Velodyne 64 “全家桶”一度是L4無人駕駛開發(fā)車的標(biāo)識。雖然無人駕駛車載計算平臺藏于車身內(nèi),各家L4無人駕駛方案也很少公開提及,但它擔(dān)任了幾乎全部的數(shù)據(jù)處理和算法執(zhí)行任務(wù),同時也是整體PonyAlpha X硬件系統(tǒng)的中央計算單元,我們有著一些獨(dú)特的思考。
目前計算硬件行業(yè)內(nèi)通常用TOPS來衡量計算能力,但有一種趨勢認(rèn)為越高的TOPS越能滿足L4計算的需要,甚至有一些方案聲稱達(dá)到某個TOPS數(shù)據(jù)就可以實(shí)現(xiàn)L4自動駕駛。我們認(rèn)為,TOPS更像是計算硬件提供商對于L4計算需求的強(qiáng)行歸納,但實(shí)際上L4的整體系統(tǒng)能力,絕不僅僅是TOPS,而更多的是針對不同傳感器和算法對于時延、數(shù)據(jù)吞吐量、計算效率(perf/watt)、計算確定性、準(zhǔn)確度、系統(tǒng)穩(wěn)定性等等的整體軟硬件共同優(yōu)化。
PonyAlpha X系統(tǒng)開發(fā)中,Pony.ai軟件和硬件團(tuán)隊(duì)共同合作,通過高度定制的異構(gòu)計算系統(tǒng),打造了充分滿足Pony.ai應(yīng)用軟件需求并同時兼顧高性能、高效率和高可靠性的L4無人駕駛中央車載計算平臺。
雖然性能強(qiáng)大的CPU和GPU仍是L4無人駕駛計算的主要處理器,但通過特定的異構(gòu)系統(tǒng),可以大幅降低時延,提高性能、安全性和計算效率。
計算平臺通過引入FPGA,將海量高吞吐的不規(guī)則的傳感器數(shù)據(jù)進(jìn)行預(yù)處理,提供時間同步、標(biāo)定校準(zhǔn)、數(shù)據(jù)壓縮、校驗(yàn)和重打包等功能,使得整體傳感器數(shù)據(jù)流時延提升6倍,CPU/GPU占用率降低20%。同時FPGA提供了硬件抽象層的作用,使得傳感器的升級更新不影響整體系統(tǒng)功能。
安全性一直是高性能無人駕駛硬件的關(guān)鍵,通過引入車規(guī)級別MCU作為安全島,全面監(jiān)控計算平臺健康狀態(tài),實(shí)時進(jìn)行故障檢測并輸出錯誤碼,以此觸發(fā)失效安全系統(tǒng)。
異構(gòu)計算通常會面臨芯片間通信的額外代價,計算平臺通過使用業(yè)界最先進(jìn)的IO通信協(xié)議,芯片間數(shù)據(jù)交換帶寬提升了三倍,使得多芯片并行計算成為可能
異構(gòu)計算的魅力在于,通過合理安排不同的計算任務(wù)到最適合的計算芯片,整體系統(tǒng)的計算效率得以大幅提升。計算平臺經(jīng)過軟硬件優(yōu)化,最終平均功耗僅為同等數(shù)據(jù)中心服務(wù)器的1/3,節(jié)省了能源的同時散熱壓力和可靠性也大幅改善。
在汽車電子產(chǎn)品中,更高的性能和更大的功耗通常會使可靠性下降。Pony.ai 中央車載計算平臺的工程魅力就在于尋找性能和可靠性的平衡。
為了實(shí)現(xiàn)硬件和軟件的開發(fā)解耦,計算平臺對于性能的設(shè)計理念是不光滿足現(xiàn)有開發(fā)需求,還要超前設(shè)計以支持未來3年的L4無人駕駛軟件開發(fā)。除了上文提到的異構(gòu)計算,我們通過軟件和硬件的共同優(yōu)化,不僅僅關(guān)注芯片和系統(tǒng)的絕對性能,而是尋找與perf/watt的最佳平衡點(diǎn)。下圖即為我們通過多維度權(quán)衡以選擇最高效的計算方案。
我們應(yīng)對汽車級別可靠性的方法,其中之一是留足設(shè)計余量,無論是信號/電源完整性,還是震動溫度等環(huán)境因素,唯有足夠大的設(shè)計緩沖才能在汽車惡劣環(huán)境下保持可靠。例如我們設(shè)計了比正常運(yùn)行功耗大4倍的供電系統(tǒng),以保證任何功耗峰值都不會引起系統(tǒng)失效。
另外一個可靠性的思路是為高性能計算系統(tǒng)盡可能提供舒適的工作區(qū)域。例如即使汽車電子需要工作在-40C - 105C的環(huán)境溫度,但我們通過精密的液體加熱散熱設(shè)計,使得即便是消費(fèi)級的芯片也可以在汽車環(huán)境中可靠的運(yùn)行。又例如通過合理的緩沖設(shè)計,使原本脆弱的器件可以在25g的沖擊下不受損傷。
最后,通過等效冗余和降級冗余,以及實(shí)時的健康監(jiān)控系統(tǒng),即使系統(tǒng)模塊出現(xiàn)故障,比如冗余電源輸入其中一路失效,系統(tǒng)仍可以正?;蚪导夁\(yùn)行。
按照經(jīng)典的硬件開發(fā)V模型,在設(shè)計實(shí)施之后,我們進(jìn)行了多個維度的系統(tǒng)驗(yàn)證。
首先,在信號層面,關(guān)鍵信號的電源都在不同溫度電壓條件下按照工業(yè)標(biāo)準(zhǔn)進(jìn)行了測量,以驗(yàn)證信號余量與設(shè)計相符。
其次,按照Pony.ai定義的DVT測試標(biāo)準(zhǔn),進(jìn)行了環(huán)境和壓力測試,保證溫度、震動、濕度等等各種工況下系統(tǒng)正常運(yùn)行,并在掉電、短路、碰撞等條件下系統(tǒng)不受損壞。
之后,在系統(tǒng)級別,我們開發(fā)了HIL仿真平臺,使得計算平臺系統(tǒng)可以在線下7x24小時不間斷驗(yàn)證,以達(dá)到統(tǒng)計意義上的大于100,000小時MTBF。
最后,我們進(jìn)行了大量的實(shí)際路測,以保證和整體L4無人駕駛硬件系統(tǒng)集成可靠。
Pony.ai 中央車載計算平臺不僅僅是一個前沿的預(yù)研項(xiàng)目,而是目標(biāo)支持L4無人駕駛硬件的量產(chǎn):
每一個設(shè)計細(xì)節(jié)都充分考慮DFM和DFA,使得批量加工和組裝成為可能,并保證量產(chǎn)級別的成品率;
計算平臺非常容易部署和維護(hù),整體設(shè)計即插即用,模塊化設(shè)計易保養(yǎng)維護(hù);最后,計算平臺有清晰的車規(guī)路線圖,在2023年即可實(shí)現(xiàn)車規(guī)級L4計算平臺。
聯(lián)系客服