30秒快讀
1 | 英特爾、臺積電一喜一憂,國產AI芯片第一股寒武紀登陸A股科創(chuàng)板,當天大漲229.9%,風云變幻的芯片圈,隱藏著什么變局? |
2 | 從CPU、GPU到xPU,下一代AI芯片的主流框架會是什么?中國AI芯片企業(yè)是做專用芯片還是通用芯片,是橫在創(chuàng)業(yè)者面前的一道難題。 |
3 | 誰是下一個AI芯片之王?中國會出現(xiàn)像英偉達一樣的企業(yè)嗎? |
一份布滿愁云的財報,暗示著芯片廠商們的又一場戰(zhàn)事拉開序幕。
7月24日,英特爾在今年2季報中宣布,因7nm芯片工藝存在缺陷,進展落后與原計劃的6個月,同時量產日期也被推遲了近一年。
當天,英特爾收盤暴跌16.24%。
另有媒體報道,英特爾已將2021年6nm芯片代工訂單交于臺積電,后者還有望獲得5nm、3nmCPU芯片的代工。
受該利好消息刺激,7月27日臺積電創(chuàng)下83.4美元/股的歷史新高。截至7月29日收盤,臺積電的市值高達4289億美元,是當天英特爾收盤市值的兩倍多。
臺積電和英特爾市值對比,圖源:東方財富網
一憂一喜間,暗示著英特爾自銷自產的時代落幕。曾經的CPU芯片巨頭如今陷入頹靡。但江湖中,后浪們正在奮起追逐。
7月20日,國產AI芯片第一股寒武紀登陸A股科創(chuàng)板,當天大漲229.9%。
7月17日,寒武紀發(fā)布科創(chuàng)板上市公告,圖源:寒武紀
當人工智能進入越來越多人的生活,這片江湖爭奪或許會聚焦于AI芯片上。
根據Gartner預測,全球AI芯片的市場規(guī)模將有望從2018年的42.7億美元上升到2023年的323億美元,2019-2023年平均增速約為50%。
如果說,英特爾和英偉達象征著CPU、GPU芯片的榮光,那么在AI芯片賽道中,誰會是下一個霸主?
01
從CPU、GPU到xPU
深度學習是目前AI的神經網絡主流算法,需要處理大量非結構化數據和“蠻算”。這對芯片的多核并行運算、片上存儲、帶寬、低延時訪存等提出了較高需求。
事實上,CPU芯片可以用于AI運算,適用于邏輯復雜的串行計算。由于CPU中有晶體管用于構建控制電路和高速緩沖存儲器,縮減了計算單元的空間,也在一定程度上限制了算力。
CPU集成電路上有數以萬計的晶體管,圖源:英特爾
目前深度學習下的圖像識別、語音識別的計算主要涉及矩陣向量乘法、加法,計算邏輯也不復雜,主要靠數據大量多次計算,因此相比串行運算的CPU,具有并行運算能力的GPU芯片性能更高,更適合深度學習。
CPU和GPU架構對比,圖源:OmniSci
這是為什么GPU一哥英偉達能在AI芯片市場占有一席之地。據廣證恒生研報數據,英偉達在數據中心GPU市場占有率超過80%。2019年度,英偉達數據中心業(yè)務收入占比增長至接近三成。
除了CPU、GPU外,ASIC被認為是下一代AI芯片主流架構。針對特定任務專門設計框架,ASIC芯片能在快速提升算力的同時降低能耗。
ASIC專用集成芯片架構,為特定應用需要而設計制造的集成電路,圖源:AnySilicon
谷歌的TPU(張量處理單元)便是其中之一。谷歌定義了十幾個為神經網絡計算而設計的高級指令,采用單線程控制,避免緩存、多道處理等問題,提高了深度學習運算效率。不過,和所有ASIC芯片一樣,TPU是一款非通用芯片。
谷歌TPU芯片,圖源:Google Cloud
在眾多xPU芯片中,Graphcore推出的IPU(智能處理單元)是一款激進產品。
這款專為AI訓練、推理任務設計的新型處理器,運用大規(guī)模并行同構眾核架構。
Graphcore推出的IPU(智能處理單元)芯片,圖源:Graphcore
加州大學圣芭芭拉分校教授謝源曾表示,在運算過程中,把數據從內存搬到處理單元所需能量占比非常大,而數據搬運效率不會因摩爾定律發(fā)展而提高。
IPU采用的是大規(guī)模分布式片上SRAM(靜態(tài)隨機存取儲存器),數據不儲存在片外,意味著運算過程中可以直接調動,節(jié)省能耗和時延。不過,一旦供電不足,會導致部分數據缺失。為此,IPU相應減少了用于機器學習運算單元面積。
IPU芯片內部結構,圖源:Graphcore
日前,Graphcore已發(fā)布第二代IPU GC200,晶體管數量高達594億個,內部有1472個獨立的處理器內核,能夠執(zhí)行8832個獨立的并行線程,均由900MB的RAM支持。
裝有4個IPU GC200芯片的機器,每一枚芯片內有高達594億個晶體管,圖源:Graphcore
此外,IPU GC200芯片另一亮點為能適用于稀疏樣本數據的深度學習。
新的架構有的方法是為每個處理核心配備了專用存儲單元,能更有效分散和搜集信息,避免部分數據被過濾。
Graphcore曾被多家媒體對標為下一家英偉達。
介紹這款特立獨行的產品時,高級副總裁兼中國區(qū)總經理盧濤表示,“IPU不是GPU,但現(xiàn)在很多芯片公司做的其實還是GPU,在某些領域,未來一段時間里,IPU可能會和GPU呈現(xiàn)競爭膠著狀態(tài),“這是最大的挑戰(zhàn),也是最大的機會?!?/p>
02
垂直領域突圍戰(zhàn)
對于不少中國AI芯片企業(yè)而言,選擇做專用芯片還是通用芯片,是一道難題。
億歐科創(chuàng)事業(yè)部商業(yè)分析師張繼文直言,目前行業(yè)中還沒有誕生一款真正意義上的AI通用芯片,因為不同場景下,對芯片算力有不同要求。
比如,安防領域對圖像處理要求比較高,智能家居對語音處理要求很高,而自動駕駛需要多模態(tài)處理。
“現(xiàn)階段設計者仍在具體場景下摸索,建議做垂直領域的芯片?!彼硎?。
如果你是一個不走心的芯片設計師,做出芯片并不難。如果不愿意付ARM框架授權費用,可以選開源的Risk-V框架,去除無用功能后,從GitHub下載代碼,交由芯片廠家做模型轉換。
圖源:GitHub
但在中科院自動化研究所研究員王金橋看來,這樣的算法無法保證算法的精度。
設計芯片時,設計師需要對網絡規(guī)模、參數、效果等選項不斷調整,提高芯片的適配能力。如果芯片已經固定了支持的網絡結構,之后要想更換,只會前功盡棄。
根據億歐智庫數據,ASIC芯片的開發(fā)費用高達800-2500萬美元以上,開發(fā)周期長達1-3年。這是耗費的資本。
這便是專注于ASIC芯片研發(fā),寒武紀的困頓。在招股書上,寒武紀預計今年凈利潤虧損4億元至6.5億元。尋求資本市場融資,是這次寒武紀上市的緣由。
寒武紀近幾年財務狀況,圖源:寒武紀招股書
據悉,寒武紀計劃分別以IPO募集資金7億元、6億元、6億元和9億元用于投資云端訓練芯片及系統(tǒng)、新一代云端推理芯片及系統(tǒng)、新一代邊緣端人工智能芯片及系統(tǒng)和補充流動資金。
圖源:寒武紀招股書
比資本更重要的,還有人才。王金橋感慨AI芯片領域設計人才稀缺。在成為芯片設計師前,需要至少3-5年的工作經驗。
行業(yè)一流的設計師,起碼要在生產線上跟過10年,以防流片失敗。
芯片生產過程中,流片是從設計走向量產的關鍵一步,這需要按照圖紙在晶圓上進行蝕刻、制定晶圓尺寸,工藝復雜,整個過程有40多道工序,每一步細小失誤的累積,便會功虧一簣。
此前小米澎湃S2流片失敗5次,被報道稱燒掉十多億元。這是流片背后的痛。
網上關于小米澎湃S2流片失敗5次燒掉幾十億的傳聞,圖源:網絡
目前AI領域稀缺的是設計,懂算法的,不懂硬件,反之亦然,這需要建立好生態(tài),改變高校課程結構。
王金橋表示看好寒武紀的成長,這個團隊來自中科院,有核心技術,只是成立不過5年,仍顯稚嫩。“中國會有一家像英偉達一樣的企業(yè),雖然還有很長的路要走。”他說。
作者/IT時報記者 孫鵬飛
編輯/挨踢妹
排版/黃建
圖片/PxHere、東方財富網、英特爾、OmniSci、
Google Cloud、Graphcore、GitHub、億歐智庫、寒武紀招股書、網絡
來源/《IT時報》公眾號vittimes
相關推薦
你認為誰是下一個AI芯片之王?
聯(lián)系客服