展會(huì)信息港展會(huì)大全

自動(dòng)駕駛芯片的算力焦慮,“存算一體”能解決嗎?
來源:互聯(lián)網(wǎng)   發(fā)布日期:2022-06-23 10:07:37   瀏覽:3887次  

導(dǎo)讀:自動(dòng)駕駛芯片,越來越「熱鬧」了。 近年來,自動(dòng)駕駛的普及以肉眼可見的速度加快,根據(jù)1月12日工信部數(shù)據(jù),2021年新能源汽車銷售352.1萬輛,其中搭載組合輔助駕駛系統(tǒng)的乘用車新車市場占比達(dá)到20%。而兩年前,L2級(jí)輔助駕駛的滲透率僅為3.3%。 相伴而生的,是...

自動(dòng)駕駛芯片,越來越「熱鬧」了。

近年來,自動(dòng)駕駛的普及以肉眼可見的速度加快,根據(jù)1月12日工信部數(shù)據(jù),2021年新能源汽車銷售352.1萬輛,其中搭載組合輔助駕駛系統(tǒng)的乘用車新車市場占比達(dá)到20%。而兩年前,L2級(jí)輔助駕駛的滲透率僅為3.3%。

相伴而生的,是汽車「大腦」自動(dòng)駕駛AI芯片的競爭加劇。

英偉達(dá)、英特爾等老牌芯片企業(yè)早就瞄準(zhǔn)了這一賽道,特斯拉、蔚來、小鵬等車企,黑芝麻、地平線、芯馳科技、寒武紀(jì)、后摩智能等國內(nèi)芯片廠商也都紛紛入局。

比如,蔚來汽車有自研芯片的計(jì)劃;高通去年宣布和寶馬合作,2025年使用高通驍龍Ride自動(dòng)駕駛平臺(tái);初創(chuàng)公司有的直接聚焦在自動(dòng)駕駛上,也有的業(yè)務(wù)范圍更廣,覆蓋自動(dòng)駕駛、智能座艙、中央網(wǎng)關(guān)、高可靠MCU等;收購、合作等關(guān)系網(wǎng)也在不斷變動(dòng),這一戰(zhàn)場的發(fā)令槍已經(jīng)拉響了。

然而,與常見的數(shù)據(jù)中心AI芯片不同,應(yīng)用于汽車場景的AI芯片,在算力、功耗、性能方面都提出了更極端的要求。

在摩爾定律逐漸失效、“存儲(chǔ)墻”問題日益凸顯的當(dāng)下,汽車AI芯片到底需要提供多大算力?何種路徑才是突破摩爾定律的存儲(chǔ)墻壁壘的最接近落地方法?面對(duì)山頭林立、秩序井然的芯片市場,初創(chuàng)公司的市場機(jī)遇和差異化優(yōu)勢又是什么?

「存算一體」也許是個(gè)值得研究的答案。

01. 一筆取舍賬,自動(dòng)駕駛需要多少算力

過去幾年中,用于衡量一款自動(dòng)駕駛芯片最直接的標(biāo)準(zhǔn)之一,就是算力高低。

自動(dòng)駕駛級(jí)別越高時(shí),產(chǎn)生的數(shù)據(jù)越多,對(duì)芯片的算力要求也就越高。

2014年時(shí),最早應(yīng)用Mobileye的第一代EyeQ芯片,算力只有0.256TOPS;2015年,就已有專門面向自動(dòng)駕駛的平臺(tái),每年要迭代1-2次;英偉達(dá)也預(yù)告將在2025年上市1000T算力的Atlan芯片。

算力的不斷提升,是否意味著自動(dòng)駕駛的需求已經(jīng)得到了滿足,自動(dòng)駕駛玩家們可以跑出算力焦慮了?

遠(yuǎn)還沒有。

一方面,大算力也意味著更高的成本。實(shí)際上在現(xiàn)有的自動(dòng)駕駛芯片中,單片算力很難滿足高級(jí)別自動(dòng)駕駛的需求,車企或自動(dòng)駕駛企業(yè)多會(huì)采取“堆料”的方式,用芯片數(shù)量的增加來實(shí)現(xiàn)大算力。成本的增加不可避免,難以推動(dòng)自動(dòng)駕駛技術(shù)的規(guī);瘧(yīng)用,車企也很難實(shí)現(xiàn)技術(shù)和商業(yè)的平衡。

另一方面,除了對(duì)算力需求高,智能駕駛場景也對(duì)芯片的功耗和散熱有很高的要求。服務(wù)于豐田的創(chuàng)業(yè)者Amnon Shashua曾在多個(gè)場合表示過,效率比算力更重要。具體解釋,算力、功耗、成本就像是一個(gè)三角架構(gòu),一角的增減要用另一角來填補(bǔ)才行。

除此之外,「算力」并不真正代表著「性能」。

1000Tops的芯片參數(shù),并不意味著這塊芯片在實(shí)際應(yīng)用中能夠發(fā)揮出1000Tops的真實(shí)性能。

在當(dāng)前的馮諾伊曼架構(gòu)當(dāng)中,內(nèi)存系統(tǒng)的性能提升速度大幅落后于處理器的性能提升速度,有限的內(nèi)存帶寬無法保證數(shù)據(jù)高速傳輸,形成了一道“存儲(chǔ)墻”。

一方面,大量的計(jì)算單元受限于帶寬的限制,無法發(fā)揮作用,造成算力利用率很低;另一方面,數(shù)據(jù)來回傳輸又會(huì)產(chǎn)生巨大功耗,進(jìn)一步加大汽車電動(dòng)化大潮下的里程焦慮。

因此,僅僅簡單用算力高低來評(píng)估,遠(yuǎn)遠(yuǎn)達(dá)不到自動(dòng)駕駛的需求。

汽車AI芯片不僅需要大算力,更要有實(shí)際利用率的大算力,而且能夠保障低功耗、低延遲以及可承受的成本。

02. 存算一體,金字塔從頭建起

為了解決“存儲(chǔ)墻”問題,當(dāng)前業(yè)內(nèi)主要有三種方案:

用GDDR 或HBM來解決存儲(chǔ)墻問題的馮諾依曼架構(gòu)策略;算法和芯片高度綁定在一起的DSA方案;以及存算一體的方案。

HBM是目前業(yè)內(nèi)超大算力芯片常用的方案之一,其優(yōu)勢在于能夠暫時(shí)緩解“存儲(chǔ)墻”的困擾,但其性能天花板明顯,并且成本較高。

DSA方案以犧牲靈活性換取效率提升,算法和硬件高度耦合,適用于已經(jīng)成熟的AI算法,但并不適用于正處于快速迭代的自動(dòng)駕駛AI算法中。

最后是存算一體方案,這是一項(xiàng)誕生于實(shí)驗(yàn)室的新興技術(shù),其創(chuàng)新性在于打破了傳統(tǒng)馮諾伊曼架構(gòu)局限性,實(shí)現(xiàn)了計(jì)算與存儲(chǔ)模塊一體化的整合創(chuàng)新,解決了傳統(tǒng)芯片架構(gòu)中計(jì)算與存儲(chǔ)模塊間巨大的數(shù)據(jù)傳輸延遲、能量損耗痛點(diǎn),既增加了數(shù)據(jù)處理速度,又大大降低了數(shù)據(jù)傳輸?shù)墓,從而使芯片能效比(即每瓦能提供的算力)得?-3個(gè)數(shù)量級(jí)(>100倍)的提升。

達(dá)摩院計(jì)算技術(shù)實(shí)驗(yàn)室科學(xué)家鄭宏忠曾講過:“存算一體是顛覆性的芯片技術(shù),它天然擁有高性能、高帶寬和高能效的優(yōu)勢,可以從底層架構(gòu)上解決后摩爾定律時(shí)代芯片的性能和能耗問題。”

因此,存算一體架構(gòu)可以把算力做的更大,其芯片算力天花板比傳統(tǒng)馮諾依曼架構(gòu)更高;同時(shí),大幅降低了數(shù)據(jù)傳輸?shù)哪芰繐p耗,提升了能效比;另外,還能得到更低的延時(shí),存儲(chǔ)和計(jì)算單元之間數(shù)據(jù)搬運(yùn)的減少,大幅縮短了系統(tǒng)響應(yīng)時(shí)間。

更重要的是,用存算一體架構(gòu)做大算力AI芯片另一大優(yōu)勢在于成本控制。不依賴于GDDR 或HBM,存算一體芯片的成本能夠相應(yīng)的降低50%~70%。

換句話說,真正創(chuàng)新架構(gòu)的AI芯片是將上文中提到的算力、功耗、成本三角形結(jié)構(gòu)從原來的位置往上挪了三個(gè)檔位。不僅可以提高算力,還可以達(dá)到降低功耗、控制成本的效果。

03. 摘雀高掛的果實(shí)」

最近幾年,在缺芯的時(shí)代背景下,隨著政策支持的不斷加碼,我們看到國內(nèi)半導(dǎo)體產(chǎn)業(yè)迎來了發(fā)展的良機(jī)。芯片的“國產(chǎn)替代”已經(jīng)在很多細(xì)分領(lǐng)域取得了進(jìn)展,深受資本市場青睞。

但是資本市場也有越來越多的人意識(shí)到,熱門芯片賽道的“國產(chǎn)替代”創(chuàng)業(yè)項(xiàng)目已經(jīng)日趨飽和。一部分嗅覺敏銳的投資人開始關(guān)注后摩爾時(shí)代的“創(chuàng)新架構(gòu)”,認(rèn)為要想在純市場化競爭中挑戰(zhàn)英偉達(dá)等國際芯片巨頭,必須另辟蹊徑。于是差異化的技術(shù)創(chuàng)新成為芯片投資中的重要策略。

HBM、DSA、存算一體都屬于芯片行業(yè)當(dāng)前的技術(shù)創(chuàng)新路徑,三者對(duì)比來看,存算一體可以算作是一條難度最大、顛覆性最強(qiáng)、風(fēng)險(xiǎn)最高,但差異化和創(chuàng)新性也最顯著的路徑。

近年來,國內(nèi)外涌現(xiàn)出不少專注于存算一體芯片的新興創(chuàng)企,巨頭們紛紛加快了產(chǎn)業(yè)布局,資本也對(duì)其青睞有加。國內(nèi)最近一筆相關(guān)融資來自今年4月,國內(nèi)存算一體明星創(chuàng)企「后摩智能」宣布獲得數(shù)億人民幣Pre-A+輪融資。

不過,一直以來,傳統(tǒng)的存算一體研究大多集中在低功耗、低算力的「泄芯片場景中,比如語音、AIoT、安防等邊緣領(lǐng)域。

能夠應(yīng)用在車載AI的存算一體「大」算力芯片,即便在學(xué)術(shù)界也是一大難題,產(chǎn)業(yè)界敢于迎戰(zhàn)者更是屈指可數(shù)。

想要將二者融合,既需要存儲(chǔ)單元陣列、AI core、工具鏈等各個(gè)方面都需要有深厚積累的團(tuán)隊(duì),又需要進(jìn)行整體的協(xié)同優(yōu)化設(shè)計(jì),才能最終實(shí)現(xiàn)一款高效的基于存算一體的大算力AI芯片。

所幸,這一創(chuàng)新性技術(shù)已經(jīng)讓市場看到了落地可能性。

5月23日,后摩智能首款基于SRAM的存算一體大算力AI芯片已成功點(diǎn)亮,并跑通智能駕駛算法模型。首次在存內(nèi)計(jì)算架構(gòu)上跑通了智能駕駛場景下多場景、多任務(wù)算法模型,為高級(jí)別智能駕駛提供了一條全新的技術(shù)路徑。

存算一體很難,存算一體大芯片更難。但在產(chǎn)業(yè)巨頭林立,市場秩序森嚴(yán)的芯片產(chǎn)業(yè),新興創(chuàng)企若是只愿意選擇容易走的路、采摘「低垂的果實(shí)」,是難以取得成功的。

在保證存算一體帶來的高能效比、高性價(jià)比的前提下,又能將其成功擴(kuò)展到滿足自動(dòng)駕駛「大」算力需求的級(jí)別,屬于產(chǎn)業(yè)中「高掛的果實(shí)」。

從成立之初就聚焦于存算一體大算力芯片的后摩智能,正是瞄準(zhǔn)了這一道路。

以團(tuán)隊(duì)組成來說,后摩智能的核心創(chuàng)始團(tuán)隊(duì)既有來自美國普林斯頓大學(xué)、UCSB, Penn State大學(xué)等海內(nèi)外知名高校的學(xué)術(shù)人才,又有在AMD、Nvidia、華為海思、地平線等一線芯片企業(yè)中擁有豐富大芯片設(shè)計(jì)與實(shí)戰(zhàn)經(jīng)驗(yàn)的產(chǎn)業(yè)專家。

今年5月大算力存算一體芯片宣布點(diǎn)亮,對(duì)于后摩智能來說,離摘雀高掛的果實(shí)」已經(jīng)越來越近了。

傳統(tǒng)高算力芯片山頭林立,后來者想要在現(xiàn)有賽道上實(shí)現(xiàn)超越,確實(shí)是充滿挑戰(zhàn)的。

但隨著HBM等昂貴方案的不斷的提出,馮諾伊曼架構(gòu)的最后一絲紅利已經(jīng)被榨干,市場迫切地需要新架構(gòu)、新出路。

在AI算法快速迭代,摩爾定律逐漸失效的當(dāng)下,我們期待看到越來越多像后摩智能這樣愿意投身于基礎(chǔ)創(chuàng)新的芯片創(chuàng)企,不斷推進(jìn)產(chǎn)業(yè)走向下一個(gè)時(shí)代。


贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港