以下文章來源于晶上世界,作者泛靈
近年來,人工智能(AI)迅速崛起,成為全球科技和產(chǎn)業(yè)界的焦點(diǎn)。隨著AI技術(shù)的不斷突破和應(yīng)用場景的不斷拓展,市場對(duì)AI PC、AI Phone、AI Car這些板塊的關(guān)注度持續(xù)拉升,AI芯片作為支撐AI運(yùn)算的核心硬件,也迎來了前所未有的發(fā)展機(jī)遇。
據(jù)OpenAI測算,從2012年開始,全球AI訓(xùn)練所用的計(jì)算量呈現(xiàn)指數(shù)增長,平均每3.43個(gè)月便會(huì)翻一倍。AMD則預(yù)計(jì),2027年全球數(shù)據(jù)中心 AI 計(jì)算市場規(guī)模將超過1500億美元(約合人民幣1.095萬億元),年復(fù)合增長率超過50%。
自英偉達(dá)率先在AI大模型算力芯片市場占據(jù)主導(dǎo)地位,市值突破萬億大關(guān)后,英特爾、AMD以及中國GPU芯片公司也紛紛發(fā)力,渴望在AI芯片市場中分得一杯羹。然而在無限風(fēng)光的背后,無論是行業(yè)領(lǐng)導(dǎo)者還是獨(dú)角獸新秀,都有本自家“難念的經(jīng)”。
01
自研AI芯片的困境
夢想與現(xiàn)實(shí)仍有距離
目前AI芯片市場依舊是英偉達(dá)一騎絕塵,據(jù)最新估計(jì)其全球市場份額已達(dá)90%,創(chuàng)下新記錄。然而隨著全球的科技巨頭、云服務(wù)提供商和初創(chuàng)公司都在搶奪算力資源來開發(fā)自己的人工智能模型,英偉達(dá)的芯片供不應(yīng)求,價(jià)格也水漲船高。為了避免受制于人,節(jié)省費(fèi)用,各大巨頭紛紛宣布自研AI芯片。
近期AI圈的熱點(diǎn)之一便是OpenAI首席執(zhí)行官Altman計(jì)劃自研AI芯片,并正在與臺(tái)積電和中東投資者進(jìn)行談判。
亞馬遜作為最先涉足自研芯片的廠商,已擁有兩款A(yù)I專用芯片訓(xùn)練芯片Trainium和推理芯片Inferentia;谷歌則擁有第四代張量處理單元(TPU);Facebook母公司Meta在十年前就開始努力了,終于在去年5月19日首次官宣了其自研AI芯片MTIA的進(jìn)展;微軟也在 Ignite 2023 大會(huì)上,發(fā)布了用于數(shù)據(jù)中心的AI 芯片Azure Maia 100。
然而,微軟和Meta的研發(fā)進(jìn)度相對(duì)較慢,仍依賴英偉達(dá)的芯片。根據(jù)市場研究公司Omdia Research的最新報(bào)告,2023年,Meta和微軟兩家公司以15萬塊H100 GPU的購買量并列位居第一。微軟預(yù)計(jì)于去年十一月發(fā)布的AI芯片雅典娜也一再推遲,Meta近日則高調(diào)宣布將花費(fèi)近百億美元購入35萬個(gè)H100,這也表明其自身研發(fā)并不順利。
2023英偉達(dá)H100的最終出貨量預(yù)估,圖源:Omdia Research
國內(nèi)廠商寒冬難熬
在過去3-4年里,國內(nèi)AI芯片企業(yè)可以說是百花齊放,涌現(xiàn)出諸如海思、燧原、寒武紀(jì)、地平線等實(shí)力不菲的廠商,奮力追趕國外巨頭,希望打破AI芯片的壟斷格局。
然而激昂的呼聲散去,這些過去紅極一時(shí)的獨(dú)角獸們似乎愈來愈命運(yùn)未卜。
近日,壁仞科技的重要成員徐凌杰宣布離職,這是繼GPU產(chǎn)品線總經(jīng)理焦國方離職后,壁仞科技失去的第二位聯(lián)合創(chuàng)辦人。這一連串的高層變動(dòng),無疑給公司的未來發(fā)展蒙上了一層陰影。
與此同時(shí),曾備受市場矚目的AI芯片企業(yè)寒武紀(jì)也正處于艱難時(shí)期。這家公司已經(jīng)連續(xù)七年虧損,市值大幅縮水,創(chuàng)始投資股東也在減持股份。曾一度籠罩的中科院光環(huán)也幾乎消散,AI芯片市場的泡沫似乎正面臨破裂的風(fēng)險(xiǎn)。從2023年第二季度開始,寒武紀(jì)被曝出裁員消息,近期其子公司行歌科技也宣布將大規(guī)模裁員。
曾在中國火紅一時(shí)的AI芯片廠,宛如「冬日里的一把火」,未能抵御大環(huán)境緊縮與外在禁令圍剿而陷入寒冬與困境。資本市場對(duì)AI芯片的追捧,也轉(zhuǎn)為對(duì)其的靈魂拷問:能不能撐過今年冬天?
02
“遙遙領(lǐng)先”的頭部公司同樣不安
“我們不需要假裝公司一直處在危險(xiǎn)之中,我們確實(shí)一直處于危險(xiǎn)之中”,英偉達(dá)創(chuàng)始人黃仁勛在去年十一月的一場演講中表示。
壓力首先來自同行圍剿
產(chǎn)品方面,除了那些“不忠誠的”客戶們,紛紛自研芯片,AMD和英特爾和兩個(gè)老對(duì)手,每次發(fā)布新芯片,也都會(huì)和英偉達(dá)作對(duì)比。例如AMD12月6日推出MI300x時(shí),宣稱表現(xiàn)優(yōu)于英偉達(dá)的AH100。英偉達(dá)隨后發(fā)布了自己的基準(zhǔn)測試作為回應(yīng),表明AH100在正確的設(shè)置下仍然更好。AMD再次對(duì)此做出回應(yīng),發(fā)布了新的基準(zhǔn)測試,再次顯示MI300X在正確的設(shè)置下表現(xiàn)出色。
生態(tài)建設(shè)方面,英偉達(dá)芯片帝國的護(hù)城河CUDA也正遭猛烈進(jìn)攻,MLIR、谷歌、OpenAI等正在轉(zhuǎn)向一個(gè)“以Python語言為基礎(chǔ)的編程層”,以使AI訓(xùn)練更加開放。
與白宮的“貓鼠游戲”
近年來,美國政府為了限制我國在人工智能領(lǐng)域的發(fā)展,頻頻出臺(tái)或修正出口管制規(guī)定,要求“高性能半導(dǎo)體”不能出口到中國,英偉達(dá)的王牌芯片A100和H100首先被狙擊,為了保住中國市場,英偉達(dá)不斷閹割性能以符合規(guī)定,先后推出了“一次降級(jí)芯片”A800和H800、“二次降級(jí)芯片”H20、L20、L2等多款產(chǎn)品,然而國內(nèi)云計(jì)算公司對(duì)英偉達(dá)的訂單依舊愈來愈少,轉(zhuǎn)而購買華為等本土企業(yè)開發(fā)的芯片。
1月26日,美國商務(wù)部部長雷蒙多更是直言,美國正在“盡全力阻止中國獲得算力”?梢娒绹畬⒗^續(xù)收緊對(duì)華出口標(biāo)準(zhǔn),限制我國企業(yè)能獲得的算力,進(jìn)而降低訓(xùn)練AI的效率,保持其在人工智能領(lǐng)域的領(lǐng)先地位?梢,英偉達(dá)與白宮的這場“貓鼠游戲”還將繼續(xù)進(jìn)行。
伴隨市場丟失的珍貴數(shù)據(jù)
正如上文所提到到,互聯(lián)網(wǎng)巨頭或人工智能公司自研AI芯片正在成為一種趨勢,盡管困難重重,但他們具備一項(xiàng)英偉達(dá)所必需的重要資源,那就是數(shù)據(jù)。
在AI算法開發(fā)過程中會(huì)遇到的各種問題和數(shù)據(jù),這些信息反饋給英偉達(dá)時(shí),英偉達(dá)才能在后續(xù)迭代中,針對(duì)性地改進(jìn)自己的產(chǎn)品,提升使用體驗(yàn)。而我國在人工智能領(lǐng)域走在世界前列,英偉達(dá)伴隨中國市場丟失的,將是無法用數(shù)字統(tǒng)計(jì)的價(jià)值。
03
AI芯片還有哪些發(fā)展動(dòng)力
盡管發(fā)展勢頭有所削弱,但得益于供應(yīng)鏈及生態(tài)優(yōu)勢,英偉達(dá)在AI算力芯片領(lǐng)域的主導(dǎo)地位短期內(nèi)不會(huì)發(fā)生改變。但無論是芯片企業(yè),還是下游客戶,都不想看到“英偉達(dá)”一家獨(dú)占鰲頭。
AI芯片的藍(lán)海中,競爭正日趨激烈。面對(duì)這樣的市場環(huán)境,AI芯片產(chǎn)業(yè)的發(fā)展動(dòng)力何在?如何發(fā)掘新的競爭優(yōu)勢呢?
存算一體,算力數(shù)量級(jí)提升
以數(shù)據(jù)為主的AI計(jì)算之下,馮諾伊曼架構(gòu)的“存儲(chǔ)墻”和“功耗墻”挑戰(zhàn)凸顯。隨算力增加,處理器核心數(shù)增多,每核心可用帶寬越來越少,限制了整體速度。搬運(yùn)數(shù)據(jù),成為相當(dāng)大的瓶頸。如果不進(jìn)行存儲(chǔ)優(yōu)化,芯片提供的計(jì)算力會(huì)大大降低。
而當(dāng)下的計(jì)算處理器如CPU,GPU或AI專用芯片等,均采用馮諾依曼架構(gòu)設(shè)計(jì),80%的功耗發(fā)生在數(shù)據(jù)傳輸上,99%的時(shí)間消耗在存儲(chǔ)器書寫過程中,而真正用于計(jì)算的能耗和時(shí)間其實(shí)占比很低。
因此,只有低功耗基礎(chǔ)上的大算力才是可持續(xù)發(fā)展。
存算一體化是將計(jì)算機(jī)中的運(yùn)算從中央處理器轉(zhuǎn)入內(nèi)存中進(jìn)行,直接在存儲(chǔ)單元內(nèi)部進(jìn)行運(yùn)算,緩解數(shù)據(jù)搬運(yùn),可大幅降低數(shù)據(jù)交換時(shí)間以及計(jì)算過程中的數(shù)據(jù)存取能耗。
存算一體是現(xiàn)階段實(shí)現(xiàn)高帶寬、低功耗、計(jì)算需求的一條有效途徑,如何有效控制存內(nèi)計(jì)算接口是一個(gè)重要挑戰(zhàn)。誰擁有兼顧計(jì)算密度與存儲(chǔ)密度的存內(nèi)計(jì)算硬件架構(gòu),誰就擁有了打開高能效計(jì)算的金鑰匙。
2019年后,新增的AI芯片廠商,多數(shù)在布局存算一體:據(jù)睿洞察不完全統(tǒng)計(jì),在2019-2021年新增的AI芯片廠商有20家,在這之中,有10家選擇存算一體路線。整體來看,目前國內(nèi)外在存算一體方面都處于起步階段,存算一體正處于學(xué)術(shù)界向工業(yè)界遷移的關(guān)鍵時(shí)期,所以這可能是發(fā)展國產(chǎn)芯片的另一大重要方向。
數(shù)據(jù)來源:睿洞察
系統(tǒng)級(jí)創(chuàng)新
AMD的CEO蘇姿豐曾指出,按照當(dāng)前計(jì)算效率每兩年提升2.2倍的速度,到2035年,若要達(dá)到十萬億億級(jí)的算力,所需功率將高達(dá)500MW,這幾乎相當(dāng)于半個(gè)核電站的輸出功率。面對(duì)如此不切實(shí)際的能源消耗,系統(tǒng)級(jí)創(chuàng)新顯得尤為重要。它不再局限于單一的芯片或電路設(shè)計(jì),而是需要從上至下,協(xié)同考慮軟件、系統(tǒng)架構(gòu)、封裝技術(shù)等多個(gè)層面,實(shí)現(xiàn)整體性能的優(yōu)化。
同樣,歐洲三大半導(dǎo)體研究機(jī)構(gòu)IMEC、CEA Leti和Fraunhofer的在一次聯(lián)合演講中,也強(qiáng)調(diào)了系統(tǒng)級(jí)創(chuàng)新在未來半導(dǎo)體發(fā)展中的核心地位。隨著半導(dǎo)體工藝逼近物理極限,新的應(yīng)用需求已經(jīng)無法通過單純的工藝提升來滿足。特別是下一代智能汽車和AI應(yīng)用,它們對(duì)芯片的需求更加復(fù)雜和多樣化,需要從系統(tǒng)層面進(jìn)行整體考慮和創(chuàng)新。
芯片設(shè)計(jì)范式變革,圖片來源:孫凝暉院士集成芯片與芯粒大會(huì)報(bào)告
系統(tǒng)級(jí)創(chuàng)新或系統(tǒng)工藝協(xié)同優(yōu)化,是一種全新的設(shè)計(jì)理念。它從產(chǎn)品需求出發(fā),反向推導(dǎo)到系統(tǒng)架構(gòu)、芯片設(shè)計(jì)和半導(dǎo)體工藝等各個(gè)環(huán)節(jié)。通過各個(gè)環(huán)節(jié)的協(xié)同優(yōu)化,最終實(shí)現(xiàn)產(chǎn)品性能的大幅提升。這種“由外向內(nèi)”的設(shè)計(jì)思路,打破了傳統(tǒng)半導(dǎo)體設(shè)計(jì)的局限,為行業(yè)帶來了新的發(fā)展機(jī)遇。
蘇姿豐給出了一個(gè)經(jīng)典案例。在對(duì)模型算法層面使用創(chuàng)新數(shù)制(例如8位浮點(diǎn)數(shù)FP8)的同時(shí),在電路層對(duì)算法層面進(jìn)行優(yōu)化支持,最終實(shí)現(xiàn)計(jì)算層面數(shù)量級(jí)的效率提升:相比傳統(tǒng)的32位浮點(diǎn)數(shù)(FP32),進(jìn)行系統(tǒng)級(jí)創(chuàng)新的FP8則可以將計(jì)算效率提升30倍之多。而如果僅僅是優(yōu)化FP32計(jì)算單元的效率,無論如何也難以實(shí)現(xiàn)數(shù)量級(jí)的效率提升。這一成果充分證明了系統(tǒng)級(jí)創(chuàng)新在提升計(jì)算效率方面的巨大潛力。
特定域計(jì)算支持工作負(fù)載優(yōu)化,從而提高性能和效率。圖源:ISSCC2023大會(huì)
千帆競渡,創(chuàng)新領(lǐng)航
在技術(shù)飛速發(fā)展的時(shí)代,創(chuàng)新是打破技術(shù)壁壘、提升競爭力的關(guān)鍵。我國AI芯片廠商面臨著國際技術(shù)封鎖和市場競爭的雙重壓力,只有通過不斷創(chuàng)新,才能在激烈的競爭中立于不敗之地。
未來,異構(gòu)計(jì)算叢集、特定加速單元、先進(jìn)封裝技術(shù)、高速片間UCIe互聯(lián)、存算一體等內(nèi)存技術(shù),這些技術(shù)的融合和創(chuàng)新,將為半導(dǎo)體行業(yè)帶來新的發(fā)展動(dòng)力和方向。我國芯片廠商需要緊跟技術(shù)前沿,并敢于推進(jìn)技術(shù)產(chǎn)業(yè)化,畢竟,長坡厚雪的AI算力芯片賽道,如果缺乏核心競爭力而僅靠融資輸血來維持公司研發(fā)投入,很難持久。