騰新一代智算集群正規(guī)模商業(yè)化
作者/IT時報記者郝俊慧
編輯/ 郝俊慧孫妍
10月17日,流傳了半個多月的一則“傳言”終于落地,美國宣布新一輪禁令,進一步收緊了對中國的芯片出口,并將壁仞、摩爾線程等13家公司列入實體清單。
新禁令幾乎將所有英偉達、AMD、英特爾等廠商的高性能算力芯片一網打盡,即便英偉達在去年10月第一輪禁令后推出的“閹割版”A800和H800以及高端游戲芯片4090,也被列入“限售名單”。
“不可理喻”是幾位受訪者對此禁令的第一反應,但相較去年,大家對國產算力替代的信心足了許多。
短期的“平靜”
信心來自華為。今年8月舉行的2023亞布力中國企業(yè)家論壇第十九屆夏季高峰會上,科大訊飛創(chuàng)始人劉慶峰一言激起千層浪:華為的GPU能力已經可以對標英偉達A100。彼時有媒體透露,用于訊飛星火大模型訓練的是華為最新騰芯片910B。
時隔兩月,《IT時報》記者從多個信源獲悉,基于華為騰910B芯片的全套國產智算集群,正在國內多個智算中心、大模型廠商、電信運營商處進行測試,盡管在通用性上與A100仍有差距,但調優(yōu)之后,在某些模型上的確與A100幾可比肩。
之前產業(yè)鏈普遍擔憂,基于NPU的騰910B因為需要個性化調優(yōu),很難像英偉達一樣提供普遍性服務,但此次新禁令卻恰似一劑強心針,“如果大家都沒得選,反而會刺激生態(tài),基于騰芯片的生態(tài)玩法會變得很多,參與者也會增多。最終足夠普遍的個性化,也就有了通用性。”一位深度參與騰生態(tài)的專業(yè)人士告訴《IT時報》記者。
“沒有另一個中國,只有一個中國”,今年上半年,英偉達(NVIDIA)公司首席執(zhí)行官黃仁勛在接受媒體采訪時發(fā)出的“中國市場不可替代”的呼吁,顯然并沒有得到期待的回應。
英偉達(NVIDIA)公司首席執(zhí)行官黃仁勛
盡管英偉達在談及新禁令時表示,“鑒于全球對我們產品的需求,我們預計(新規(guī))短期內不會對我們的財務業(yè)績產生實質性的影響。”但誰都知道,表面的平靜只可能是“短期”。
國內云商靜觀其變
這是一次被稱為有著“精準刀法”的切割。
美國商務部重新修改了去年對“高性能芯片”的定義,新增“性能密度閾值”條款,將原本不受限制的芯片都納入了管制。以目前中國廠商購買最多的A800為例,按照美國2022年禁令,NVLink互聯(lián)帶寬不得超過600GB/s,因此英偉達將原本支持600GB/s的A100帶寬降至400GB/s,并以A800的型號對中國銷售。但更新后的禁令規(guī)定,只要芯片總算力大于或等于4800TOPS,不論互聯(lián)帶寬多少都受管制。
目前,英偉達已確認,此次出口管制涉及的產品包括但不限于:A100、A800、H100、H800、L40、L40S以及RTX 4090。也就是說,目前人工智能所需要的高性能算力芯片,基本都在被限范圍。
美國政府的臨時最終規(guī)則將在發(fā)布后的一個月后正式生效(11月17日)。一則坊間流傳的消息稱,英偉達建議客戶在10月17日晚12點前增補訂單,這似乎意味著,在此時間節(jié)點后,新增訂單將很難獲得供貨保證。
《IT時報》記者咨詢國內幾大云商新禁令的影響,均未獲得有效回應。
一位云商內部人士透露,公司有過幾輪小范圍討論,但還在靜觀其變,“受影響的應該不止我們一家,大家等著互相看看各有什么對策。”另一位人士則表示,按照常規(guī),之前簽了合同的訂單應該還會正常履行,但以后應該沒辦法再買了,而且有些合同是云商和服務器廠家簽的,對芯片廠商沒有約束權,最后能否拿到貨,只能取決于“服務器廠商和英偉達的合同是怎么簽的”。
不過國內的英偉達服務器市場還是應聲而漲。10月19日晚,一位經銷商在某個資源群發(fā)布消息,“H800,年底交貨,226萬/臺。”此前,八卡的H800服務器售價曾相對穩(wěn)定在200萬元左右。短短兩天,上漲10%。
被奉送的市場
消息公布后,美東時間10月17日和18日,英偉達連跌兩天,跌幅達8.64%。
此前,根據英國《金融時報》報道,中國互聯(lián)網巨頭正爭相采購對構建生成式人工智能系統(tǒng)至關重要的英偉達高性能AI芯片,今明兩年的訂單價值達50億美元。其中,2023年10億美元,2024年40億美元。
“今年的應該沒問題,明年能否正常履約現(xiàn)在還不確定。”對于英偉達能否能將這40億美元入袋,業(yè)內各種猜測聲都有,但不可否認,此次“一刀切”的限制,絕不是英偉達想聽到的消息。
英偉達首席財務官科萊特柯蕾絲(Colette Kress)在7月30日的2024財年第二財季業(yè)績會上表示,大部分人工智能芯片需求仍來自中國,中國買家投資占據了數據中心產品總收入的20%至25%。數據顯示,英偉達第二財季中,數據中心業(yè)務營收為103.2億美元。
根據新禁令,或許,這部分營收占比的大部分會消失,甚至連表現(xiàn)平平的游戲業(yè)務也可能受影響,因為高端游戲芯片4090,這次也被禁了。
英偉達高端游戲芯片4090
英偉達會再出“二次閹割版”的A100嗎?或許會有,但由于此次禁令過于精準,不僅限制了總算力,對性能密度也做了精確說明,就算再有低于新標準的A700、A600(假設名),對中國的人工智能和大模型訓練廠商有多大吸引力,確實很難說。
如果沒有可接受的替代方案,預計明年下半年,英偉達將為中國國產算力芯片廠商空出一片巨大的市常
期待國產算力的春天
10月15日,中國電信AI算力服務器(2023-2024年)集中采購項目公布候選人,總集采金額超84億元。
仔細分析這份中標候選表單會發(fā)現(xiàn),國產算力的商業(yè)化已經有相當規(guī)模。比如在兩個標包中排在第一中標候選人位置的四川華鯤振宇智能科技有限公司,此次投標報價為27.82億元。
華鯤振宇是華為生態(tài)伙伴。據華鯤振宇官網,公司全面負責基于華為“鯤鵬+騰”處理器的“天宮”自主品牌服務器、存儲、PC、機器視覺等系列產品的設計、生產、銷售及服務,目前已獲得華為生態(tài)伙伴中唯一“鯤鵬+騰”雙領先級認證。
國際數據公司(IDC)發(fā)布的《中國半年度加速計算市場(2023上半年)跟蹤》報告顯示,2023年上半年,中國加速芯片的市場規(guī)模超過50萬張,本土AI芯片品牌出貨超過5萬張,比整個市場10%左右的份額。
一位華為騰工程師告訴《IT時報》記者,基于騰910B的大規(guī)模智算集群基礎設施,已經在全國一些智算中心和電信運營商內部開始測試,華為工程師都是每天駐場,解決包括服務器、路由器等軟硬件在內的各種問題,首批商業(yè)伙伴也都在測試中。
“除了華為,我們認為中科曙光也具備成為國產算力主流提供商的能力,畢竟這是一個高投入、強生態(tài)的產業(yè)。”中科曙光旗下的海光 DCU,也是國內目前公認的可用于科學計算、人工智能模型訓練和推理的國產芯片,一位人工智能專家期待,國產算力廠商能抓住時機,百花齊放。
目前,國產AI相關芯片企業(yè)有寒武紀、景嘉微、海光信息、百度昆侖、阿里含光、燧原、沐曦、壁仞、摩爾線程、天數智芯等,不過,能夠進行大模型預訓練的芯片,仍只有華為、海光等寥寥數家。
排版/ 季嘉穎
圖片/ 英偉達 東方IC
來源/《IT時報》公眾號vittimes
E N D