劃重點(diǎn)
據(jù)稱字節(jié)跳動(dòng)正在自研兩款A(yù)I芯片,分別用于模型訓(xùn)練和推理。
字節(jié)跳動(dòng)計(jì)劃與臺積電合作,于2026年前實(shí)現(xiàn)兩款自研芯片量產(chǎn)。
字節(jié)跳動(dòng)計(jì)劃采購數(shù)十萬顆自研芯片,預(yù)計(jì)比從英偉達(dá)采購節(jié)省數(shù)十億美元。
科技新聞?dòng)?9月16日消息,據(jù)國外媒體報(bào)道,據(jù)知情人士透露,TikTok母公司字節(jié)跳動(dòng)正加快自研人工智能芯片的步伐,意在提升在中國人工智能聊天機(jī)器人市場中的競爭優(yōu)勢。
兩位知情人士證實(shí),字節(jié)跳動(dòng)計(jì)劃與芯片制造巨頭臺積電合作,力爭在2026年前實(shí)現(xiàn)兩款自研半導(dǎo)體芯片的量產(chǎn)。這一舉措可能會減少字節(jié)跳動(dòng)在開發(fā)和運(yùn)行人工智能模型過程中對昂貴的英偉達(dá)芯片的依賴。
對于字節(jié)跳動(dòng)來說,降低芯片成本至關(guān)重要。與其他中國大型科技公司及眾多初創(chuàng)企業(yè)一樣,字節(jié)跳動(dòng)已經(jīng)推出了自家大語言模型,供內(nèi)部使用和對外銷售。然而,市場競爭異常激烈,導(dǎo)致包括阿里巴巴和百度在內(nèi)的中國科技巨頭紛紛將其模型使用價(jià)格大幅下調(diào),降幅高達(dá)97%。
字節(jié)跳動(dòng)去年發(fā)布了其首款人工智能聊天機(jī)器人“豆包”,該機(jī)器人提供了類似于OpenAI ChatGPT的文本和圖像生成功能。今年,字節(jié)跳動(dòng)又推出了一批低成本的大語言模型,其中部分產(chǎn)品的定價(jià)比OpenAI的同類產(chǎn)品低了高達(dá)99%。
與此同時(shí),字節(jié)跳動(dòng)在開發(fā)生成式人工智能模型方面的費(fèi)用也在不斷上升。據(jù)知情人士透露,今年,該公司已訂購了超過20萬顆英偉達(dá)H20芯片,這款芯片是美國出口管制下允許出售給中國的最先進(jìn)英偉達(dá)芯片。該訂單的總金額超過20億美元,目前字節(jié)跳動(dòng)仍在等待英偉達(dá)交付全部訂單。
不過,字節(jié)跳動(dòng)正計(jì)劃從臺積電訂購數(shù)十萬顆自家設(shè)計(jì)的訓(xùn)練和推理芯片。預(yù)計(jì)這些內(nèi)部設(shè)計(jì)的芯片成本將比從英偉達(dá)購買芯片節(jié)省數(shù)十億美元。然而,這些芯片目前仍處于設(shè)計(jì)階段,因此字節(jié)跳動(dòng)的計(jì)劃可能會有所調(diào)整。
字節(jié)跳動(dòng)和臺積電均未對此事作出回應(yīng)。
字節(jié)跳動(dòng)的芯片研發(fā)工作遵循了谷歌、亞馬遜和微軟等公司近年來的做法,即在開發(fā)和運(yùn)行人工智能模型方面減少對英偉達(dá)芯片的依賴。這些公司中的一些還為使用其云計(jì)算服務(wù)的客戶提供了自家設(shè)計(jì)的芯片,作為對英偉達(dá)芯片的替代品。
與此同時(shí),阿里巴巴和百度也在多年來致力于開發(fā)內(nèi)部人工智能芯片。例如,百度正在為其生成式人工智能產(chǎn)品開發(fā)一款新的芯片昆侖芯3代。知情人士透露,該芯片已經(jīng)進(jìn)入設(shè)計(jì)的最后階段,臺積電即將開始生產(chǎn)。這一項(xiàng)目此前尚未被報(bào)道過。
推理 VS 訓(xùn)練
字節(jié)跳動(dòng)正在開發(fā)兩款芯片,其中一款旨在加速構(gòu)建人工智能模型所需的大量數(shù)據(jù)計(jì)算,這種芯片被稱為訓(xùn)練芯片;另一款則用于加速基于模型的預(yù)測和決策過程,稱為推理芯片。
字節(jié)跳動(dòng)多年來一直專注于推理芯片的研發(fā),而此次將首次嘗試設(shè)計(jì)訓(xùn)練芯片,這種芯片的設(shè)計(jì)難度更大,成本也更高。
知情人士表示,字節(jié)跳動(dòng)涉及的芯片符合美國的出口限制,這些限制涉及對中國公司銷售使用美國設(shè)備制造的芯片。這一合規(guī)性要求是字節(jié)跳動(dòng)與臺積電合作的前提。然而,由于美國政府可能每年更新這些限制,未來這些芯片仍可能面臨合規(guī)風(fēng)險(xiǎn)。
此外,字節(jié)跳動(dòng)計(jì)劃于2026年推出的芯片設(shè)計(jì)采用了名為5納米的先進(jìn)制造工藝,這一工藝僅比臺積電當(dāng)前最前沿的技術(shù)落后一代。5納米工藝是中國芯片制造商難以復(fù)制的技術(shù),也是英偉達(dá)今年3月宣布的即將推出的旗艦AI芯片Blackwell所使用的工藝。
H20芯片的性能大約是英偉達(dá)H100芯片的四分之一,后者在2022年發(fā)布時(shí)是英偉達(dá)最先進(jìn)的芯片。盡管H100已上市兩年,但由于中國企業(yè)面臨美國去年10月宣布的出口管制,該芯片的需求仍然旺盛。
由于單顆H20的計(jì)算性能低于美國云服務(wù)提供商使用的更常見的英偉達(dá)芯片,中國公司需要購買更多的H20芯片來組成具有相同計(jì)算能力的集群,這增加了他們的成本。雖然美國對單顆芯片的性能有出口限制,但集群系統(tǒng)不受此限制。集群將多顆芯片連接成一個(gè)系統(tǒng),以實(shí)現(xiàn)更高效的數(shù)據(jù)計(jì)算。
一位了解字節(jié)跳動(dòng)芯片開發(fā)情況的知情人士表示,中國芯片工程師可以通過其他方式提升芯片性能,例如加快集群中每個(gè)芯片之間的連接速度,或在訪問高帶寬計(jì)算機(jī)內(nèi)存時(shí)提高性能。這些方法并不受美國制裁的限制。
例如,字節(jié)跳動(dòng)希望其自家設(shè)計(jì)的芯片能夠驅(qū)動(dòng)集群,以大致相同的成本實(shí)現(xiàn)單顆H100芯片四倍的計(jì)算性能。H100芯片的價(jià)格最高可達(dá)3萬美元。
路透社早些時(shí)候報(bào)道了字節(jié)跳動(dòng)人工智能芯片工作的一些細(xì)節(jié),包括其制造工藝和與臺積電的合作關(guān)系。然而,關(guān)于正在研發(fā)的芯片數(shù)量、用途、訂單規(guī)模和生產(chǎn)時(shí)間表的詳細(xì)信息,此前尚未公開。(編譯/金鹿)