9月3日,中國高端芯片設(shè)計(jì)公司瀚博半導(dǎo)體,在2022世界人工智能大會(huì)上發(fā)布一系列新產(chǎn)品,并預(yù)覽了國產(chǎn)7nm云端GPU芯片SG100。
據(jù)瀚博CEO錢軍介紹,這款芯片具備業(yè)界領(lǐng)先的圖形渲染性能,擁有世界領(lǐng)先的超高吞吐、超高質(zhì)量、低延時(shí)的編碼能力,集渲染、AI、視頻于一體,為云游戲、云手機(jī)、云桌面、云計(jì)算等元宇宙關(guān)鍵性應(yīng)用場景提供深度優(yōu)化。同時(shí),SG100還提供世界一流的SR-IOV虛擬化支持,端到端整體提升用戶視覺體驗(yàn)。
圖源:受訪者提供
瀚博CEO錢軍曾是AMD 高管,在創(chuàng)辦瀚博半導(dǎo)體之前,他曾帶領(lǐng)AMD中國團(tuán)隊(duì)設(shè)計(jì)量產(chǎn)了業(yè)界第一顆 7 納米圖形處理器和第一顆 7 納米 GPGPU 架構(gòu)的 AI 芯片。同時(shí),瀚博的核心研發(fā)團(tuán)隊(duì)也都擁有18年以上高端芯片設(shè)計(jì)和量產(chǎn)的經(jīng)驗(yàn)。
這款芯片尚未正式發(fā)布。“不久的將來我們會(huì)正式發(fā)布這款GPU。”錢軍表示。屆時(shí)瀚博將正式進(jìn)入GPU市場,將基于GPU、AI和視頻核心技術(shù)帶來更多產(chǎn)品組合。
瀚博CEO錢軍在發(fā)布會(huì)現(xiàn)場 圖源:品玩 王兆洋攝
此外,當(dāng)天正式發(fā)布的產(chǎn)品包括:瀚博統(tǒng)一計(jì)算架構(gòu)、全新數(shù)據(jù)中心推理卡載天VA10、邊緣AI推理加速卡載天VE1和瀚博軟件平臺(tái)VastStream擴(kuò)展版。
自主研制的統(tǒng)一計(jì)算架構(gòu)(Vastai Unified Compute Architecture):
該架構(gòu)整合了多款高性能計(jì)算引擎,擁有高效統(tǒng)一的存儲(chǔ)管理、一致性接口和低鏈接延遲、完整的虛擬化功能、統(tǒng)一的底層軟件設(shè)計(jì)、模塊化的上層計(jì)算算子庫和功能模塊。瀚博統(tǒng)一架構(gòu)讓計(jì)算密集型的AI、視頻、渲染任務(wù)性能得到最大化硬件加速,同時(shí)端到端縮小延時(shí),一體化助力云端實(shí)時(shí)圖形渲染、AI增強(qiáng)處理、視頻編解碼等需求。
數(shù)據(jù)中心產(chǎn)品線:推理卡載天VA10
這款加速卡搭載瀚博自研的超低延時(shí)、超高吞吐AI引擎,最大的亮點(diǎn)在于,Int8峰值算力達(dá)400TOPS,再次刷新業(yè)界紀(jì)錄。載天VA10功耗150瓦,整體最高推理性能達(dá)到同功耗主流GPU的2倍以上,且延時(shí)低至后者的6%。在低延時(shí)場景(低于4毫秒的YoloV3檢測算法場景)下,載天VA10的推理性能,更達(dá)到同功耗市場主流GPU的3倍以上。載天VA10適合多種需要高實(shí)時(shí)性的云端AI應(yīng)用部署,如直播視頻增強(qiáng)、智慧交通管理、實(shí)時(shí)語義理解等場景。
首款面向邊緣大算力場景推理卡:載天VE1系列
載天VE1兼具超低時(shí)延與超高吞吐率,吞吐率達(dá)到主流GPU的2倍,但時(shí)延僅為其的1/5。在40~65瓦功耗下,INT8峰值算力達(dá)100 TOPS,這款加速卡支持60路1080P視頻實(shí)時(shí)解碼,支持主流AI框架的模型,提供從模型編譯到推理優(yōu)化的全流程低代碼開發(fā)框架VastPipe,軟硬結(jié)合為客戶提供端到端的AI推理解決方案。
瀚博的軟件平臺(tái)VastStream:
可加速各類AI應(yīng)用部署,包括計(jì)算機(jī)視覺、視頻處理、自然語言處理、搜索與推薦、算子自定義擴(kuò)展等。VastStream的全新軟件組件,提供系統(tǒng)管理等三大管理工具,方便客戶部署,同時(shí)其基礎(chǔ)軟件棧功能更加豐富,特性包括統(tǒng)一接口、靈活調(diào)度、通用AI計(jì)算、多路高效視頻轉(zhuǎn)碼+AI增強(qiáng)、易編程快遷移、工具鏈完備等。