展會信息港展會大全

12nm媲美7nm!燧原科技發(fā)布帶寬最大的云端AI推理卡
來源:互聯(lián)網(wǎng)   發(fā)布日期:2021-12-09 07:59:45   瀏覽:6648次  

導讀:12月7日,AI創(chuàng)業(yè)公司燧原科技(Enflame)發(fā)布了第二代云端AI推理加速卡云燧i20。 這是繼今年7月的云端AI訓練加速卡云燧T20之后,燧原科技新一代針對云端推理場景的AI加速產(chǎn)品。 云燧i20最大亮點就是擁有迄今最大的AI加速卡存儲帶寬,通過HBM2e內(nèi)存達到了819GB/...

12月7日,AI創(chuàng)業(yè)公司燧原科技(Enflame)發(fā)布了第二代云端AI推理加速卡“云燧i20”。

這是繼今年7月的云端AI訓練加速卡“云燧T20”之后,燧原科技新一代針對云端推理場景的AI加速產(chǎn)品。

云燧i20最大亮點就是擁有迄今最大的AI加速卡存儲帶寬,通過HBM2e內(nèi)存達到了819GB/s,可為云端推理業(yè)務(wù)提供高吞吐、低延時的性能。

目前,以語音識別、圖片識別、視頻內(nèi)容分析為主的感知類應(yīng)用,內(nèi)容推薦、欺詐交易攔截等決策類應(yīng)用,在云端大部分都是以實時在線的方式提供服務(wù),同時神經(jīng)網(wǎng)絡(luò)的參數(shù)越來越多,數(shù)據(jù)帶寬需求也越來越高,因此兼顧高帶寬、低延遲變得至關(guān)重要。

云燧i20搭載了新一代AI推理芯片“邃思”,基于第二代高性能計算核心和數(shù)據(jù)引擎,12nm工藝打造,通過架構(gòu)升級大大提高了單位面積的晶體管效率,算力可媲美7nm GPU,而且成本更低。

同時,全面支持FP32、TF32、FP16、BF16、INT8的計算精度,其中單精度FP32峰值算力32TFLOPS,單精度張量TF32峰值算力128TFLOPS,整型INT8峰值算力256TOPS,對比上代云燧i10浮點、整型算力分別提升到1.8倍、3.6倍。

搭配升級后的軟件棧“馭算TopsRider”,性能、開發(fā)效率、模型覆蓋面都得到大幅提升。

通過引入通用高層圖優(yōu)化和大規(guī)模算子融合技術(shù),釋放大容量片內(nèi)存儲和高帶寬存儲的利用率,模型平均性能提升3.5倍,硬件算力利用率平均提升2倍。

通過升級的編程模型以及算子自動分片、自動生成技術(shù),自定義算子開發(fā)效率翻倍,模型遷移成本大大降低。

此外,對動態(tài)性的支持也大大增強,在檢測、語音識別、語義理解等場景更具競爭力。

據(jù)介紹,燧原科技專注AI領(lǐng)域云端算力平臺,提供自主知識產(chǎn)權(quán)的高算力、高能效比、可編程的通用AI訓練和推理產(chǎn)品,可廣泛應(yīng)用于云數(shù)據(jù)中心、超算中心、互聯(lián)網(wǎng)、金融、智慧城市等多個人工智能場景,已在互聯(lián)網(wǎng)、金融、政務(wù)等多家客戶的商業(yè)落地,并獲得認可。


贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港