展會(huì)信息港展會(huì)大全

國產(chǎn)邊緣AI芯片落地人工智能領(lǐng)域風(fēng)向
來源:互聯(lián)網(wǎng)   發(fā)布日期:2021-10-13 16:35:19   瀏覽:19476次  

導(dǎo)讀:如今,由于物聯(lián)網(wǎng)的興起造成了數(shù)據(jù)沖擊,對重要物聯(lián)網(wǎng)傳感器數(shù)據(jù)的處理越來越接近數(shù)據(jù)最初所在的位置,便有了對基于邊緣計(jì)算的機(jī)器學(xué)習(xí)技術(shù)的需求。這兩年,人工智能發(fā)展的主題已經(jīng)非常明確,就是落地應(yīng)用。在眾多的AI技術(shù)當(dāng)中,無論是上層的算法應(yīng)用,還是...

如今,由于物聯(lián)網(wǎng)的興起造成了數(shù)據(jù)沖擊,對重要物聯(lián)網(wǎng)傳感器數(shù)據(jù)的處理越來越接近數(shù)據(jù)最初所在的位置,便有了對基于邊緣計(jì)算的機(jī)器學(xué)習(xí)技術(shù)的需求。這兩年,人工智能發(fā)展的主題已經(jīng)非常明確,就是落地應(yīng)用。在眾多的AI技術(shù)當(dāng)中,無論是上層的算法應(yīng)用,還是產(chǎn)品,最終都依賴于底層算力的保障,也就是AI芯片。

邊緣AI市場落地風(fēng)向

從去年起,邊緣AI市場已經(jīng)進(jìn)入爆發(fā)期,AIoT終端數(shù)量已經(jīng)超越智能手機(jī)。從AI落地的場景來看,AI芯片的兩大工作負(fù)載主要是數(shù)據(jù)訓(xùn)練和推理計(jì)算。其中,推理計(jì)算市場份額的增速正在趕超數(shù)據(jù)訓(xùn)練市常

現(xiàn)在一個(gè)算法模型能做到僅僅2KB,性能表現(xiàn)卻超過4MB的神經(jīng)網(wǎng)絡(luò)算法。深度學(xué)習(xí)算法的微型化改變表明以GPT-3為代表的超大型模型并不適用于企業(yè)級(jí)市常

在新的物聯(lián)網(wǎng)框架中,數(shù)據(jù)在設(shè)備本地就可以得到處理。這需要在底層芯片設(shè)計(jì)上就考慮好算法模型在不同場景中有限的部署條件,包括算力、功耗和硅片面積的分配。從單位算力的成本效用上看,推理計(jì)算更能代表企業(yè)級(jí)市場所需要的落地方向。

邊緣AI芯片落地挑戰(zhàn)

首先就是邊緣AI的場景呈多元化,不同場景對芯片的功耗和性能要求都有差異。而另一方面,碎片化場景的市場容量具有不確定性,需要在芯片研發(fā)的工程成本和收益之間取得平衡,這是所有芯片廠商都需要面對的考驗(yàn)。

高質(zhì)量數(shù)據(jù)的獲取同樣是一大難點(diǎn),即如何從大數(shù)據(jù)中篩選可靠的數(shù)據(jù)。大數(shù)據(jù)不意味著高質(zhì)量的數(shù)據(jù),在AI芯片上執(zhí)行深度學(xué)習(xí)任務(wù)需要硬件傳感器的持續(xù)優(yōu)化。

另外對于傳統(tǒng)客戶而言,除了智能產(chǎn)品的采購成本外,還有使用成本。芯片的功耗,產(chǎn)品是否易于部署,都影響著AI的落地和推廣。芯片廠商如何根據(jù)不同的場景定制不同算力的芯片也是落地環(huán)節(jié)上的痛點(diǎn)。

目前邊緣AI芯片缺乏高可用的開發(fā)平臺(tái),軟件編譯工具設(shè)計(jì)復(fù)雜,用戶的開發(fā)和使用門檻偏高,但這些可預(yù)見都會(huì)在落地過程中不斷完善和迭代。

商用邊緣AI芯片

旭日系列

面向AIoT,地平線推出了旭日系列邊緣AI芯片。通過IC設(shè)計(jì)和軟件的共同努力,實(shí)現(xiàn)了性能、功耗、靈活性和成本之間的平衡。旭日2邊緣AI芯片采用BPU伯努利1.0 架構(gòu),可提供 4TOPS等效算力,對多類目標(biāo)進(jìn)行實(shí)時(shí)檢測和精準(zhǔn)識(shí)別。旭日2集成了Dual-Cortex A53,能高效支持多種主流AI任務(wù)。同時(shí)還支持EMCC、SPI Flash。

旭日3則是地平線推出的,主打低功耗和高性能的全新一代AIoT邊緣AI芯片。其集成了地平線最先進(jìn)的伯努利2.0架構(gòu)AI引擎( BPU),可提供5TOPS的等效算力。

新的BPU架構(gòu)極大提升了對先進(jìn)CNN網(wǎng)絡(luò)架構(gòu)的支持效果,以及極大降低了AI運(yùn)算對DDR帶寬的占用率。輔以地平線天工開物AI開發(fā)平臺(tái),極大簡化算法開發(fā)與部署過程,降低AI產(chǎn)品的落地成本。

伯努利2.0 BPU結(jié)構(gòu)下,DDR Utilization 呈5倍提升。先進(jìn)的ISP處理算法,使得在寬動(dòng)態(tài)、低照度場景下,也能得到1200 w pixel高質(zhì)量的圖像。旭日3可同時(shí)處理不同分辨率4 ~ 8個(gè)Camera Sensor的輸入,并支持多種圖像后處理,同時(shí)支持 H.264 / H.265 編解碼,性能達(dá)到4K@60fps 。

(旭日3)

勘智K210 /K510

第一代芯片勘智K210專門針對機(jī)器視覺任務(wù)設(shè)計(jì),浮點(diǎn)計(jì)算能力可以達(dá)到1.28TFLOPS,可以媲美嵌入式領(lǐng)域主流的開發(fā)選擇。同時(shí),它的功耗只有0.3W,典型工作場景的功耗小于1W,單位算力功耗低,是一款非常經(jīng)濟(jì)的選擇。第二代勘智K510根據(jù)實(shí)際的落地情況和客戶反饋進(jìn)行升級(jí)。這款I(lǐng)P內(nèi)核重新進(jìn)行架構(gòu)設(shè)計(jì),實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)中不同層級(jí)對計(jì)算資源、存儲(chǔ)和帶寬的需求,并且提升數(shù)據(jù)的復(fù)用率,降低芯片功耗。

其次,針對數(shù)據(jù)獲取的速度和質(zhì)量,勘智K510配置了全新的視覺模組。與第一代芯片相比,K510在幀率和外設(shè)方面都有大幅優(yōu)化。每T算力幀率達(dá)到業(yè)內(nèi)領(lǐng)先水平。此外,K510還支持浮點(diǎn) BF16 計(jì)算,在不適合進(jìn)行模型量化的場景相比同類產(chǎn)品更具優(yōu)勢。

(Video subsystem示意圖)

小結(jié)


贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港