展會信息港展會大全

突破馮諾依曼架構(gòu)瓶頸,阿里達摩院的新芯片可滿足AI極致要求
來源:互聯(lián)網(wǎng)   發(fā)布日期:2021-12-07 12:04:36   瀏覽:21887次  

導(dǎo)讀:說到馮諾依曼架構(gòu),可以這么矛盾地認為,它既是一切現(xiàn)代計算機的基礎(chǔ),又是現(xiàn)代計算機難以繞開的桎梏。雖然馮諾依曼架構(gòu)開啟了計算機系統(tǒng)結(jié)構(gòu)的先河,為我們的計算機科技發(fā)展發(fā)揮了不可磨滅的作用,不過隨著時代發(fā)展,這個架構(gòu)的局限也越來越難以滿足我們不...

說到馮諾依曼架構(gòu),可以這么矛盾地認為,它既是一切現(xiàn)代計算機的基礎(chǔ),又是現(xiàn)代計算機難以繞開的桎梏。雖然馮諾依曼架構(gòu)開啟了計算機系統(tǒng)結(jié)構(gòu)的先河,為我們的計算機科技發(fā)展發(fā)揮了不可磨滅的作用,不過隨著時代發(fā)展,這個架構(gòu)的局限也越來越難以滿足我們不斷增長的需要,因此改良或突破固有架構(gòu)就成了一個關(guān)鍵的問題。而這次,阿里巴巴達摩院出手了。近日,阿里巴巴達摩院(以下簡稱阿里達摩院)宣布成功研發(fā)一款新型存算一體架構(gòu)芯片。

據(jù)介紹,該芯片是全球首款基于DRAM的3D鍵合堆疊存算一體AI芯片,可突破馮諾依曼架構(gòu)的性能瓶頸,滿足人工智能等場景對高帶寬、高容量內(nèi)存和極致算力的需求。在特定AI場景中,該芯片性能提升10倍以上,能效比提升高達300倍。

數(shù)據(jù)是冷的,不過概念卻是很有突破性的。要知道,這可是馮諾依曼架構(gòu)啊,是目前計算機系統(tǒng)的基礎(chǔ),而AI的發(fā)展有點太快,傳統(tǒng)計算機系統(tǒng)架構(gòu)越來越難以滿足了。所以只有突破了這個基礎(chǔ),現(xiàn)代人工智能的算力才會跟著提升上去,否則我們會一直受困于功耗墻內(nèi)存墻這些打破不了的局限。

于是阿里達摩院的存算一體芯片應(yīng)運而生。據(jù)了解,這款芯片有些類似于我們的大腦,它將數(shù)據(jù)存儲單元和計算單元融合為一體,猶如都在記憶和分析判斷都在腦海中執(zhí)行,這樣就大幅減少數(shù)據(jù)搬運,從而極大提高計算并行度和能效。

當(dāng)然了,業(yè)內(nèi)普遍存在的問題,一定是業(yè)內(nèi)共同的難題,雖然阿里達摩院此次的新芯片解決了一直以來重大的問題,但并不能說她一騎絕塵,從概念到研究都是全新的。因為,實現(xiàn)存算一體是上個世紀90年代就由業(yè)內(nèi)人士提出了,只是技術(shù)的復(fù)雜度、高昂的設(shè)計成本,以及缺少應(yīng)用場景等因素沒有進展。

此次阿里達摩院自研創(chuàng)新取得的進展,是采用近存儲計算這一技術(shù)方案展開的。首次采用混合鍵合(Hypid Bonding)的 3D 堆疊技術(shù)將計算芯片和存儲芯片 face-to-face 地用特定金屬材質(zhì)和工藝進行互聯(lián)。在設(shè)計方面,該芯片內(nèi)存單元采用異質(zhì)集成嵌入式 DRAM,擁有超大內(nèi)存容量和帶寬優(yōu)勢,相比傳統(tǒng) SRAM 獲得了數(shù)量級上的提升,片上內(nèi)存帶寬可高達 37.5GB/s/mm2。計算芯片方面,達摩院研發(fā)設(shè)計了流式的定制化加速器架構(gòu),對推薦系統(tǒng)進行「端到端」加速,包括匹配、粗排序、神經(jīng)網(wǎng)絡(luò)計算、細排序等任務(wù)。

上面一段話可能更硬核技術(shù)一些,不過看看阿里達摩院這些研究取得的認可,也許我們就能直觀一點感覺到這一項突破的重要性和意義所在了吧。機智客摘自相關(guān)資訊,此次研究成果已被即將在明年2月舉行的IEEE國際固態(tài)電路頂級會議ISSCC 2022收錄。在存算一體架構(gòu)方向上已擁有大量成果,在ISCA、MICRO、HPCA等頂級計算機體系結(jié)構(gòu)會議上發(fā)表多篇論文。


贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港