展會(huì)信息港展會(huì)大全

AI 算法、算力與體系結(jié)構(gòu)的進(jìn)步
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-10-15 10:58:49   瀏覽:4369次  

導(dǎo)讀:我們都知道大模型都是由各種算法組成的,那怎么看似簡(jiǎn)單的代碼,如何變成讓人驚艷的智能大腦的?這篇文章,我們來分析下算法、結(jié)構(gòu)的路程和進(jìn)步。 你有沒有想過,AI 是如何從一個(gè)個(gè)看似簡(jiǎn)單的算法,變成了如今無所不能的智能大腦? 算法研究員和工程師不斷設(shè)...

我們都知道大模型都是由各種算法組成的,那怎么看似簡(jiǎn)單的代碼,如何變成讓人驚艷的“智能大腦”的?這篇文章,我們來分析下算法、結(jié)構(gòu)的路程和進(jìn)步。

AI 算法、算力與體系結(jié)構(gòu)的進(jìn)步

你有沒有想過,AI 是如何從一個(gè)個(gè)看似簡(jiǎn)單的算法,變成了如今無所不能的“智能大腦”?

算法研究員和工程師不斷設(shè)計(jì)新的 AI 算法和 AI 模型提升預(yù)測(cè)效果,其預(yù)測(cè)效果不斷取得突破性進(jìn)展。

但是新的算法和模型結(jié)構(gòu),需要 AI 開發(fā)框架提供便于對(duì) AI 范式的編程表達(dá)力和靈活性,對(duì)執(zhí)行性能優(yōu)化有可能會(huì)改變?cè)屑僭O(shè),進(jìn)而產(chǎn)生了對(duì) AI 系統(tǒng)對(duì)于 AI 開發(fā)框架的開發(fā)過程和 AI 編譯器的執(zhí)行過程優(yōu)化提出了新的挑戰(zhàn),因而促進(jìn)了 AI 系統(tǒng)的發(fā)展。

一、精度超越傳統(tǒng)機(jī)器學(xué)習(xí)

以 MNIST 手寫數(shù)字識(shí)別任務(wù)為例,其作為一個(gè)手寫數(shù)字圖像數(shù)據(jù)集,在早期通常用于訓(xùn)練和研究圖像分類任務(wù),由于其樣本與數(shù)據(jù)規(guī)模較小,當(dāng)前也常常用于教學(xué)。

從圖中可以觀察了解到不同的機(jī)器學(xué)習(xí)算法取得的效果以及趨勢(shì):1998 年,簡(jiǎn)單的 CNN 可以接近 SVM 最好效果。

2012 年,CNN 可以將錯(cuò)誤率降低到 0.23% (2012),這樣的結(jié)果已經(jīng)可以和人所達(dá)到的錯(cuò)誤率 0.2% 非常接近。

神經(jīng)網(wǎng)絡(luò)模型在 MNIST 數(shù)據(jù)集上相比傳統(tǒng)機(jī)器學(xué)習(xí)模型的表現(xiàn),讓研究者們看到了神經(jīng)網(wǎng)絡(luò)模型提升預(yù)測(cè)效果的潛力,進(jìn)而不斷嘗試新的神經(jīng)網(wǎng)絡(luò)模型和在更復(fù)雜的數(shù)據(jù)集上進(jìn)行驗(yàn)證。

神經(jīng)網(wǎng)絡(luò)算法在準(zhǔn)確度和錯(cuò)誤率上的效果提升,讓不同應(yīng)用場(chǎng)景上的問題,取得突破進(jìn)展或讓領(lǐng)域研發(fā)人員看到相應(yīng)潛力,是驅(qū)動(dòng)不同行業(yè)不斷投入研發(fā) AI 算法的動(dòng)力。

AI 算法、算力與體系結(jié)構(gòu)的進(jìn)步

二、公開數(shù)據(jù)集上突破

隨著每年 ImageNet 數(shù)據(jù)集上的新模型取得突破,新的神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)和訓(xùn)練方式的潛力。更深、更大的模型結(jié)構(gòu)有潛力提升當(dāng)前預(yù)測(cè)的效果。

1998 年的 Lenet 到 2012 年的 AlexNet,不僅效果提升,模型變大,同時(shí)引入了 GPU 訓(xùn)練,新的計(jì)算層(如 ReLU 等)。

到 2015 年的 Inception,模型的計(jì)算圖進(jìn)一步復(fù)雜,且有新的計(jì)算層被提出。

2015 年 ResNet 模型層數(shù)進(jìn)一步加深,甚至達(dá)到上百層。

到 2019 年 MobileNet3 的 NAS,模型設(shè)計(jì)逐漸朝著自動(dòng)化的方式進(jìn)行設(shè)計(jì),錯(cuò)誤率進(jìn)一步降低到 6.7% 以下。

新的模型不斷在以下方面演化進(jìn)而提升效果:1)更好的激活函數(shù)和層,如 ReLU、Batch Norm 等;2)更深更大的網(wǎng)絡(luò)結(jié)構(gòu)和更多的模型權(quán)重;3)更好的訓(xùn)練技巧: 正則化(Regularization)、初始化(Initialization)、學(xué)習(xí)方法(Learning Methods),自動(dòng)化機(jī)器學(xué)習(xí)與模型結(jié)構(gòu)搜索等。

上述取得更好效果的技巧和設(shè)計(jì),驅(qū)動(dòng)算法工程師與研究員不斷投入,同時(shí)也要求 AI 系統(tǒng)提供新的算子(Operator)支持與優(yōu)化,進(jìn)而驅(qū)動(dòng) AI 開發(fā)框架和 AI 編譯器對(duì)前端、中間表達(dá)和系統(tǒng)算法協(xié)同設(shè)計(jì)的演進(jìn)和發(fā)展。

三、算力與體系結(jié)構(gòu)進(jìn)步

從 1960 年以來,計(jì)算機(jī)性能的增長(zhǎng)主要來自摩爾定律,到二十世紀(jì)初大概增長(zhǎng)了 108 倍。但是由于摩爾定律的停滯,性能的增長(zhǎng)逐漸放緩了。單純靠工藝尺寸的進(jìn)步,無法滿足各種應(yīng)用對(duì)性能的要求。

于是,人們就開始為應(yīng)用定制專用芯片,通過消除通用處理器中冗余的功能部分,來進(jìn)一步提高對(duì)特定應(yīng)用的計(jì)算性能。如圖形圖像處理器 GPU 就對(duì)圖像類算法進(jìn)行專用硬件加速。如圖所示后來出現(xiàn) GPGPU,即通用 GPU,對(duì)適合于抽象為單指令流多數(shù)據(jù)流(SIMD)或者單指令多線程(SIMT)的并行算法與工作應(yīng)用負(fù)載都能起到驚人的加速效果。

AI 算法、算力與體系結(jié)構(gòu)的進(jìn)步

為了更高的性能,近年來 AI 芯片也大放光彩。

其中一個(gè)代表就是谷歌 TPU(Tensor Processing Unit),通過對(duì)深度學(xué)習(xí)模型中的算子進(jìn)行抽象,轉(zhuǎn)換為矩陣乘法或非線性變換,根據(jù)專用負(fù)載特點(diǎn)進(jìn)一步定制流水線化執(zhí)行的脈動(dòng)陣列(Systolic Array),進(jìn)一步減少訪存提升計(jì)算密度,提高了 AI 模型的執(zhí)行性能。

華為騰 NPU(神經(jīng)網(wǎng)絡(luò)處理器)針對(duì)矩陣運(yùn)算專門優(yōu)化設(shè)計(jì),可解決傳統(tǒng)芯片在神經(jīng)網(wǎng)絡(luò)運(yùn)算時(shí)效率低下的問題。

此外,華為達(dá)芬奇架構(gòu)面向 AI 計(jì)算設(shè)計(jì),通過獨(dú)創(chuàng) 3D Cube 設(shè)計(jì),每時(shí)鐘周期可進(jìn)行 4096 次 MAC 運(yùn)算,為 AI 提供強(qiáng)大算力支持。

除了算子層面驅(qū)動(dòng)的定制,AI 層面的計(jì)算負(fù)載本身在算法層常常應(yīng)用的稀疏性和量化等加速手段也逐漸被硬件廠商,根據(jù)通用算子定制到專用加速器中,在專用計(jì)算領(lǐng)域進(jìn)一步協(xié)同優(yōu)化加速。通過定制化硬件,廠商又將處理器性能提升了大約 105 量級(jí)。

然而可惜的是,經(jīng)過這么多年的發(fā)展,雖然處理器性能提升這么多,我們機(jī)器的數(shù)值運(yùn)算能力早已是人類望塵莫及了,AI 芯片內(nèi)部執(zhí)行的程序代碼仍然是人類指定的固定代碼,智能程度還遠(yuǎn)遠(yuǎn)不及生物大腦。從智力程度來說,大約也就只相當(dāng)于嚙齒動(dòng)物,距離人類還有一定距離。

可以看到隨著硬件的發(fā)展,雖然算力逐漸逼近人腦,讓 AI 取得了突破。

但是我們也看到,算力還是可能在短期內(nèi)成為瓶頸,那么 AI 系統(tǒng)的性能下一代的出路在哪?

我們?cè)诤竺鏁?huì)看到,除了單獨(dú)芯片的不斷迭代進(jìn)行性能放大(Scale Up),系統(tǒng)工程師不斷設(shè)計(jì)更好的分布式計(jì)算系統(tǒng)將計(jì)算并行,來達(dá)到向外擴(kuò)展(Scale Out),同時(shí)發(fā)掘深度學(xué)習(xí)的作業(yè)特點(diǎn),如稀疏性等通過算法,系統(tǒng)硬件協(xié)同設(shè)計(jì),進(jìn)一步提升計(jì)算效率和性能。

本文由 @章魚AI小丸子 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港