芯東西(公眾號:aichip001)
作者 | 心緣
編輯 | 漠影
芯東西1月27日報(bào)道,剛剛,NVIDIA公布通過NVIDIA認(rèn)證系統(tǒng)測試的全球首批加速服務(wù)器,它們是目前業(yè)內(nèi)唯一通過現(xiàn)代工作負(fù)載測試的服務(wù)器,可用于機(jī)器學(xué)習(xí)和分析。
通過NVIDIA認(rèn)證系統(tǒng)的產(chǎn)品將帶有NVIDIA認(rèn)證系統(tǒng)標(biāo)識,從而可證明這些系統(tǒng)符合NVIDIA最佳設(shè)計(jì)范例。這些系統(tǒng)通過使用NVIDIA Mellanox網(wǎng)絡(luò)連接的NVIDIA最新GPU為AI提速。
戴爾科技、技嘉、慧與、浪潮和超微的認(rèn)證服務(wù)器均于今日供貨。
一、企業(yè)AI使用量倍增
根據(jù)Gartner,目前37%的企業(yè)機(jī)構(gòu)在生產(chǎn)中使用了AI,預(yù)計(jì)到2024年這一比例將翻倍至75%。
例如,美國運(yùn)通用最新AI模型進(jìn)行實(shí)時欺詐檢測;福特用生成式對抗網(wǎng)絡(luò)(GAN)生成測試自動駕駛汽車所需的數(shù)據(jù);達(dá)美樂用AI改進(jìn)其每年30億份披薩訂單完成時間的預(yù)測;還有很多企業(yè)將AI用在零售、物流、銀行、醫(yī)療健康等行業(yè)。
隨著領(lǐng)先企業(yè)更多引入AI技術(shù),對用于處理AI工作負(fù)載的服務(wù)器系統(tǒng)的需求日益迫切。
NVIDIA認(rèn)證系統(tǒng)提供企業(yè)AI所需的性能、可編程性和安全吞吐量。這些系統(tǒng)結(jié)合了基于NVIDIA Ampere架構(gòu)的GPU計(jì)算力與安全、高速的NVIDIA Mellanox網(wǎng)絡(luò)。
為了通過認(rèn)證,這些系統(tǒng)必須接受廣泛的工作負(fù)載測試,涵蓋從需要多個計(jì)算節(jié)點(diǎn)的工作到只需要使用單個GPU部分性能的任務(wù)等。
二、首批NVIDIA認(rèn)證系統(tǒng)測試的服務(wù)器系統(tǒng)
首批使用NVIDIA A100 Tensor Core GPU的系統(tǒng)包括:
(1)戴爾EMC PowerEdge R7525和R740機(jī)架服務(wù)器;
(2)技嘉R281-G30、R282-Z96、G242-Z11、G482-Z54、G492-Z51系統(tǒng);
(3)慧與Apollo 6500 Gen10系統(tǒng)和慧與 ProLiant DL380 Gen10服務(wù)器;
(4)浪潮 NF5488A5;
(5)超微A+服務(wù)器AS-4124GS-TNR和AS-2124GQ-NART。
這些產(chǎn)品均帶有NVIDIA認(rèn)證系統(tǒng)標(biāo)識,證明其符合NVIDIA最佳設(shè)計(jì)范例,同時也代表它們可以處理機(jī)器學(xué)習(xí)、數(shù)據(jù)分析等領(lǐng)域最棘手的任務(wù)。
三、可使用和全球最強(qiáng)AI計(jì)算機(jī)相同的軟硬件
這些系統(tǒng)均經(jīng)過優(yōu)化,可以運(yùn)行NVIDIA GPU優(yōu)化應(yīng)用中心NGC目錄中的AI應(yīng)用。
NGC是一個不斷擴(kuò)大的軟件開發(fā)套件中心,這些套件可以將AI引入醫(yī)療健康(Clara)和機(jī)器人(Isaac)等垂直市常此外,它還包含幫助企業(yè)在推薦系統(tǒng)(Merlin)和智能視頻分析(Metropolis)等新興用例中起步的框架。
具體而言,NVIDIA認(rèn)證系統(tǒng)必須通過深度學(xué)習(xí)訓(xùn)練和推理、機(jī)器學(xué)習(xí)算法、智能視頻分析、網(wǎng)絡(luò)和存儲卸載等測試。
這些測試基于現(xiàn)實(shí)世界的用例,使用NGC目錄中常用的AI框架和容器。因此通過NVIDIA認(rèn)證系統(tǒng),每家公司均可使用和全球最強(qiáng)大AI計(jì)算機(jī)背后相同的軟硬件。
據(jù)悉,全球最大的云服務(wù)提供商和全球十大超級計(jì)算機(jī)中的八臺均由NVIDIA技術(shù)驅(qū)動。此外,采用NVIDIA技術(shù)的系統(tǒng)在MLPerf等AI基準(zhǔn)測試中領(lǐng)先。
結(jié)語:近70個系統(tǒng)已參與NVIDIA認(rèn)證系統(tǒng)計(jì)劃
NVIDIA認(rèn)證系統(tǒng)包括功能強(qiáng)大的數(shù)據(jù)中心服務(wù)器,內(nèi)置多達(dá)8個A100 GPU和高速InfiniBand或以太網(wǎng)網(wǎng)卡。此外,還有為在企業(yè)網(wǎng)絡(luò)邊緣運(yùn)行AI而量身定制的主流AI系統(tǒng)。
OEM廠商對使用NVIDIA Mellanox電纜、交換機(jī)和網(wǎng)卡(如ConnectX-6 InfiniBand或以太網(wǎng)網(wǎng)卡和BlueField-2 DPU)的系統(tǒng)進(jìn)行認(rèn)證。這些網(wǎng)卡既能同時保證低延遲與高吞吐量,還支持從啟動時的硬件信任根,到應(yīng)用連接追蹤等多層網(wǎng)絡(luò)安全措施。
所有使用NVIDIA Mellanox 8700 HDR 200G InfiniBand交換機(jī)或Mellanox SN3700以太網(wǎng)交換機(jī)的系統(tǒng)均已獲得認(rèn)證。
另外,所有NVIDIA認(rèn)證系統(tǒng)均可提供涵蓋整個軟件堆棧的企業(yè)級支持,包括對開源代碼的支持。
截至目前,來自6家系統(tǒng)制造商的14臺服務(wù)器已通過認(rèn)證,以提供加速計(jì)算。至少有11家系統(tǒng)制造商的近70個系統(tǒng)參與了這一認(rèn)證計(jì)劃。