展會信息港展會大全

英特爾實現(xiàn)光學(xué)I/O芯粒的完全集成,有望革新高速數(shù)據(jù)處理
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-06-27   瀏覽:526次  

導(dǎo)讀:英特爾在用于高速數(shù)據(jù)傳輸?shù)墓韫饧杉夹g(shù)上取得了突破性進(jìn)展。在2024年光纖通信大會(OFC)上,英特爾硅光集成解決方案(IPS)團(tuán)隊展示了業(yè)界領(lǐng)先的、完全集成的OCI(光學(xué)計算互連)芯粒,該芯粒與英特爾CPU封裝在一起,運行真實數(shù)據(jù)。面向數(shù)據(jù)中心 ......

英特爾在用于高速數(shù)據(jù)傳輸?shù)墓韫饧杉夹g(shù)上取得了突破性進(jìn)展。在2024年光纖通信大會(OFC)上,英特爾硅光集成解決方案(IPS)團(tuán)隊展示了業(yè)界領(lǐng)先的、完全集成的OCI(光學(xué)計算互連)芯粒,該芯粒與英特爾CPU封裝在一起,運行真實數(shù)據(jù)。面向數(shù)據(jù)中心和HPC應(yīng)用,英特爾打造的OCI芯粒在新興AI基礎(chǔ)設(shè)施中實現(xiàn)了光學(xué)I/O(輸入/輸出)共封裝,從而推動了高帶寬互連技術(shù)創(chuàng)新。

英特爾硅光集成解決方案團(tuán)隊產(chǎn)品管理與戰(zhàn)略高級總監(jiān)Thomas Liljeberg表示:“服務(wù)器之間的數(shù)據(jù)傳輸正在不斷增加,當(dāng)今的數(shù)據(jù)中心基礎(chǔ)設(shè)施難堪重負(fù)。目前的解決方案正在迅速接近電氣I/O性能的實際極限。然而,借助英特爾的這項突破性進(jìn)展,客戶能夠?qū)⒐韫夤卜饣ミB方案無縫集成到下一代計算系統(tǒng)中。英特爾的OCI芯粒大大提高了帶寬、降低了功耗并延長了傳輸距離,有助于加速機器學(xué)習(xí)工作負(fù)載,進(jìn)而推動高性能AI基礎(chǔ)設(shè)施創(chuàng)新!

該OCI芯粒可在在最長可達(dá)100米的光纖上,單向支持64個32Gbps 通道,有望滿足AI基礎(chǔ)設(shè)施日益增長的對更高帶寬、更低功耗和更長傳輸距離的需求。它將有助于實現(xiàn)可擴展的CPU和GPU集群連接,和包括一致性內(nèi)存擴展及資源解聚的新型計算架構(gòu)。

AI應(yīng)用正在全球范圍內(nèi)被越來越多地部署,近期大語言模型和生成式AI的發(fā)展正在加速這一趨勢。對AI負(fù)載加速新需求而言,更大、更高效的機器學(xué)習(xí)模型將發(fā)揮關(guān)鍵作用。未來的計算平臺需要面向AI實現(xiàn)擴展,因而需要指數(shù)級提升的I/O帶寬和更長的傳輸距離,以支持更大規(guī)模的處理器(CPU、GPU和IPU)集群,和資源利用更高效的架構(gòu),如xPU解聚和內(nèi)存池化(memory

pooling)。

電氣I/O(即銅跡線連接)帶寬密度高且功耗低,但傳輸距離短至不超一米。數(shù)據(jù)中心和早期AI集群中使用的可插拔光收發(fā)器模塊可以延長傳輸距離,但就AI工作負(fù)載的擴展需求而言,其成本和功耗不可持續(xù)。xPU光電共封I/O解決方案 可以在提高能效比、降低延遲和延長傳輸距離的同時,支持更高的帶寬,從而滿足AI和機器學(xué)習(xí)基礎(chǔ)設(shè)施的擴展需求。

打個比方,在CPU和GPU中,用光學(xué)I/O取代電氣I/O進(jìn)行數(shù)據(jù)傳輸,就好比從使用馬車(容量和距離有限)到使用小汽車和卡車來配送貨物(數(shù)量更大、距離更遠(yuǎn))。英特爾的OCI芯粒等光學(xué) I/O 解決方案,在性能和能耗方面實現(xiàn)了這一水平的提升,從而有助于AI的擴展。

英特爾實現(xiàn)光學(xué)I/O芯粒的完全集成,有望革新高速數(shù)據(jù)處理英特爾OCI(光學(xué)計算互連)芯粒

在完全集成的OCI芯粒中,英特爾利用了已實際驗證的硅光子技術(shù),集成了包含片上激光器的硅光子集成電路(PIC)、光放大器和電子集成電路。在2024年光纖通信大會上,英特爾展示了與自家CPU封裝在一起的OCI芯粒,但它也能與下一代CPU、GPU、IPU等SOC(系統(tǒng)級芯片)集成。

這一完全集成的OCI芯粒的雙向數(shù)據(jù)傳輸速度達(dá)4 Tbps,并兼容第五代PCIe。在2024年光纖通信大會現(xiàn)場,實時光學(xué)鏈路演示展示了通過單模光纖(SMF)跳線(patch cord)在兩個CPU平臺之間實現(xiàn)的發(fā)射器(Tx)和接收器(Rx)互連。CPU生成并測量了比特誤碼率(BER)。英特爾還展示了發(fā)射器的光譜(optical spectrum),包括單一光纖上200GHz間隔的八個波長,以及32Gbps發(fā)射器眼圖(eye diagram),表明信號質(zhì)量很強。

該芯粒目前單向支持64個32Gbps 通道,傳輸距離達(dá)100米(由于傳輸延遲,實際應(yīng)用中距離可能僅限幾十米)。它采用8對光纖,每根8波長密集波分復(fù)用(DWDM)。這種共封裝解決方案也非常節(jié)能,功耗僅為每比特5皮焦耳(pJ),而可插拔光收發(fā)器模塊的功耗大約為每比特15皮焦耳。對數(shù)據(jù)中心和HPC環(huán)境而言,超高的能效十分重要,有助于解決AI應(yīng)用的高能耗問題,提高可持續(xù)性。

英特爾研究院在硅光子領(lǐng)域已深耕超過25年,是硅光集成的開拓者和領(lǐng)導(dǎo)者。英特爾在業(yè)內(nèi)率先開發(fā)并向大型云服務(wù)提供商批量交付硅光子連接器件,這些產(chǎn)品具有領(lǐng)先的可靠性。

英特爾的主要差異化優(yōu)勢在于其直接集成技術(shù),結(jié)合晶圓上激光器混合集成技術(shù),可提高良率并降低成本。這一獨特的方法使英特爾能夠在實現(xiàn)卓越性能的同時保持高能效比。依托強大的量產(chǎn)平臺,英特爾已出貨超過800萬個硅光子集成電路,包含多達(dá)3200萬個片上集成激光器,時基故障率(FIT)小于0.1。時基故障率是一種廣泛使用的測量可靠性的方法,體現(xiàn)了故障率和發(fā)生故障的次數(shù)。

這些硅光子集成電路被封裝在可插拔收發(fā)器模塊中,部署于超大規(guī)模云服務(wù)提供商的大型數(shù)據(jù)中心網(wǎng)絡(luò)中,用于傳輸速率需求高達(dá)100、200和400 Gbps的應(yīng)用。面向傳輸速率需求達(dá)800 Gbps和1.6 Tbps的新興應(yīng)用,速度達(dá)200G/通道的硅光子集成電路正在開發(fā)中。

英特爾還正在探索新的硅光子制造工藝節(jié)點,該節(jié)點具有先進(jìn)的器件性能、更高的密度、更好的耦合性,并能大幅提高經(jīng)濟(jì)性。英特爾將繼續(xù)在片上激光器和性能、成本(芯片面積減少 40% 以上)和功耗(減少 15% 以上)等方面取得進(jìn)步。

英特爾研發(fā)的OCI芯粒目前尚處于技術(shù)原型(prototype)階段。英特爾正在與客戶合作,開發(fā)共封OCI和客戶SoC,作為光學(xué)I/O的解決方案。

英特爾的OCI芯粒推動了高速數(shù)據(jù)傳輸技術(shù)的進(jìn)步。隨著AI基礎(chǔ)設(shè)施的不斷發(fā)展,英特爾將繼續(xù)推動前沿技術(shù)創(chuàng)新,探索面向未來的連接技術(shù)。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港