在線零售業(yè)巨頭亞馬遜已經(jīng)將眾多NP問題嵌套起來,希望搞清楚如何用最少時(shí)間或最低資源投入從全美各處倉庫中提取特定商品交付到買家手中,這需要極高的計(jì)算強(qiáng)度和頻繁的應(yīng)用需求。
亞馬遜旗下云計(jì)算部門亞馬遜云科技于2021年10月,在加利福尼亞理工學(xué)院投資興建了AWS量子計(jì)算中心,希望尋求可行的求解器選項(xiàng)。面對大量有限元分析程序和電磁模擬工具,亞馬遜還決定在GitHub上建立Palace開源項(xiàng)目,并建立相應(yīng)的社區(qū)。
Palace的全稱為Parallel Large Scale Computational Electromagnetics,即大規(guī)模計(jì)算電磁學(xué)。“麥克斯韋奇妙方程”的宏觀形式相信很多人在大學(xué)中已經(jīng)有所接觸,但面向原子水平的微觀形式完全是另一個(gè)世界,而且又是超導(dǎo)量子芯片的設(shè)計(jì)基矗不過AWS別無選擇,為了幫助亞馬遜找到超大規(guī)模場景下的推銷員差旅優(yōu)化之解,同時(shí)將解決成本控制在合理水平,他們必須全力以赴。
AWS已經(jīng)開放一項(xiàng)量子計(jì)算服務(wù),名為Bracket,可供企業(yè)客戶配合現(xiàn)有IonQ、OQC、Rigetti、Xanadu、QuEra等設(shè)備一同使用(但很奇怪,支持清單中沒有出現(xiàn)D-Wave Systems)。母公司亞馬遜肯定已經(jīng)用上了這些設(shè)備,而且鼓勵(lì)A(yù)WS將其以服務(wù)形式開放給用戶,這樣我們所有人都能為亞馬遜的量子計(jì)算探索分?jǐn)傄稽c(diǎn)成本。亞馬遜的戰(zhàn)略意圖一直沒有清晰:正如其認(rèn)定需要CPU SoC層級的創(chuàng)新來改進(jìn)服務(wù)器設(shè)計(jì),包括以Arm架構(gòu)為基礎(chǔ)打造Nitro DPU和Graviton CPU;亞馬遜知道推動(dòng)量子計(jì)算創(chuàng)新的唯一道路,就是設(shè)計(jì)自己的超導(dǎo)量子計(jì)算芯片。
而最終帶來的成果不只是AWS量子處理器,還包括研究員Sebastian Grimberg提出的“超導(dǎo)量子計(jì)算芯片”這個(gè)術(shù)語。目前還不清楚AWS在量子芯片設(shè)計(jì)中采用了怎樣的方法,又獲得了怎樣的成效;唯一可以肯定的,就是對AWS而言現(xiàn)有工具成本過高,根本沒辦法應(yīng)用于大規(guī)模計(jì)算。
AWS高性能計(jì)算(HPC)總經(jīng)理、HPC系統(tǒng)長期用戶兼設(shè)計(jì)師Ian Colle表示,“這是個(gè)非常困難的問題,其中糾錯(cuò)機(jī)制極具挑戰(zhàn)性。我們的量子計(jì)算團(tuán)隊(duì)意識到這一差距的存在,市面上的相關(guān)工具也過于昂貴。所以基于部分開源成果,我們決定向其中引入智能,借此創(chuàng)建出新的、性能更高的工具,有望在規(guī)模求解器上構(gòu)建起量子計(jì)算機(jī)。”
最終誕生的Palace求解器目前可在Arm CPU和x86 CPU上運(yùn)行,但量子計(jì)算中心高級研究科學(xué)家Grimberg表示,Palace所能實(shí)現(xiàn)的不止于電磁模擬,更適用于流體動(dòng)力學(xué)、計(jì)算流體動(dòng)力學(xué)等領(lǐng)域的高復(fù)雜度微分方程。Grimberg擁有斯坦福大學(xué)航空與宇航學(xué)博士學(xué)位,應(yīng)用研究科學(xué)家Hugh Carson則憑借對計(jì)算流體動(dòng)力學(xué)的研究獲得了麻省理工計(jì)算科學(xué)博士學(xué)位。從這個(gè)角度看,亞馬遜應(yīng)該是對計(jì)算流體動(dòng)力學(xué)也抱有興趣。
AWS在博文中展示了Palace的功能,即通過粗細(xì)網(wǎng)格模型模擬和讀取transmon(頻率可調(diào)的諧振器)量子比特,借此實(shí)現(xiàn)物理效應(yīng)仿真。目前我們關(guān)注的是模擬當(dāng)中壁鐘時(shí)間的相互作用,以及用于transmon量子比特及其諧振器模擬的核心數(shù)量。此外,AWS的研究重點(diǎn)還包括Graviton 3(C7g)與Graviton 2(C6g)實(shí)例對基于x86架構(gòu)實(shí)例的模擬,還有如何通過更多核心在有限元模擬中擴(kuò)展自由度。
下圖所示,為1550萬個(gè)自由度的模擬中,為粗網(wǎng)格模型添加更多核心時(shí)的壁鐘時(shí)間與提速因數(shù):
至于對于使用Palace求解器的應(yīng)用程序,Graviton芯片已經(jīng)足以抗衡最新一代至強(qiáng)SPS,但尚不清楚為什么C5N實(shí)例中的“Skylake”至強(qiáng)SP也有類似的性能表現(xiàn)(如圖)。
下圖為具有2.462億個(gè)自由度的較高分辨率模擬,這需要將核心數(shù)量增加了幾千個(gè),整個(gè)運(yùn)行周期也延長到了約12分鐘(粗網(wǎng)格模型為1.4分鐘)。很明顯,15.8倍的自由度提升成本不菲:
為了推動(dòng)Palace穩(wěn)步發(fā)展,AWS量子團(tuán)隊(duì)基于一系列集總元件微波諧振器進(jìn)行了超導(dǎo)超穎材料波導(dǎo)模擬聽不懂沒關(guān)系,熟悉這種艱深概念的話亞馬遜肯定要給各位提供個(gè)崗位了。其基本思路是以1 MHz為增量預(yù)測波導(dǎo)在4 GHz至8 GHz范圍內(nèi)的傳輸特性,并以2.422億個(gè)自由度為起點(diǎn)進(jìn)行縮放測試,單一超穎材料的單一晶格為14億個(gè)自由度,共涉及21個(gè)超穎材料晶格。整個(gè)模擬完全在C6gn Graviton 2實(shí)例中進(jìn)行,總計(jì)200個(gè)實(shí)例可提供最多12800個(gè)核心,如圖所示:
上圖所示為自適應(yīng)和均勻兩種采樣模式,有趣的是Palace求解器確實(shí)能夠在12800個(gè)Graviton 2核心上進(jìn)行擴(kuò)展。據(jù)推測,AWS拿不出足夠的Graviton 3核心來進(jìn)行C7g實(shí)例測試。但如果可以,壁鐘時(shí)間應(yīng)該會有所降低、仍可擴(kuò)展至全部核心、測線陡峭度也相同。
順帶一提,這些測試中使用的實(shí)例是由AWS開發(fā)的ParallelCluster工具設(shè)置的,能夠輕松通過匯聚多個(gè)節(jié)點(diǎn)建立起虛擬MPI集群,從而運(yùn)行Palace求解器。
至于什么時(shí)候才能看到AWS自家原研的量子芯片,暫時(shí)還不得而知,估計(jì)短時(shí)間內(nèi)可能性不大。
Colle總結(jié)道,“我們正努力開發(fā)屬于自己的量子計(jì)算機(jī)。目前我能說的就這么多,只要確定計(jì)劃可行,我們會立即將成果推向市常”