量子計算機(jī)上的機(jī)器學(xué)習(xí),也就是量子神經(jīng)網(wǎng)絡(luò)(QNN),有許多傳統(tǒng)神經(jīng)網(wǎng)絡(luò)望塵莫及的潛力,比如量子數(shù)據(jù)分析。
然而許多QNN架構(gòu),沒法對大型問題進(jìn)行訓(xùn)練,因為它們都存在著“貧瘠高原”(barren plateau),也就是隨系統(tǒng)規(guī)模增大梯度呈指數(shù)級消失的問題。
這無疑當(dāng)頭一盆冷水。
克服不了這個問題,就沒法挖掘量子計算機(jī)在人工智能應(yīng)用中的全部潛力。
好在,來自美國阿拉莫斯實驗室(LANL)的科學(xué)家經(jīng)過分析發(fā)現(xiàn),最新提出的量子卷積神經(jīng)網(wǎng)絡(luò) (QCNN),不會出現(xiàn)梯度消失!
這一發(fā)現(xiàn)無疑具有巨大的突破性,可以為量子人工智能在材料發(fā)現(xiàn)等應(yīng)用的研究之路清除障礙。
不存在梯度消失問題的量子卷積神經(jīng)網(wǎng)絡(luò)
先來看看什么是量子卷積神經(jīng)網(wǎng)絡(luò)。
它由哈佛大學(xué)于2019年提出,是一種特殊的量子神經(jīng)網(wǎng)絡(luò),涉及一系列卷積層和池化層交錯,在保留相關(guān)數(shù)據(jù)特征信息的同時減少了量子比特的數(shù)量。
QCNN可用于糾錯、量子相位檢測和圖像識別等方面。
△ QCNN概念圖
來自阿拉莫斯實驗室的研究人員一直在研究如何減輕量子神經(jīng)網(wǎng)絡(luò)中“貧瘠高原”的影響,但一直缺乏完全規(guī)避該問題的方法。
ps.之所以在量子計算機(jī)中叫“貧瘠高原”,是因為它和普通神經(jīng)網(wǎng)絡(luò)中的梯度消失還不能說是完全一模一樣。
“貧瘠高原”是指當(dāng)量子計算機(jī)的比特數(shù)目較大時,當(dāng)前量子神經(jīng)網(wǎng)絡(luò)的框架很容易變得無法有效進(jìn)行訓(xùn)練,其目標(biāo)函數(shù)會變得很平,導(dǎo)致梯度太低難以繼續(xù)訓(xùn)練。
回到此項研究,這次研究人員針對以下兩個假設(shè)嚴(yán)格分析了QCNN成本函數(shù)梯度的scaling:
(1) QCNN中的所有2-qubit單元形成獨立不相關(guān)的2-designs(用低深度量子電路可輕松滿足);
(2)成本函數(shù)相對于輸入密度矩陣是線性的。
最終,在這兩個假設(shè)下,他們證明了成本函數(shù)偏導(dǎo)數(shù)的方差隨著系統(tǒng)大小消失的速度并不比多項式快。
這意味著成本函數(shù)landscape中不會表現(xiàn)出“貧瘠高原”,因此QCNN體系結(jié)構(gòu)可以在參數(shù)的隨機(jī)初始化下進(jìn)行訓(xùn)練這可是許多QNN體系結(jié)構(gòu)都不能做到的。
ps.證明過程采用了一種新的圖形表示方法,也涉及了較復(fù)雜的推導(dǎo),感興趣的可以查看論文。
研究人員表示,這樣的QCNN是可以短期內(nèi)實現(xiàn)量子計算機(jī)機(jī)器學(xué)習(xí)優(yōu)勢的候選框架。
具體的例子比如,將陶瓷材料作為高溫超導(dǎo)體改善磁懸浮列車等無摩擦運輸時,需要篩選給定材料各種狀態(tài)的大量相(phase)數(shù)據(jù)集,并將這些狀態(tài)與相位關(guān)聯(lián),以確定高溫超導(dǎo)的最佳狀態(tài)。
但這種事情普通計算機(jī)上的神經(jīng)網(wǎng)絡(luò)根本沒法做到,而量子神經(jīng)網(wǎng)絡(luò)在未來就可以。