機(jī)器之心報(bào)道
演講:任化龍
編輯:杜偉
近日,在 2022 WAIC AI 開發(fā)者日上,憶海原識(shí)創(chuàng)始人兼 CEO 任化龍發(fā)表主題演講《類腦計(jì)算的發(fā)展與關(guān)鍵技術(shù)》。演講中,他夯實(shí)細(xì)致地介紹了類腦智能的特點(diǎn)以及與傳統(tǒng)技術(shù)的對(duì)比,以及憶海原識(shí)自主研發(fā)的 Ocean 類腦計(jì)算平臺(tái)。
以下為任化龍的演講內(nèi)容,機(jī)器之心進(jìn)行了不改變?cè)獾木庉、整理?/p>
憶海原識(shí)專注于靈巧手和類腦智能,推動(dòng)機(jī)器人產(chǎn)業(yè)賦能生活服務(wù)和工業(yè)生產(chǎn),解放人類的生產(chǎn)力。
憶海原識(shí)團(tuán)隊(duì)起源于 2007 年,當(dāng)時(shí)在研發(fā)靈巧手本體,后來(lái)發(fā)現(xiàn)智能才是機(jī)器人最大的瓶頸。于是任化龍選擇去斯坦福深造,卻發(fā)現(xiàn)所學(xué)傳統(tǒng)智能技術(shù)存在明顯理論短板。
人工智能的突破口在哪里?答案就在人腦,不需向外索求。
深度學(xué)習(xí)已經(jīng)遇到瓶頸
不可否認(rèn),人工智能發(fā)展至今已取得矚目成就,在計(jì)算機(jī)視覺、計(jì)算機(jī)聽覺、自然語(yǔ)言處理、自動(dòng)駕駛等領(lǐng)域都已獲商業(yè)應(yīng)用,但每個(gè)領(lǐng)域也尚存不少短板。
計(jì)算機(jī)視覺方面,目前以深度學(xué)習(xí)為主。深度學(xué)習(xí)采用數(shù)學(xué)優(yōu)化作為內(nèi)核,需要大量樣本訓(xùn)練,泛化能力較弱,不能對(duì)事物、情景抽象概括理解,例如不能理解左圖中奧巴馬的搞笑舉動(dòng)。
計(jì)算機(jī)聽覺方面,假設(shè)在一個(gè)非常嘈雜的雞尾酒會(huì)上,很多人在說(shuō)話,夾雜著觥籌交錯(cuò)的酒杯聲。那么,你怎么主動(dòng)選擇聽哪個(gè)聲音呢?這就是主動(dòng)注意力。還有像人的說(shuō)話、唱歌有音色和音調(diào),甚至說(shuō)話過(guò)程中有語(yǔ)氣等,這些為傳統(tǒng)智能技術(shù)所忽略。
至于服務(wù)機(jī)器人,目前缺少靈巧的手,所以沒辦法進(jìn)行靈巧操作。而運(yùn)動(dòng)規(guī)劃仍需要給定軌跡或者給出精確的目標(biāo)坐標(biāo)(X、Y、Z)。機(jī)器人無(wú)法自己進(jìn)行決策,也不具備像人一樣的情景記憶。
自動(dòng)駕駛就更不用說(shuō)了,在封閉場(chǎng)景還好,但是到了開放環(huán)境仍然面臨一系列挑戰(zhàn),包括可解釋性和魯棒性較弱、復(fù)雜路況下適應(yīng)能力弱、需要大量重復(fù)訓(xùn)練但性能提高有限等。
可見,目前人工智能感知能力有限,更不要說(shuō)認(rèn)知能力,深度學(xué)習(xí)確實(shí)遇到了瓶頸。
從生物腦到類腦計(jì)算
前面提到了好多次認(rèn)知,那什么是認(rèn)知呢?我先拋出一個(gè)問題,誰(shuí)還能記得上一個(gè)演講的全部?jī)?nèi)容、全部畫面,甚至每一句話?大家應(yīng)該記不得了,因?yàn)槿瞬⒉皇窍駭z像頭一樣把每一段情景都錄下來(lái)。
但是如果讓你總結(jié)概括,是不是可以呢?比如你可以用少于 10 句話去概括,甚至可以進(jìn)一步精簡(jiǎn)到用一句話概括。這就是認(rèn)知。學(xué)習(xí)和記憶、抽象和歸納就是人有的認(rèn)知,這些對(duì)于機(jī)器人以及計(jì)算機(jī)來(lái)說(shuō)仍然非常困難。
人腦的認(rèn)知行為是非常靈活的,比如下圖中五官的位置關(guān)系是怎樣的,是不是已經(jīng)錯(cuò)亂了,沒有準(zhǔn)確的順序?再看它的色調(diào)和紋理,跟真實(shí)的人臉也有區(qū)別嗎?那么我們把它識(shí)別成什么呢?
如果從這幅畫的作者來(lái)講,我們知道它是畢加索的一副名畫;從內(nèi)容上講,我們知道這是一張扭曲的人臉。如果想要識(shí)別它扭曲在哪里,可能是鼻子和眼睛的位置是錯(cuò)亂的。所以,我們對(duì)任何一個(gè)確定的輸入,識(shí)別理解成什么樣取決于認(rèn)知需要。這種多元化的解讀就是人腦的認(rèn)知所帶來(lái)的靈活性,這些也是目前人工智能所不具備的。
人工智能怎么突破前述瓶頸呢?天地宇宙賦予我們?nèi)松,古人通過(guò)內(nèi)觀發(fā)現(xiàn)人的身體有氣脈,因而發(fā)展出了中醫(yī),而人的大腦是目前唯一的通用智能系統(tǒng),因此大腦是最好的設(shè)計(jì)藍(lán)本,我們應(yīng)該向內(nèi)借鑒,不需向外求索。
借鑒生物腦的智能技術(shù)可以用在視覺、聽覺、語(yǔ)言、理解、決策、運(yùn)動(dòng)控制等各個(gè)維度,解決服務(wù)機(jī)器人和自動(dòng)駕駛的關(guān)鍵瓶頸。從這個(gè)思路可以演變出很多具有相關(guān)性,但又有一些不同的學(xué)科和技術(shù)路線。
那么類腦計(jì)算是什么呢?它是由生物腦啟發(fā)的人工智能技術(shù),強(qiáng)調(diào)實(shí)用,不追求把大腦中每一個(gè)生物細(xì)節(jié)都進(jìn)行模擬,具有廣闊應(yīng)用前景。
腦仿真就是一種精細(xì)度較高的模擬,不一定追求實(shí)用,更多的是探求生物物理層面的機(jī)理。
神經(jīng)擬態(tài)芯片,利用介于數(shù)字和模擬混合信號(hào)的方式來(lái)實(shí)現(xiàn)人工神經(jīng)元,集成進(jìn)芯片里,大幅度節(jié)省芯片的功耗。
計(jì)算神經(jīng)科學(xué)可以看作是類腦計(jì)算的前身,它大量使用數(shù)理方法對(duì)腦機(jī)制進(jìn)行理解,很多模型都是抽象的,不一定追求實(shí)用。
腦機(jī)接口也是近些年興起的領(lǐng)域,主要解決人和機(jī)器、大腦和機(jī)器之間的交互。
下圖提供了一目了然的對(duì)比:類腦計(jì)算可以通過(guò)算法、軟件、硬件實(shí)現(xiàn);神經(jīng)擬態(tài)芯片如 IBM 的 TrueNorth;腦仿真如歐盟的人類腦計(jì)劃,通過(guò)對(duì)多種生物腦中特定腦區(qū)的腦切片進(jìn)行重構(gòu)得到腦模擬模型;計(jì)算神經(jīng)科學(xué)如經(jīng)典的脈沖神經(jīng)元模型和傳統(tǒng)脈沖神經(jīng)網(wǎng)絡(luò);腦機(jī)接口如馬斯克的 Neuralink。
類腦計(jì)算如何借鑒大腦呢?它有兩個(gè)關(guān)鍵特征,一個(gè)是技術(shù)特征,另一個(gè)是應(yīng)用面。技術(shù)特征上高度借鑒了生物腦中關(guān)鍵的生物機(jī)制,比如不再使用深度神經(jīng)元模型,而是使用脈沖神經(jīng)元模型,甚至比脈沖神經(jīng)元更復(fù)雜的模型。
類腦計(jì)算的學(xué)習(xí)機(jī)制也不再依賴數(shù)學(xué)優(yōu)化,無(wú)需誤差反傳和梯度下降,而主要利用可塑性進(jìn)行訓(xùn)練,由此局部性更好,學(xué)習(xí)效率更高,配合生物腦中特殊的神經(jīng)環(huán)路可以快速地實(shí)現(xiàn)舉一反三。類腦計(jì)算也不再嚴(yán)格區(qū)分學(xué)習(xí)和推理這兩個(gè)過(guò)程,很適合實(shí)時(shí)在線學(xué)習(xí)。由脈沖神經(jīng)元構(gòu)建出微環(huán)路,再由微環(huán)路構(gòu)建多腦區(qū)的腦網(wǎng)絡(luò),這樣就可以實(shí)現(xiàn)類腦神經(jīng)網(wǎng)絡(luò)模型。
類腦計(jì)算面向的問題是更高級(jí)的認(rèn)知任務(wù),不再是簡(jiǎn)單的識(shí)別和分類。比如抽象與歸納、推理與決策、知識(shí)與常識(shí)都屬于認(rèn)知,想象與創(chuàng)造、情感、同理心、道德,甚至人特有的直覺與審美屬于高級(jí)認(rèn)知現(xiàn)象。
憶海原識(shí)類腦計(jì)算體系
類腦計(jì)算具體怎么做呢?回顧憶海原識(shí)的探索歷程,我們是從機(jī)器人本體開始,因?yàn)槟X中包括視覺系統(tǒng)、記憶系統(tǒng)、運(yùn)動(dòng)控制系統(tǒng)在發(fā)育與訓(xùn)練過(guò)程中離不開人體或者說(shuō)機(jī)器人本體跟外部世界的不斷互動(dòng)。后來(lái)逐漸積累類腦智能的理論,并在這些理論指導(dǎo)下逐漸實(shí)現(xiàn)了一系列類腦神經(jīng)網(wǎng)絡(luò)模型。再后來(lái)發(fā)現(xiàn)這些模型規(guī)模比較龐大,運(yùn)算效率又成為新的問題,于是研發(fā)了類腦加速平臺(tái),走了一個(gè)完整的技術(shù)鏈條。
回顧深度學(xué)習(xí)的發(fā)展歷史,其實(shí)也是一樣的。最早從理論出發(fā),然后出現(xiàn)了多層神經(jīng)網(wǎng)絡(luò),解決了訓(xùn)練問題,再然后出現(xiàn)了一系列關(guān)鍵構(gòu)造(如 CNN、RNN、池化),后來(lái)又出現(xiàn)了諸如 Caffe、TensorFlow 等深度學(xué)習(xí)加速平臺(tái)。類腦計(jì)算的發(fā)展也一樣要循序漸進(jìn),一步一步扎實(shí)地走。
類腦神經(jīng)網(wǎng)絡(luò)初窺
神經(jīng)網(wǎng)絡(luò)是怎么工作的呢?我們先來(lái)看人眼視網(wǎng)膜,它是視覺神經(jīng)通路的第一關(guān),卻又往往被傳統(tǒng)計(jì)算機(jī)視覺所忽略。
再仔細(xì)看,視網(wǎng)膜的內(nèi)部構(gòu)造非常豐富和復(fù)雜,從第一層的感光細(xì)胞到后面的雙極細(xì)胞、水平細(xì)胞、無(wú)長(zhǎng)突細(xì)胞和神經(jīng)節(jié)細(xì)胞,它們分成了若干層,每層里面還有亞層。這些細(xì)胞之間進(jìn)行充分的信息溝通和互動(dòng),能夠產(chǎn)生多種重要作用,包括但不限于調(diào)整對(duì)比度、圖象銳化、邊緣檢測(cè)和形成初步色感等。
實(shí)際上,視覺的處理過(guò)程并不僅局限于視覺皮層,其實(shí)在視網(wǎng)膜就已開始了。下圖為視網(wǎng)膜模型的處理效果,最左邊是輸入圖象,中間是它提取出來(lái)的邊緣,最右邊形成了初步的色感(形成了三種不同的主要色調(diào))。
這里我們只借鑒視網(wǎng)膜內(nèi)部的生物機(jī)制就可以實(shí)現(xiàn),完全不需要數(shù)學(xué)優(yōu)化、誤差反傳和大量的訓(xùn)練,效果仍然很好。
我們?cè)賮?lái)看更高級(jí)的部分「視覺皮層」。視覺神經(jīng)系統(tǒng)有豐富發(fā)達(dá)的機(jī)制,它的神經(jīng)通路與其他腦區(qū)高度互聯(lián),比如視覺皮層可以連接到運(yùn)動(dòng)皮層,和空間感有關(guān);它還連接到顳葉,對(duì)物品進(jìn)行識(shí)別;它還連接到中顳葉構(gòu)造(包括海馬體),形成情景記憶。情景記憶又可以進(jìn)行抽象和歸納,再反哺視覺皮層的訓(xùn)練,使視覺訓(xùn)練效率非常高。
我們舉個(gè)例子,受益于四通八達(dá)的神經(jīng)通路,視覺系統(tǒng)可以進(jìn)行豐富靈活的信息處理。如下最左圖給大家一種立體感(存在視錯(cuò)覺);中間圖有 ABC 三個(gè)位置,尤其是 A 和 B 在明亮上是同一個(gè)色階,但在不同的陰影照度和對(duì)比下,就可能被人眼識(shí)別成不同的結(jié)果;還有最右圖中有幾種顏色的螺旋呢?其實(shí)如果去掉背景干擾信息,可以發(fā)現(xiàn)它的螺旋線只有綠色。
也就是說(shuō),人腦對(duì)立體感、明亮感、色彩感以及其他諸多種感覺都存在相對(duì)性與整體性,能夠在豐富的信息空間中進(jìn)行靈活處理,處理方式和結(jié)果取決于認(rèn)知需要和對(duì)比。
在下圖中,大家可以看到遠(yuǎn)山之間存在層次感,能夠分辨近景與遠(yuǎn)景。在這種圖像之中,你可以結(jié)合視覺注意力選擇關(guān)注的對(duì)象(即主動(dòng)注意力)。人的視覺一般只對(duì)中央凹的位置(即中間部分)高度關(guān)注因而分辨率較高,周邊的部分是模糊的。
人眼可以選擇聚焦于遠(yuǎn)山,也可以聚焦于近景,這些都是出于認(rèn)知需要而定。這些在傳統(tǒng)人工智能中沒有很好地實(shí)現(xiàn),所以不夠靈活,沒有辦法適應(yīng)會(huì)紛繁變化的復(fù)雜場(chǎng)景。
再如下圖示例,偏向于識(shí)別問題。圖中的對(duì)象到底是牛還是鯊呢?如果用深度神經(jīng)網(wǎng)絡(luò),可能只能識(shí)別出一個(gè)確定的結(jié)果,要么分類成某種鯊魚,要么分類成其他結(jié)果。為什么呢?因?yàn)樗嵌说蕉说膯我惠斎胼敵鱿到y(tǒng)。
但是對(duì)人腦而言,認(rèn)知是極其靈活的,思維存在非常多維度。頭腦可以告訴你如果現(xiàn)在關(guān)注的是前景,雖然長(zhǎng)得像鯊魚的輪廓,但從紋理上看,是牛的皮膚。如果看它的頭部與身體關(guān)系,則是牛頭鯊身(您或許已經(jīng)注意到了,這里存在經(jīng)驗(yàn) / 邏輯上的沖突)。如果你現(xiàn)在把注意力放到遠(yuǎn)景,頭腦會(huì)告訴你遠(yuǎn)景是遠(yuǎn)處的山峰。
可以這么說(shuō),視覺系統(tǒng)具有豐富靈活的認(rèn)知機(jī)制,并不像深度學(xué)習(xí)那樣是端到端的單一輸入輸出系統(tǒng)。
Ocean 類腦計(jì)算平臺(tái)
問題來(lái)了,我們?nèi)绾谓_@樣龐大復(fù)雜的神經(jīng)系統(tǒng)呢?
1,我們發(fā)現(xiàn)建模過(guò)程非常煩瑣,需要簡(jiǎn)化建模過(guò)程的工具。
2,神經(jīng)系統(tǒng)分為非常多復(fù)雜的層級(jí),最頂層有系統(tǒng)級(jí)、往下是環(huán)路,再往下是神經(jīng)元和突觸,再往下可以分解到分子和蛋白質(zhì)層級(jí)。每一個(gè)層級(jí)對(duì)整體的認(rèn)知需要都是有貢獻(xiàn)的,需要實(shí)現(xiàn)其信息處理過(guò)程。因此,需要一個(gè)能夠?qū)Ω鱾(gè)層級(jí)進(jìn)行建模的工具。
3,此外,類腦神經(jīng)網(wǎng)絡(luò)往往規(guī)模很大,包括上千萬(wàn)甚至上億個(gè)參數(shù)。如何在通用計(jì)算硬件上運(yùn)算呢?這也需要一個(gè)運(yùn)算效率很高的工具。
Ocean 類腦計(jì)算平臺(tái)應(yīng)運(yùn)而生,最初是作為我們內(nèi)部使用的工具,現(xiàn)在隆重地向大家介紹和推廣。
Ocean 類腦計(jì)算平臺(tái)分為前端、核心和后端,它把建模和硬件管理進(jìn)行解耦。這樣一來(lái),神經(jīng)科學(xué)家和建模人員不必關(guān)心硬件底層細(xì)節(jié),只需專注神經(jīng)網(wǎng)絡(luò)的建模。
該平臺(tái)提供了豐富的基礎(chǔ)模型和神經(jīng)機(jī)制,包括有多種類型的神經(jīng)元、突觸、可塑性機(jī)制,以及順愧反愧循環(huán)和側(cè)抑制等常見的環(huán)路結(jié)構(gòu),簡(jiǎn)化用戶建模過(guò)程,同時(shí)支持用戶自定義模型、擴(kuò)展功能。該平臺(tái)能夠支持全尺度的建模,從最小單位的神經(jīng)元、突觸、樹突、環(huán)路、核團(tuán)到腦區(qū)。
該平臺(tái)還可以支持大規(guī)模類腦神經(jīng)網(wǎng)絡(luò)的運(yùn)算,通過(guò)對(duì)硬件設(shè)備的調(diào)度管理,保證高運(yùn)算效率。該平臺(tái)可以在異構(gòu)計(jì)算器件上運(yùn)行,支持 CPU、GPU 以及其他的異構(gòu)計(jì)算設(shè)備。該平臺(tái)可部署在個(gè)人計(jì)算機(jī)、云端服務(wù)器以及嵌入式設(shè)備上,從而為其應(yīng)用和推廣帶來(lái)了可能,滿足從研發(fā)到應(yīng)用部署的全鏈條需求。
神經(jīng)系統(tǒng)建模有哪些特點(diǎn)?我們發(fā)現(xiàn):第一,生物神經(jīng)元特性遠(yuǎn)比傳統(tǒng)脈沖神經(jīng)元特性豐富,第二,生物腦的機(jī)制遠(yuǎn)比傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)的機(jī)制豐富。如此看來(lái),理論、算法、模型將會(huì)持續(xù)快速更迭,并將成為常態(tài)。
因此,Ocean 需要滿足靈活建模的需求。
如左上圖為一個(gè)生物神經(jīng)元,它可大致分為突觸、樹突、胞體、軸突等幾個(gè)部分。對(duì)應(yīng)到模型上,每個(gè)部分都可以發(fā)生很復(fù)雜的機(jī)制,每一個(gè)機(jī)制對(duì)于最終表現(xiàn)出來(lái)的宏觀認(rèn)知效果都有不可忽視的重要作用。
為滿足靈活建模需要,Ocean 也相應(yīng)地將神經(jīng)元模型劃分為突觸、樹突、胞體等結(jié)構(gòu)(可以進(jìn)一步細(xì)分和擴(kuò)展)。其中,突觸也可以獨(dú)立建模。
再來(lái)看突觸及突觸可塑性,在生物學(xué)層面二者相關(guān)性很強(qiáng),但又相對(duì)獨(dú)立。因此 Ocean 將二者解耦,突觸及突觸可塑性可以分別建模,同時(shí)允許二者靈活組合。
在前述基礎(chǔ)上,為了運(yùn)算的高效以及便于管理模型 / 代碼,Ocean 將神經(jīng)元、突觸以群組為單位劃分,并提供兩種基礎(chǔ)模型描述范式:容器模型描述范式、端口模型描述范式。
下面著重介紹端口模型描述范式。一個(gè)端口模型包括模型主體和一至多個(gè)端口。其中,模型主體包括若干變量,用于表達(dá)模塊 / 模型的狀態(tài)(例如神經(jīng)元的膜電位);端口表述了模塊 / 模型與其它模塊 / 模型的信息交互方式(可以用于實(shí)現(xiàn)突觸連接)。通過(guò)端口機(jī)制,可以清晰地描述神經(jīng)網(wǎng)絡(luò)豐富而復(fù)雜的拓?fù)浣Y(jié)構(gòu)。
針對(duì)基礎(chǔ)模型提供以下端口(可以按需擴(kuò)展):
Input - 輸入端口,接受輸入;
Output - 輸出端口,產(chǎn)生輸出;
Reference - 引用端口,允許模塊 / 模型與其它模塊 / 模型的變量相互引用;
Connection - 連接端口,可用于實(shí)現(xiàn)聯(lián)接權(quán)重矩陣等功能;
如下圖所示:
Ocean 提供了常用的神經(jīng)元類型、突觸類型、樹突結(jié)構(gòu)、可塑性機(jī)制等,并分別提供了對(duì)應(yīng)的端口模型 / 容器群組。
進(jìn)一步地,為了提高模型的組織能力,更靈活地管理模塊,Ocean 還提出了抽象模塊(AbstractModule);抽象模塊可以對(duì)模型進(jìn)行封裝,通過(guò)代理輸入端口(ProxyInput)、代理輸出端口(ProxyOutput)等高級(jí)端口提供統(tǒng)一的輸入、輸出接口;抽象模塊之間可以進(jìn)行級(jí)聯(lián)、嵌套,形成扁平結(jié)構(gòu)、樹狀結(jié)構(gòu)、多層級(jí)結(jié)構(gòu)等,為模型的組織提供了靈活的管理及擴(kuò)展能力,更加便于研發(fā)人員之間分工協(xié)作,將各自設(shè)計(jì)的模型組裝成為更大的模型。
下面給出一些經(jīng)典的神經(jīng)環(huán)路拓?fù)浣Y(jié)構(gòu)案例:
1. 神經(jīng)元 - 突觸 - 神經(jīng)元 - 突觸可塑性(上、下游神經(jīng)元組一對(duì)一)
2. 神經(jīng)元 - 突觸 - 神經(jīng)元 - 突觸可塑性(上、下游神經(jīng)元組多對(duì)一)
3. 神經(jīng)元 - 突觸 - 樹突 - 神經(jīng)元 - 突觸可塑性
4. 模塊嵌套及復(fù)用
這里介紹一個(gè) Ocean 建模實(shí)例。下圖為使用類腦神經(jīng)網(wǎng)絡(luò)針對(duì) MNIST 手寫字體進(jìn)行識(shí)別。這個(gè)模型沒有使用誤差反傳、梯度下降,只使用一定神經(jīng)環(huán)路拓?fù)浣Y(jié)構(gòu)結(jié)合可塑性進(jìn)行學(xué)習(xí),就可以取得良好的識(shí)別效果。
我們還有更多的類腦神經(jīng)網(wǎng)絡(luò)模型以及應(yīng)用案例,將會(huì)在以后的發(fā)布會(huì)上陸續(xù)向大家介紹。
憶海原識(shí)作為類腦計(jì)算以及機(jī)器人生態(tài)中的一份子,希望能夠跟大家共同推動(dòng)該領(lǐng)域發(fā)展,也希望大家能夠持續(xù)關(guān)注。謝謝大家!
Ocean 類腦計(jì)算平臺(tái):ocean.yihaiyuanshi.com
公司官網(wǎng):https://www.yihaiyuanshi.com/
特別鳴謝:天安云谷、奇績(jī)創(chuàng)壇、X-man 加速營(yíng)、Nvidia Inception Program