展會(huì)信息港展會(huì)大全

馬庫(kù)斯對(duì)DeepMind人工智能模型Gato提出質(zhì)疑,認(rèn)為規(guī)模最大化理論已出現(xiàn)三個(gè)危機(jī)
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2022-11-09 10:51:23   瀏覽:15592次  

導(dǎo)讀:今年上半年,DeepMind 推出了名為 Gato 的人工智能模型。該模型可用于執(zhí)行不同模態(tài)下(文本、圖像、視頻、音頻等)復(fù)雜的計(jì)算任務(wù),如生成對(duì)話與字幕、玩視頻游戲、控制機(jī)械臂搭積木等。 圖 | Gato 模型(來(lái)源:DeepMind) 簡(jiǎn)單來(lái)講,Gato 憑借單一架構(gòu)的網(wǎng)...

今年上半年,DeepMind 推出了名為 Gato 的人工智能模型。該模型可用于執(zhí)行不同模態(tài)下(文本、圖像、視頻、音頻等)復(fù)雜的計(jì)算任務(wù),如生成對(duì)話與字幕、玩視頻游戲、控制機(jī)械臂搭積木等。

圖 | Gato 模型(來(lái)源:DeepMind)

簡(jiǎn)單來(lái)講,Gato 憑借單一架構(gòu)的網(wǎng)絡(luò)模型就能完成 604 種不同的操作任務(wù),是一款通用型的人工智能模型。例如,Gato 應(yīng)用于游戲場(chǎng)景中時(shí),不必為每個(gè)游戲單獨(dú)訓(xùn)練智能體模型,只需運(yùn)用同一套模型參數(shù)便可以玩不同的游戲。

圖 | Gato 生成對(duì)話與字幕(來(lái)源:DeepMind)

規(guī)模最大化理論備受爭(zhēng)議

在 Gato 發(fā)布之時(shí),DeepMind 的首席科學(xué)家南多弗雷塔斯(Nando de Freitas)還曾發(fā)布 Twitter 聲明,支持 Gato 所采用的規(guī)模最大化理論。他認(rèn)為,更大的模型會(huì)帶來(lái)更強(qiáng)的性能,就像 Gato 所具有的強(qiáng)大功能一樣。

圖 | 蓋瑞馬庫(kù)斯(Gary Marcus)(來(lái)源:Robust.AI 公司)

然而最近,人工智能專家、Robust.AI 公司的創(chuàng)始人兼 CEO、紐約大學(xué)教授蓋瑞馬庫(kù)斯(Gary Marcus)對(duì)“Gato 模型基于規(guī)模最大化可實(shí)現(xiàn)通用人工智能”的觀點(diǎn)表示質(zhì)疑。

與弗雷塔斯的觀念相反,馬庫(kù)斯認(rèn)為,僅通過(guò)擴(kuò)大模型規(guī)模無(wú)法確保計(jì)算結(jié)果的正確性。因此,其并不能從根本上提升性能,從而實(shí)現(xiàn)真正的人工智能。

馬庫(kù)斯認(rèn)為,Gato 不能實(shí)現(xiàn)通用人工智能有三個(gè)原因:第一,現(xiàn)階段用以支撐規(guī)模最大化理論的數(shù)據(jù)量不足;第二,實(shí)現(xiàn)規(guī)模最大化消耗的計(jì)算資源過(guò)多;第三,無(wú)法從規(guī)模上擴(kuò)展很多重要的任務(wù),例如對(duì)同一句話在不同語(yǔ)境下的理解,而不僅僅是其語(yǔ)法和語(yǔ)義。

后文提到的實(shí)踐也證明了馬斯庫(kù)的觀點(diǎn),Gato 模型對(duì)很多任務(wù)執(zhí)行得不好,無(wú)法通過(guò)試錯(cuò)改進(jìn)提升下一次策略的執(zhí)行。

業(yè)內(nèi)人士也普遍認(rèn)為規(guī)模最大化理論過(guò)于偏激,盡管 PaLM、DALL-E 2、Flamingo 和 Gato 等新人工智能模型的出現(xiàn)增強(qiáng)了該觀點(diǎn)的可信度,但是并不能證明該理論一定正確。

他們同馬斯庫(kù)一樣,認(rèn)為真正的 AI 模型應(yīng)該具備像人類一樣執(zhí)行命令的能力,而不是在模型中直接包含人類已經(jīng)發(fā)現(xiàn)的內(nèi)容。人工智能工程師在已經(jīng)創(chuàng)造出的模型中直接添加內(nèi)容,不會(huì)創(chuàng)造出新的模型,因此,不能僅僅依賴于擴(kuò)大模型規(guī)模來(lái)實(shí)現(xiàn)人工智能中的模型創(chuàng)新。

實(shí)際上,規(guī)模最大化理論并沒(méi)有被準(zhǔn)確的定義。就目前的理解,它意味著工程師無(wú)需創(chuàng)新算法模型,只需要對(duì)現(xiàn)有模型的參數(shù)規(guī)模進(jìn)行拓展(例如無(wú)腦加深網(wǎng)絡(luò)深度,或?qū)δP瓦M(jìn)行橫向擴(kuò)展),就能實(shí)現(xiàn)通用人工智能。

這種理論顯然并不正確,實(shí)踐證明,PalM、 DALL-E 2、 Flamingo、Gato 等模型依然需要算法模型的創(chuàng)新,而不僅僅是計(jì)算規(guī)模的堆砌。

到目前為止,還沒(méi)有人能夠給出準(zhǔn)確的解釋,以說(shuō)明需要將模型擴(kuò)大和算法創(chuàng)新到何種程度才能稱作規(guī)模最大化,因此很難判斷規(guī)模最大化理論究竟是對(duì)是錯(cuò)。

因此,盡管擴(kuò)充模型規(guī)模在通用人工智能領(lǐng)域是有必要的,但是并不是唯一途徑。

模型的訓(xùn)練與應(yīng)用流程

雖然 Gato 的規(guī)模最大化理論備受爭(zhēng)議,但就 Gato 模型本身而言,其在算法上具有一定創(chuàng)新之處,而且它具有強(qiáng)大的功能,應(yīng)用范圍也相當(dāng)廣泛。

在構(gòu)建 Gato 模型的過(guò)程中,來(lái)自不同任務(wù)和模態(tài)的數(shù)據(jù)被序列化為扁平的數(shù)據(jù)單元,并由類似于大型語(yǔ)言模型的神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換器(Transformer)模型進(jìn)行批處理。在此過(guò)程中,模型的一部分損失函數(shù)被選擇性地隱藏,以使得 Gato 只對(duì)行為決策和文本目標(biāo)進(jìn)行學(xué)習(xí)。

圖 | Gato 的訓(xùn)練流程(來(lái)源:DeepMind)

在 Gato 模型實(shí)際部署運(yùn)行時(shí),對(duì)輸入數(shù)據(jù)進(jìn)行標(biāo)記化處理(標(biāo)記化是指數(shù)據(jù)的向量表示,例如把一個(gè)單詞或者一句話表示為一個(gè)數(shù)值向量,稱為 tokenization),產(chǎn)生初始的輸入序列。

然后利用環(huán)境(不屬于 Gato 的一部分,而是要學(xué)習(xí)的任務(wù),例如游戲本身)生成第一個(gè)結(jié)果,該結(jié)果被標(biāo)記化并附加到最初序列中,形成動(dòng)作向量。然后,Gato 模型對(duì)動(dòng)作向量進(jìn)行“自回歸”(一種從統(tǒng)計(jì)上處理時(shí)間序列數(shù)據(jù)的方法)式地采樣,每次生成一個(gè)新的標(biāo)記化序列。

所有標(biāo)記序列被采樣后,模型就會(huì)將動(dòng)作向量進(jìn)行解碼(可以理解為“反標(biāo)記化”)并發(fā)送到任務(wù)環(huán)境中,在該環(huán)境之中執(zhí)行相關(guān)步驟并產(chǎn)生新的觀察結(jié)果。然后,模型會(huì)重復(fù)這個(gè)過(guò)程,使其動(dòng)作向量不斷更新,直至結(jié)果收斂。

圖 | 將 Gato 部署為控制策略(Control Policy)的流程(來(lái)源:DeepMind)

Gato 不僅能在自然語(yǔ)言和圖像數(shù)據(jù)集上訓(xùn)練,還能使用大量其它模態(tài)的數(shù)據(jù)集進(jìn)行訓(xùn)練。這些數(shù)據(jù)包括從仿真環(huán)境和真實(shí)環(huán)境中獲得的經(jīng)驗(yàn)數(shù)據(jù)。

為驗(yàn)證 Gato 能否執(zhí)行全新的任務(wù),研究者分別從多個(gè)不同的環(huán)境中拿出了新的任務(wù),對(duì)單個(gè)任務(wù)下的訓(xùn)練好的模型參數(shù)再訓(xùn)練一定輪次,進(jìn)行參數(shù)優(yōu)化和微調(diào),然后在指定任務(wù)上對(duì)模型進(jìn)行了性能測(cè)試。

結(jié)果表明,在很大比例的任務(wù)中,Gato 都可以通過(guò)不斷的學(xué)習(xí)與適應(yīng)來(lái)執(zhí)行新任務(wù)并獲得人類專家水平的分?jǐn)?shù)。

然而,由于標(biāo)記化序列長(zhǎng)度過(guò)長(zhǎng),以及計(jì)算機(jī)的內(nèi)存限制,任務(wù)在執(zhí)行的過(guò)程中會(huì)存在很多問(wèn)題,例如速度過(guò)慢等。

模型參數(shù)規(guī)模的擴(kuò)張是否是開(kāi)發(fā)通用智能的唯一途徑,這個(gè)問(wèn)題尚無(wú)定論。但目前很明顯的是,以 Gato 為代表的眾多大規(guī)模人工智能模型,距離通用人工智能還有很長(zhǎng)的一段路要走。

支持:王貝貝

參考資料:

https://www.deepmind.com/blog/a-generalist-agent

https://www.deepmind.com/publications/a-generalist-agent


贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開(kāi)

熱門(mén)欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港