劃重點
01DeepMind創(chuàng)始人哈薩比斯表示,僅僅將AI視作一種技術(shù)是錯誤的,認(rèn)為AI將是“劃時代的定義性”技術(shù)。
02他強調(diào),要達到AGI,還需要約10年的時間,且需要實現(xiàn)兩三個重大創(chuàng)新。
03哈薩比斯認(rèn)為,現(xiàn)在的AI研究進展正在逐步接近AGI,但仍存在其他更復(fù)雜的問題需要解決。
04他表示,DeepMind的目標(biāo)從開始到今天仍是達到AGI,盡管現(xiàn)在的產(chǎn)品已經(jīng)相當(dāng)成熟。
05此外,哈薩比斯認(rèn)為,AGI將帶來巨大的影響,但必須小心處理,因為這些系統(tǒng)存在風(fēng)險。
以上內(nèi)容由騰訊混元大模型生成,僅供參考
西風(fēng) 整理自 凹非寺
量子位 | 公眾號 QbitAI
新晉諾貝爾化學(xué)獎得主、DeepMind創(chuàng)始人哈薩比斯的最新訪談來了~
聊了DeepMind的初衷以及正在做的事,聊了AGI,還聊了AI的未來。
對于AGI,此前奧特曼曾表示可能5年內(nèi)到來,馬斯克也曾預(yù)測很快將實現(xiàn),而哈薩比斯則認(rèn)為沒那么快。
他認(rèn)為要達到AGI,還需要約10年的時間,而且還需要實現(xiàn)兩三個重大創(chuàng)新才能AGI。
而且將人工智能僅僅視為另一種技術(shù)是錯誤的,這將比互聯(lián)網(wǎng)等帶來的影響要大得多,AI將是“劃時代的定義性”技術(shù)。
……
哈薩比斯這次還明確表明“DeepMind的目標(biāo)從開始到今天仍是達到AGI”、“DeepMind仍然是一家以研究為主導(dǎo)的機構(gòu)”。
不過有意思的是,在被問到他個人是如何保持持續(xù)研究的?哈薩比斯回答道:
之前通常會在午夜到凌晨3點間閱讀思考,但現(xiàn)在很多原本用于思考的時間現(xiàn)在都用來處理電話會議了。所以,需要考慮如何重新規(guī)劃時間。
總之,網(wǎng)友們整個訪談看下來,那叫一個津津有味:
還有網(wǎng)友認(rèn)真記筆記:
關(guān)鍵點:AGI仍然是10年后的事。當(dāng)前的AI炒作階段是關(guān)于讓Agent執(zhí)行在線/離線任務(wù)的故事.這一切將如何發(fā)展,你將擁有一個主要的通用智能系統(tǒng),它將調(diào)用多個擅長特定任務(wù)的AI Agent進行協(xié)作處理任務(wù).
個別網(wǎng)友的關(guān)注點那可就不一樣了,不在發(fā)言上,而在:
話不多說,量子位在不改變原意的基礎(chǔ)上對這次訪談的內(nèi)容進行了翻譯整理,各位看官們請享用~
訪談內(nèi)容整理Q:你2010年左右開始創(chuàng)業(yè),那時已有一些早期想法,但之前AI經(jīng)歷了幾十年寒冬,人工智能似乎并未取得顯著進展。為什么那時你會選擇創(chuàng)立DeepMind?
哈薩比斯:
實際上,我從事AI研究已經(jīng)超過30年了。
首先是在游戲領(lǐng)域,制作游戲AI和模擬游戲。然后我學(xué)習(xí)了計算機科學(xué)和神經(jīng)科學(xué)。我一直在觀察AI領(lǐng)域的發(fā)展。
在90年代,就是你所說的AI寒冬期間,主要是邏輯系統(tǒng),被稱為專家系統(tǒng)。許多人可能還記得深藍擊敗國際象棋大師加里卡斯帕羅夫,這些都是預(yù)先編程的系統(tǒng),程序員和系統(tǒng)設(shè)計師解決問題并將其規(guī)則化。
然而,計算機或AI系統(tǒng)實際上并不智能,它只是機械地執(zhí)行這些啟發(fā)式規(guī)則,問題在于這會導(dǎo)致系統(tǒng)脆弱。它們無法學(xué)習(xí)新事物,當(dāng)然也無法發(fā)現(xiàn)新事物,因為它們的能力顯然受限于設(shè)計者或程序員已經(jīng)知道的內(nèi)容。
對我來說,在90年代,無論是在劍橋還是麻省理工學(xué)院,我所學(xué)習(xí)的地方,普遍都認(rèn)為邏輯系統(tǒng)是正確的方向。
我認(rèn)為這就是人工智能寒冬的原因之一,因為它們本質(zhì)上是脆弱且有限的。
所以到了2010年,隨著深度學(xué)習(xí)在學(xué)術(shù)界誕生,我們看到了新的可能。我們還發(fā)現(xiàn)大腦中的多巴胺系統(tǒng)也使用了強化學(xué)習(xí),動物包括人類都是通過強化學(xué)習(xí)來學(xué)習(xí)。
因此,我明白我們需要構(gòu)建的是一個能夠自我學(xué)習(xí)并具有通用性的系統(tǒng),這就是DeepMind的起源。
我們也看到了像GPU這樣的硬件正在加速發(fā)展。我在GPU最初用于計算機圖形和電腦游戲時就開始使用它們,但它們非常通用。
事實證明,世界上所有東西都可以歸結(jié)為矩陣乘法。
所以,我們很早就感覺到,將這些初生的想法和成分集合起來需要一種類似執(zhí)行阿波羅計劃的努力,能夠迅速推動技術(shù)進步,最終也確實實現(xiàn)了這一點。
Q:這是你當(dāng)初在2010年設(shè)想的未來嗎?你是否曾想象過,15年后,會在這里向眾多聽眾講述AI的重要性,并且已經(jīng)解決了蛋白質(zhì)折疊問題?
哈薩比斯:
實際上,一切大致按照我們的計劃進行。當(dāng)然,途中有些小波折和意外。但當(dāng)我們在2010年開始時,我們認(rèn)為大約需要20年的時間才能實現(xiàn)AGI。
我認(rèn)為我們可能還有大約10年就能達到這個目標(biāo)。
所以,大致上是按照這個時間線進行的。而且,蛋白質(zhì)折疊以及在通向AGI的過程中使用AI系統(tǒng)進行科學(xué)研究一直是我的熱情所在。
蛋白質(zhì)折疊一直是我希望解決的科學(xué)問題列表中的首位,如果我們能找到突破,這將是革命性的。
Q:我們來談?wù)凙GI。有趣的是,自ChatGPT出現(xiàn)以來,大家對AI的討論非常激烈,這與你所做的AI完全不同。到目前為止,作為一個觀察者來看,你的AI都是非常具體的,看起來有點奇怪,你開始做一些看似無意義的事情,你在電腦游戲上變得非常擅長……
哈薩比斯:
我不會說它們毫無意義,但更多的是為了娛樂,也許你可以這么說。
我們從游戲開始,部分原因是因為我在制作游戲和在象棋等方面的背景。
自圖靈時代以來,游戲一直與AI發(fā)展密切相關(guān),像香農(nóng)這樣的偉人,他們從象棋程序開始,這幾乎是每個AI先驅(qū)所做的。
象棋被認(rèn)為是AI系統(tǒng)的訓(xùn)練常
你的算法想法能否快速取得進展?通過它很容易就能benchmark你的位置,你知道,如果你打敗了世界冠軍或最好的計算機,那你就做得很好。
但重點是,這些總是達到目的的手段,而不是目的本身。
所以,想法總是要發(fā)展,不僅僅是成為圍棋或象棋的世界冠軍,而是以一種通用的方式進行,這種方式可以轉(zhuǎn)移到其他領(lǐng)域,包括科學(xué)和商業(yè)應(yīng)用。
這就是我們使用深度強化學(xué)習(xí)所做的,也是我們與AlphaGo所做的。所有這些都是非常通用的系統(tǒng)和技術(shù),我們今天仍在使用。
當(dāng)涉及到像AlphaFold解決蛋白質(zhì)折疊之類的問題時,你真正感興趣的是解決方案本身。
你知道,如果你有治療癌癥的方法,你不在乎它是如何完成的,你只想要治療癌癥的方法。所以你真的會想盡一切辦法去嘗試。
所以最開始是以所擁有的所有通用技術(shù)作為基線,然后觀察領(lǐng)域本身,如果這個領(lǐng)域?qū)ι鐣蛏虡I(yè)來說足夠有價值,那么你在上面添加定制的東西,這就是如何得到像AlphaFold這樣的突破性程序。
但最終,DeepMind的目標(biāo)從開始到今天仍是達到AGI,這意味著一個通用系統(tǒng),能夠開箱即用地完成人類能做的任何認(rèn)知任務(wù)。
完全通用的圖靈機,正如艾倫圖靈在50年代指定的,能夠計算任何可計算的東西。這是AI領(lǐng)域的最初目標(biāo),也是DeepMind的目標(biāo)。
當(dāng)然,你最近看到的是像這些語言模型這樣的東西。顯然,ChatGPT觸及了每個人,實際上所有頂尖實驗室,包括谷歌和DeepMind都在研究語言模型。
我們有自己的內(nèi)部模型,叫做Chinchilla,谷歌也有他們的。當(dāng)然,這一切都基于谷歌研究院發(fā)明的Transformer架構(gòu),所有當(dāng)前的模型都基于此。
這是一個令人興奮的時期,因為語言顯然是一種通用能力。
所以這就是每個人都對聊天機器人感到非常興奮的原因,這種技術(shù)能夠擴展到如此廣的程度,真是既有趣又出人意料。
我認(rèn)為我們比以往任何時候都更接近于構(gòu)建這種通用系統(tǒng),但目前仍然需要專門的系統(tǒng)來在特定領(lǐng)域達到最高水平。
Q:LLM是否更接近于AGI?我的感覺是,它更像是與人類互動。但實際上是這樣嗎?
哈薩比斯:
我認(rèn)為現(xiàn)在甚至連“大語言模型(LLMs)”這個詞都不夠準(zhǔn)確了,因為它們不僅僅是大語言模型,還是多模態(tài)的。
例如,我們的模型Gemini從一開始就是多模態(tài)的。因此,它可以處理任何輸入,比如視覺、音頻、視頻、代碼以及文本。
我認(rèn)為這將是AGI系統(tǒng)的一個關(guān)鍵組成部分,但可能本身還不夠。我認(rèn)為從現(xiàn)在到我們實現(xiàn)AGI還需要兩到三個重大創(chuàng)新。
這也是為什么我提出10年的時間框架,一些同行、競爭對手的時間線比這更短,但我認(rèn)為10年大致合適。
Q:現(xiàn)在你們正在進行一些非常實用的項目,比如我們提到的蛋白質(zhì)折疊和天氣預(yù)報。你們最近在國際數(shù)學(xué)奧林匹克競賽中獲得了銀牌,如果努力的話,或許還能獲得金牌。
你們還在開展其它多種活動,但我想知道,你們是否也在幕后考慮如何繼續(xù)推動AGI的發(fā)展?你們是否有團隊在致力于這一目標(biāo)?
哈薩比斯:
我們確實是一個大型組織,正如你所說,我們最初是以貝爾實驗室的模式建立的,這是世界上最優(yōu)秀的工業(yè)實驗室之一,能夠發(fā)明未來并進行長期規(guī)劃。
我們已經(jīng)展示了這種模式的效力,特別是在為現(xiàn)今你所見的技術(shù)奠定基礎(chǔ)方面。
所以我認(rèn)為任何深科技初創(chuàng)公司,都需要時間來發(fā)展和成熟其技術(shù)。我們現(xiàn)在處于一個非常激動人心的時刻,在過去的兩三年中,這些技術(shù)已經(jīng)相當(dāng)成熟,準(zhǔn)備應(yīng)用于各種事物。
這不僅包括科學(xué)、數(shù)學(xué)和醫(yī)學(xué)等領(lǐng)域的進步,也包括生產(chǎn)力和商業(yè)應(yīng)用,例如聊天機器人或是重新設(shè)計的工作流程和電子郵件系統(tǒng)。
這些都還處于初期階段,我們也在所有這些方面進行工作。
我認(rèn)為谷歌擁有超十五億用戶的服務(wù)和產(chǎn)品,AI是所有這些事物的核心,新功能不斷加入,這些都源自我們在DeepMind開發(fā)的技術(shù)。
從某種意義上說這很棒,因為針對產(chǎn)品的技術(shù)需求與我們朝向AGI所做的研究大約90%相似,這些領(lǐng)域已經(jīng)大幅融合。
如果是五年或十年前,如果你想在產(chǎn)品中構(gòu)建AI,你必須回到邏輯網(wǎng)絡(luò)、專家系統(tǒng),因為通用系統(tǒng)和學(xué)習(xí)系統(tǒng)還不夠好。就像Alexa時代的助手,仍然基于那種舊技術(shù),它們脆弱且不具有普適性,最終并不那么有用。
而新一代助手會更加有能力,所以這實際上非常令人興奮。
我實際上看到像Gemini以及我們自己對未來多模型助手的設(shè)想,比如Astra項目,在通往AGI系統(tǒng)的關(guān)鍵路徑上,它們實際上推動了朝那個方向的研究。
我們有一個展示Astra的視頻:
這只是一個基本的全能助手的開始,它可以在你的日常生活中幫助你。還會有不同的形式,你可以在手機上看,你可以在眼鏡等設(shè)備上看,我無法告訴你這會有多么驚人。
如果我們回到五年前,你告訴我我們會達到現(xiàn)在這個地步,你只需要用相機指向某物,它就能完全理解你周圍的空間環(huán)境,這相當(dāng)不可思議。
它有點像是已經(jīng)掌握了概念,并且理解什么是物體,甚至能通過窗外隨機的一瞥認(rèn)出我們所在的位置。像記憶這樣的功能,它能記住你把東西放在哪里,這對助手來說也非常有用,還有個性化,所有這些都是我所說的下一代助手的一部分,我稱之為通用助手。
因為我想象你會帶著它到處走,使用不同的設(shè)備,無論它是在和你玩游戲,還是在你的桌面上幫助你工作,或者在移動設(shè)備上隨你一起旅行,都是同一個助手。
Q:一些人可能認(rèn)為當(dāng)前的進展是向AGI邁進的一步,而另一些人則認(rèn)為現(xiàn)在的方法存在本質(zhì)的局限,這種局限是目前的方法無法克服的。
你認(rèn)為這種進展是正在逐步接近目標(biāo),還是存在其他更復(fù)雜的問題需要解決?
哈薩比斯:
我們確實需要這些系統(tǒng),我相信你們都體驗過各種先進的聊天機器人。
這些系統(tǒng)目前還比較被動,主要是問答系統(tǒng)。雖然它們在回答問題、進行基本研究或文本總結(jié)方面頗有用處。
我們接下來想要的是更多基于Agent的系統(tǒng),能夠完成你指派的具體任務(wù)。這正是一個高效的數(shù)字助手應(yīng)該提供的功能,例如規(guī)劃假期、安排城市行程、購買活動門票等。
因此,這些系統(tǒng)需要能夠在現(xiàn)實世界中進行行動、執(zhí)行計劃和推理。我們需要更好的規(guī)劃能力、推理、行動執(zhí)行能力,更強的記憶力,以及更精準(zhǔn)的個性化,使系統(tǒng)能夠理解用戶的偏好并記住用戶的指示和喜好,所有這些技術(shù)都是必需的。
我們的一些游戲程序,比如在圍棋上擊敗世界冠軍的AlphaGo,就包含了規(guī)劃和推理,雖然這些都是在游戲這一狹窄領(lǐng)域內(nèi)。我們必須將這些技術(shù)現(xiàn)在應(yīng)用到像Gemini這樣的模型上,正如你所見,它能理解其周圍的世界。
但如何在游戲之外的混亂的現(xiàn)實世界中進行規(guī)劃,我認(rèn)為這是需要實現(xiàn)的下一個重大突破。
Q:那個助手也能達到像AlphaGo那樣的國際象棋水平嗎?
哈薩比斯:
是的。
所以,確切地說,目前研究界正在進行一場非常有趣的討論,關(guān)于這個問題有兩種可能的解決方式。
你可以想象,你的通用Agent系統(tǒng)能夠使用工具,這些工具可能是物理硬件如機器人,或者是軟件,比如計算器,甚至是其它AI系統(tǒng)。
例如,你可以設(shè)想一個通用AI系統(tǒng),類似于人類大腦,它可以調(diào)用AlphaFold或AlphaGo來折疊蛋白質(zhì)或下圍棋。由于這些功能都是數(shù)字化的,你也可以考慮將這些能力集成到一個通用大腦系統(tǒng)中,如Gemini。
但這樣做需要權(quán)衡,因為這可能導(dǎo)致系統(tǒng)過載特定信息,例如過多的棋局信息可能會削弱其在語言處理方面的能力。
這是一個開放的研究問題:是將這些工具保留為獨立的AI工具,供通用AI在特定情境下使用,還是將它們整合到主系統(tǒng)中?
對于一些功能,如編程和數(shù)學(xué),整合到主系統(tǒng)可能更有益,因為這可以提升系統(tǒng)的整體性能。因此,我們也在研究學(xué)習(xí)理論、小孩子的發(fā)展等,來深入理解哪些功能最適合作為通用工具集成在主系統(tǒng)中。
Q:你們是否仍在努力追求成為類似貝爾實驗室那樣的研究機構(gòu)?
哈薩比斯:
我們?nèi)匀皇且患?strong>以研究為主導(dǎo)的機構(gòu),這就是我們在Google DeepMind的工作方式。
但是,我們逐漸擁有越來越大的產(chǎn)品供應(yīng)組,與谷歌的其它部分進行交互。盡管如此,我們?nèi)匀粐L試保護我們的基礎(chǔ)研究,使其能夠根據(jù)我們自己的研究路線圖進行更長遠和更開放的思考,而不僅僅是被產(chǎn)品路線圖所引導(dǎo)。
Q:你個人是如何跟上這些的?
哈薩比斯:
我之前常常把晚上的時間留給自己,我一直試圖保持這樣的習(xí)慣,作為一個夜貓子,我通常會在午夜到凌晨3點之間思考、閱讀研究論文和產(chǎn)生新想法。
但隨著時間的推移,盡管我仍然在倫敦,但我在加利福尼亞有了更多的團隊。因此,很多原本用于思考的時間現(xiàn)在都用來處理電話會議了。所以,我需要考慮如何重新規(guī)劃這段時間。
Q:我知道你是簽署了關(guān)于真實存在性風(fēng)險警告的公開信的人之一,雖然這種風(fēng)險沒有具體定義。你對希望與災(zāi)難論持何種態(tài)度?
哈薩比斯:
我認(rèn)為這個問題的兩端都存在很多瘋狂的炒作。
一邊是現(xiàn)在所謂的“災(zāi)難陣營”,人們認(rèn)為事情肯定會出錯。另一邊是“Pollyanna陣營”,他們認(rèn)為這只是另一種技術(shù)。
我們在移動互聯(lián)網(wǎng)的發(fā)展中已經(jīng)見過這種情況。作為一個社會,作為人類,我們具有極強的適應(yīng)能力,這些變化似乎并不特別。
然而,我堅信這種看法是錯誤的。我認(rèn)為這將比互聯(lián)網(wǎng)或移動互聯(lián)網(wǎng)等技術(shù)的影響要大得多,這是一個劃時代的定義。
我認(rèn)為越來越多的人開始意識到這一點,我從小就有這種想法,這也是我為什么一生都在從事這一領(lǐng)域工作。我相信這將帶來巨大的影響。
當(dāng)然,我之所以全身心投入,是因為我相信AI將對世界產(chǎn)生極其正面的影響。借助AI,我們即將能夠治愈所有疾病,通過材料科學(xué)和新能源幫助解決氣候問題,以及在我們?nèi)粘I钪刑岣呱a(chǎn)力,豐富我們的生活,并自動處理日常任務(wù)。
我認(rèn)為這些都是令人驚奇的,而且即將到來。
但這些系統(tǒng)存在風(fēng)險,這些是新系統(tǒng),是新技術(shù),它們非常強大。我在游戲的微觀世界中見證了這一點。
比如下棋,你從一個早上還是隨機的系統(tǒng)AlphaZero開始,到上午的咖啡休息時間,它就已經(jīng)變得比我強了。到了午餐時間,它已經(jīng)比世界冠軍還要強。然后到了下午,在八小時內(nèi),它已經(jīng)超越了世界上最好的固定編程的國際象棋計算機。
在八小時內(nèi)從隨機狀態(tài)變成世界上最棒的國際象棋實體,我實際上觀察了那個過程,這是相當(dāng)不可思議的。
當(dāng)然,那只是一個游戲,范圍很窄,但我看不出為什么那種能力不能被推廣到更通用的系統(tǒng)、語言和世界模型等領(lǐng)域。
因此,它將非常強大,但必須小心處理。
我認(rèn)為我們現(xiàn)在還不知道。所以我簽署那封信的原因是我想對那種“這里沒什么可看的”的Pollyanna主義提出一些反對意見,實際上存在一些未知的風(fēng)險,我們需要定義它們,我認(rèn)為我們還有時間,但對于這樣重大的事情來說,十年并不是很長的時間。
因此,我們需要在可控性、在理論層面上理解這些系統(tǒng)的行為等方面進行更多的研究,還有非常重要的事情,比如如何為這些系統(tǒng)定義目標(biāo)和價值觀,以及如何確保它們堅持這些目標(biāo)和價值觀。
這些都是當(dāng)前新興技術(shù)中的未知數(shù)。
所以我會說我是一個謹(jǐn)慎的樂觀主義者。我認(rèn)為如果我們能團結(jié)起來,國際上合作,集中最好的智力,現(xiàn)在就開始行動,我們將能解決這個問題。
因此,我只是在鼓勵這種事情發(fā)生。我相信,只要有足夠的時間和智力,我們可以做對。但是,存在風(fēng)險,我們不能走捷徑。我們需要以應(yīng)有的尊重和敬畏來對待這項技術(shù)。
因為我們正處于這項技術(shù)的風(fēng)口浪尖。
Q:你所說的讓我有些不安。你描述的系統(tǒng),似乎有可能在很大程度上取代人類的價值。
哈薩比斯:
我不這么認(rèn)為。我認(rèn)為即將出現(xiàn)一些重要的哲學(xué)討論。這些討論很快就會展開。比如,我們應(yīng)該如何擴散?
如果AGI起作用,我們應(yīng)該處于一個極大豐富的時代,像能源這樣的資源不應(yīng)該存在短缺的情況。所以我認(rèn)為這確實會改變經(jīng)濟的動態(tài)。
我說的是長遠來看。因此,我們現(xiàn)在需要開始思考這個問題,為此做準(zhǔn)備。比如,我們想如何分配那額外的豐富和財富,我們現(xiàn)在就需要開始考慮這些問題。
參考鏈接:[1]https://x.com/GoogleDeepMind/status/1846974292963066199[2]https://x.com/tsarnick/status/1846994737527771642