當(dāng)前位置：人工智能實(shí)驗(yàn)室> 人工智能動(dòng)態(tài) > 前OpenAI首席研究官：AI下一步是什么？

前OpenAI首席研究官：AI下一步是什么？
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2024-12-20 20:37:36 瀏覽：100次

導(dǎo)讀：在人工智能領(lǐng)域，很少有人比Bob McGrew更引人注目。作為OpenAI的前首席研究官，McGrew在過(guò)去六年半中一直是AI技術(shù)實(shí)現(xiàn)突破的關(guān)鍵人物。周三，在離開(kāi)OpenAI一個(gè)多月后，McGrew罕見(jiàn)接受了外界的采訪。當(dāng)?shù)貢r(shí)間18日，Bob McGrew在RedPoint AI播客中，討論了AI的未來(lái)，包括大模型是否遇到了瓶頸，機(jī)器人、AI視頻未來(lái)如何發(fā)展等問(wèn)題。McGrew首先回應(yīng)了當(dāng)前關(guān)于大模型的能力是否達(dá)到 ......

在人工智能領(lǐng)域，很少有人比Bob McGrew更引人注目。作為OpenAI的前首席研究官，McGrew在過(guò)去六年半中一直是AI技術(shù)實(shí)現(xiàn)突破的關(guān)鍵人物。周三，在離開(kāi)OpenAI一個(gè)多月后，McGrew罕見(jiàn)接受了外界的采訪。

當(dāng)?shù)貢r(shí)間18日，Bob McGrew在RedPoint AI播客中，討論了AI的未來(lái)，包括大模型是否遇到了瓶頸，機(jī)器人、AI視頻未來(lái)如何發(fā)展等問(wèn)題。

McGrew首先回應(yīng)了當(dāng)前關(guān)于大模型的能力是否達(dá)到極限的爭(zhēng)論，他認(rèn)為，大模型還有非常大的進(jìn)步空間，但這是一個(gè)緩慢的、需要數(shù)年來(lái)完善的過(guò)程。

他指出，外界對(duì)于模型能力的看法與實(shí)驗(yàn)室內(nèi)部的看法存在較大差異。對(duì)于外界來(lái)說(shuō)，大模型的發(fā)展似乎是一個(gè)快速的過(guò)程，但對(duì)于實(shí)驗(yàn)室內(nèi)部人士來(lái)說(shuō)，每一個(gè)進(jìn)步都需要投入巨大的計(jì)算資源。比如，從GPT-3到GPT-4，計(jì)算能力增加了100倍，這種增長(zhǎng)不僅來(lái)自于增加更多的芯片和數(shù)據(jù)中心，還包括算法的改進(jìn)。

McGrew強(qiáng)調(diào)，預(yù)訓(xùn)練的進(jìn)步需要巨大的計(jì)算量，這通常涉及到建造新的數(shù)據(jù)中心，而這又是一個(gè)緩慢的過(guò)程。他提到，從GPT-4進(jìn)化到GPT-5的過(guò)程中，GPT的能力可能只出現(xiàn)了10倍的增長(zhǎng)。

McGrew還預(yù)測(cè)，未來(lái)視頻模型的質(zhì)量將得到顯著提升，完全由AI生成的、足以獲獎(jiǎng)的電影可能會(huì)在兩年內(nèi)出現(xiàn)，而且成本將大幅下降。

在討論機(jī)器人技術(shù)時(shí)，McGrew表現(xiàn)出了非常高的熱情。他相信機(jī)器人技術(shù)將在五年內(nèi)得到普及，認(rèn)為現(xiàn)在是一個(gè)創(chuàng)建機(jī)器人公司的好時(shí)機(jī)，因?yàn)榛A(chǔ)模型在快速啟動(dòng)和泛化方面取得了突破性進(jìn)展。

McGrew還認(rèn)為，AGI（通用人工智能）可能不會(huì)有一個(gè)明確的轉(zhuǎn)折點(diǎn)，而是一系列漸近的發(fā)展。他預(yù)測(cè)，隨著AI的進(jìn)步，我們將進(jìn)入一個(gè)智能無(wú)處不在且免費(fèi)的世界，到那時(shí)能動(dòng)性將是最稀缺的資源之一。

華爾街見(jiàn)聞?wù)砹吮敬卧L談的亮點(diǎn)觀點(diǎn)：

從GPT-2到GPT-3，或者從GPT-3到GPT-4，有效的計(jì)算量增加了100倍。這就是這種增量所代表的意義。你可以通過(guò)增加浮點(diǎn)運(yùn)算次數(shù)、增加芯片、擴(kuò)大數(shù)據(jù)中心和改進(jìn)算法來(lái)實(shí)現(xiàn)這一點(diǎn)。算法改進(jìn)可以帶來(lái)一些收益50%、2倍或3倍就已經(jīng)很了不起了。但從根本上說(shuō)，你必須等待新的數(shù)據(jù)中心建成。

從根本上說(shuō)，這是一個(gè)非常緩慢的、需要數(shù)年時(shí)間的過(guò)程。事實(shí)上，在你看到完整的代際過(guò)渡，比如從 GPT-4 到 GPT-5 之前，你將會(huì)看到一些只有10倍提升的東西。人們常常忘記，我們是從 GPT-3 到 GPT-3.5 再到 GPT-4 的。

我認(rèn)為我們必須等待，看看下一代模型何時(shí)發(fā)布。如果你看看像O1這樣的東西，我們已經(jīng)能夠利用強(qiáng)化學(xué)習(xí)取得進(jìn)展。通過(guò)各種指標(biāo)來(lái)看，O1代表著比GPT-4高100倍的計(jì)算量。有些人可能沒(méi)有意識(shí)到這一點(diǎn)，因?yàn)闆Q定將其命名為O1而不是GPT-5。然而，實(shí)際上，這是一個(gè)新一代的模型。

所以如果我考慮一下今天的視頻模型和兩年后的視頻模型之間的差異，首先是質(zhì)量會(huì)更好�，F(xiàn)在的瞬時(shí)質(zhì)量已經(jīng)非常好了。另一方面，另一個(gè)類比是，我實(shí)際上認(rèn)為它會(huì)非常像大型語(yǔ)言模型，如果你想要一個(gè)GPT-3質(zhì)量的token，它比GPT-3剛出現(xiàn)時(shí)便宜100倍。Sora的情況也會(huì)如此，你將能夠看到這些非常漂亮、逼真的視頻，而且它們的成本幾乎為零。

（AI生成電影）贏得一個(gè)獎(jiǎng)項(xiàng)某種程度上來(lái)說(shuō)門檻太低了，對(duì)吧？我想有很多頒獎(jiǎng)典禮......我覺(jué)得我們會(huì)在兩年后看到它，但它實(shí)際上會(huì)比我剛才說(shuō)的更沒(méi)那么令人印象深刻，因?yàn)槟阆肟此脑虿皇且驗(yàn)橐曨l本身，而是因?yàn)橛幸晃粚?dǎo)演擁有創(chuàng)意愿景，并使用視頻模型來(lái)實(shí)現(xiàn)他的創(chuàng)意愿景。

我相信機(jī)器人技術(shù)將在五年后得到廣泛應(yīng)用，盡管會(huì)有一些限制。因此，我認(rèn)為現(xiàn)在是創(chuàng)辦一家機(jī)器人公司的好時(shí)機(jī)。我不會(huì)預(yù)測(cè)機(jī)器人何時(shí)進(jìn)入家庭，但我認(rèn)為你會(huì)看到它被廣泛應(yīng)用。

我很難理解AGI的概念。而且，我認(rèn)為，如果說(shuō)有什么的話，我對(duì)AGI有一個(gè)很深的批判，那就是不存在一個(gè)明確的轉(zhuǎn)折時(shí)刻，實(shí)際上，這些問(wèn)題是分形的。而且，我們將看到越來(lái)越多的事物被自動(dòng)化。但不知怎么的，我們我不知道。我有一種感覺(jué)，它會(huì)變得非常平庸，不知何故，我們都會(huì)開(kāi)著自動(dòng)駕駛汽車去辦公室，在那里指揮著人工智能大軍。然后我們會(huì)覺(jué)得，哦，這有點(diǎn)無(wú)聊。感覺(jué)仍然像在辦公室，我的老板仍然是個(gè)白癡。這大概就是我們AGI的未來(lái)。

我們正在從一個(gè)智能可能是社會(huì)中最稀缺資源的時(shí)代，過(guò)渡到一個(gè)智能將無(wú)處不在且免費(fèi)的時(shí)代。那么，稀缺的生產(chǎn)要素又是什么呢？我猜是能動(dòng)性。你需要提出什么正確的問(wèn)題？你需要追求哪些正確的項(xiàng)目？我認(rèn)為這些類型的問(wèn)題對(duì)于人工智能來(lái)說(shuō)很難為我們解決。我認(rèn)為這些將是人類需要弄清楚的核心問(wèn)題。

以下是本次訪談的文字實(shí)錄全文（由AI翻譯）：

主持人Jacob：

Bob McGrew 在 OpenAI 擔(dān)任首席研究官六年半。他最近在幾個(gè)月前離職，我們有幸能在“無(wú)監(jiān)督學(xué)習(xí)”播客上成為他首次亮相的播客之一。因此，我們有機(jī)會(huì)向他詢問(wèn)關(guān)于人工智能未來(lái)的一切。我們討論了模型是否已經(jīng)觸及瓶頸，還討論了機(jī)器人模型、視頻模型、計(jì)算機(jī)使用模型，以及 Bob 預(yù)見(jiàn)的未來(lái)時(shí)間線和能力。我們談到了 OpenAI 獨(dú)特的文化以及是什么使其研究如此有效，以及一些關(guān)鍵的決策點(diǎn)和經(jīng)歷這些決策的感受。我們探討了為什么 AGI 可能感覺(jué)和今天沒(méi)什么不同，Bob 還分享了他離開(kāi) OpenAI 的原因以及下一步的計(jì)劃。我認(rèn)為大家會(huì)非常喜歡這一期節(jié)目。話不多說(shuō)，下面是 Bob。Bob，非常感謝你來(lái)參加播客。謝謝邀請(qǐng)，我很期待這次對(duì)話。真的很高興你能來(lái)。我知道我們會(huì)談?wù)摵芏嗖煌脑掝}。我想我們不妨從一個(gè)我覺(jué)得現(xiàn)在大家最關(guān)心的問(wèn)題開(kāi)始，也就是關(guān)于模型能力是否已經(jīng)觸及瓶頸的激烈辯論。我們很想聽(tīng)聽(tīng)你對(duì)此的看法，以及你覺(jué)得預(yù)訓(xùn)練方面還有多少潛力可挖。

Bob McGrew：好的，我覺(jué)得這可能是外界觀察者和大型實(shí)驗(yàn)室內(nèi)部人員看法分歧最大的地方。我認(rèn)為，如果從外界來(lái)看，很多人最初開(kāi)始關(guān)注人工智能是因?yàn)?ChatGPT。然后過(guò)了六個(gè)月，GPT-4 就出現(xiàn)了。感覺(jué)一切都在快速加速，并且正在取得進(jìn)展。然而，GPT-4 是一年半前發(fā)布的，而且大家都知道它在此之前就已經(jīng)訓(xùn)練好了。那么，現(xiàn)在發(fā)生了什么？為什么沒(méi)有新的東西出現(xiàn)，對(duì)吧？

內(nèi)部的看法截然不同。在外面，人們想知道，我們是不是遇到了數(shù)據(jù)瓶頸？到底發(fā)生了什么？但你必須記住，要取得預(yù)訓(xùn)練的進(jìn)展，特別是，需要大幅增加計(jì)算量。從 GPT-2 到 GPT-3，或者從 GPT-3 到 GPT-4，有效的計(jì)算量增加了 100 倍。這就是這種增量所代表的意義。你可以通過(guò)增加浮點(diǎn)運(yùn)算次數(shù)、增加芯片、擴(kuò)大數(shù)據(jù)中心和改進(jìn)算法來(lái)實(shí)現(xiàn)這一點(diǎn)。算法改進(jìn)可以帶來(lái)一些收益50%、2倍或 3倍就已經(jīng)很了不起了。但從根本上說(shuō)，你必須等待新的數(shù)據(jù)中心建成。

正在建設(shè)的新數(shù)據(jù)中心并不少。你只要看看新聞就能發(fā)現(xiàn)，像 Meta、X 和其他前沿實(shí)驗(yàn)室也在建立新的數(shù)據(jù)中心，即使這些新聞并不總是登上頭條。但從根本上說(shuō)，這是一個(gè)非常緩慢的、需要數(shù)年時(shí)間的過(guò)程。事實(shí)上，在你看到完整的代際過(guò)渡，比如從 GPT-4 到 GPT-5 之前，你將會(huì)看到一些只有 10 倍提升的東西。人們常常忘記，我們是從 GPT-3 到 GPT-3.5 再到 GPT-4 的。

現(xiàn)在有趣的是，預(yù)訓(xùn)練正在進(jìn)行中。我認(rèn)為我們必須等待，看看下一代模型何時(shí)發(fā)布。如果你看看像 O1 這樣的東西，我們已經(jīng)能夠利用強(qiáng)化學(xué)習(xí)取得進(jìn)展。通過(guò)各種指標(biāo)來(lái)看，O1 代表著比 GPT-4 高 100 倍的計(jì)算量。有些人可能沒(méi)有意識(shí)到這一點(diǎn)，因?yàn)闆Q定將其命名為 O1 而不是 GPT-5。然而，實(shí)際上，這是一個(gè)新一代的模型。

當(dāng)下一代，假設(shè)的 GPT-4.5 被訓(xùn)練出來(lái)時(shí)，有趣的問(wèn)題是，這種預(yù)訓(xùn)練的進(jìn)展如何與強(qiáng)化學(xué)習(xí)過(guò)程相比較？我認(rèn)為，我們只能拭目以待，看看會(huì)發(fā)布什么消息。

主持人Jordan：這就引出了一個(gè)問(wèn)題，考慮到進(jìn)入 2025 年的多年過(guò)程，你認(rèn)為明年人工智能的進(jìn)展會(huì)像去年一樣多嗎，還是你認(rèn)為事情會(huì)開(kāi)始放緩？

Bob McGrew： 嗯，我認(rèn)為會(huì)有進(jìn)展。我認(rèn)為這會(huì)是不同的進(jìn)展。一件事是，當(dāng)你進(jìn)入任何下一代時(shí)，你總是會(huì)遇到在前一代中沒(méi)有看到的問(wèn)題。因此，即使數(shù)據(jù)中心已經(jīng)建好，人們也需要時(shí)間來(lái)解決問(wèn)題并完成模型的訓(xùn)練。

我們用來(lái)訓(xùn)練 O1 的強(qiáng)化學(xué)習(xí)過(guò)程，也就是 OpenAI 用來(lái)訓(xùn)練 O1 的過(guò)程，創(chuàng)建了一個(gè)更長(zhǎng)、更連貫的思維鏈，有效地將更多的計(jì)算量融入到答案中。所以，你知道，如果一個(gè)模型需要幾秒鐘才能生成答案，而另一個(gè)模型需要，比如說(shuō)，幾個(gè)小時(shí)才能生成答案，那么如果你能真正利用它，那就是 10000 倍的計(jì)算量，對(duì)吧？

老實(shí)說(shuō)，我們從大約 2020 年就開(kāi)始思考如何使用測(cè)試時(shí)間計(jì)算。最后，我認(rèn)為這實(shí)際上是如何做到這一點(diǎn)的真正答案，即如何在不浪費(fèi)大量計(jì)算資源的情況下做到這一點(diǎn)。這樣做的好處是它不需要新的數(shù)據(jù)中心。在這里，有很多改進(jìn)的空間，因?yàn)檫@是一種剛剛開(kāi)始的新技術(shù)，并且有很多算法增強(qiáng)的機(jī)會(huì)。

從理論上講，沒(méi)有理由說(shuō)用于使 O1 從幾秒鐘，比如 GPT-4 可以在幾秒鐘內(nèi)完成的事情，到 O1 花費(fèi) 30 秒、1 分鐘或幾分鐘來(lái)思考的相同基本原理和想法不能擴(kuò)展到幾個(gè)小時(shí)甚至幾天。就像從 GPT-3 到 GPT-4 一樣，沒(méi)有基礎(chǔ)的新技術(shù)；兩者都以大致相同的方式進(jìn)行訓(xùn)練，但擴(kuò)展是非常困難的。

所以這實(shí)際上是問(wèn)題的核心：你真的能進(jìn)行擴(kuò)展嗎？我認(rèn)為這將是我們將會(huì)看到的進(jìn)步類型，并且它會(huì)是最令人興奮的。

主持人Jacob： 是的，在 2025 年�？紤]到對(duì)測(cè)試時(shí)間計(jì)算的關(guān)注以及當(dāng)前使用的 O1，我認(rèn)為思考人們實(shí)際上將如何使用這些模型真的很有趣，對(duì)吧？我認(rèn)為你最近發(fā)了一條推文，我覺(jué)得很有意思，內(nèi)容是關(guān)于你需要這些新的產(chǎn)品形態(tài)（form factor）來(lái)解鎖某些模型的功能。所以也許可以稍微展開(kāi)一下。例如，你有沒(méi)有看到任何你覺(jué)得在使用這些模型時(shí)很有趣的早期產(chǎn)品形態(tài)？

Bob McGrew： 嗯，是的。為了解釋這個(gè)問(wèn)題，聊天機(jī)器人已經(jīng)出現(xiàn)一段時(shí)間了。今天人們與聊天機(jī)器人的大多數(shù)互動(dòng)，GPT-4 級(jí)別的模型都能很好地完成這些任務(wù)。你知道，如果你問(wèn) ChatGPT，誰(shuí)是第四位羅馬皇帝？或者我如何加熱印度香米？我們的大多數(shù)日常對(duì)話都能很好地處理。

當(dāng)我們考慮發(fā)布 O1 預(yù)覽版時(shí)，有很多關(guān)于人們是否會(huì)使用它以及他們是否會(huì)找到用它來(lái)做什么的問(wèn)題。我認(rèn)為這些問(wèn)題是正確的。這關(guān)系到理解需要用這個(gè)模型做什么才能真正從中獲得價(jià)值。編程是這方面的一個(gè)很好的用例，因?yàn)樗岢隽艘粋€(gè)結(jié)構(gòu)化的問(wèn)題，你試圖在很長(zhǎng)一段時(shí)間內(nèi)取得進(jìn)展，并且它顯著地利用了推理能力。

另一個(gè)例子是如果你正在撰寫政策簡(jiǎn)報(bào)。在這種情況下，你需要撰寫一份需要有意義且具有凝聚力的長(zhǎng)篇文檔。事實(shí)是，雖然有很多程序員，但大多數(shù)非程序員的人并沒(méi)有每天都需要解決這樣的任務(wù)。然而，回到這里潛在的突破，重要的是要有一個(gè)連貫的思維鏈和一個(gè)結(jié)構(gòu)化的方法來(lái)解決問(wèn)題。

這個(gè)過(guò)程不僅僅包括思考問(wèn)題；它還可以包括采取行動(dòng)和制定行動(dòng)計(jì)劃。對(duì)于像 O1 這樣的模型，我最興奮的事情我相信很快會(huì)有其他實(shí)驗(yàn)室推出類似的模型是使用它們來(lái)實(shí)現(xiàn)長(zhǎng)期行動(dòng)，本質(zhì)上是充當(dāng)代理。雖然我認(rèn)為“代理”這個(gè)術(shù)語(yǔ)被過(guò)度使用了，并且沒(méi)有清楚地傳達(dá)我們?cè)噲D實(shí)現(xiàn)的目標(biāo)，但在我的生活中，我有很多任務(wù)希望模型能為我預(yù)訂?wèn)|西、為我購(gòu)物，并以涉及與世界其他部分互動(dòng)的方式來(lái)解決問(wèn)題。

我認(rèn)為這是我們真正需要解決的產(chǎn)品形態(tài)：理解它是什么以及我們?nèi)绾斡行У夭渴鹚�。就目前而言，我認(rèn)為還沒(méi)有人弄清楚這一點(diǎn)。

主持人Jacob： 這太有趣了。我的意思是，這完全說(shuō)得通。我覺(jué)得每個(gè)人，你知道的，都會(huì)對(duì)這些智能體能做什么以及它們能為人們和企業(yè)解決什么問(wèn)題產(chǎn)生無(wú)限遐想。那么，今天實(shí)現(xiàn)這一切的最大障礙是什么呢？顯然，你們已經(jīng)看到了早期的一些模型，比如 Anthropic 發(fā)布的計(jì)算機(jī)使用模型，而且，我確信其他實(shí)驗(yàn)室也在研究這個(gè)。但是，當(dāng)你思考是什么阻礙我們達(dá)到目標(biāo)時(shí)，有哪些難題仍然需要解決？

Bob McGrew： 是的，有很多問(wèn)題。我認(rèn)為最直接的問(wèn)題是可靠性。所以，你知道的，如果我要求做某事，先拋開(kāi)動(dòng)作不談，對(duì)吧？如果我要求智能體代表我做某事，即使只是思考或?yàn)槲揖帉懸恍┐a，而我需要離開(kāi)五分鐘或一個(gè)小時(shí)讓它工作，如果它偏離了任務(wù)并犯了錯(cuò)誤，等我回來(lái)時(shí)它什么都沒(méi)做，那我只是白白浪費(fèi)了一個(gè)小時(shí)。這可是個(gè)大問(wèn)題。

現(xiàn)在再加上這個(gè)智能體將要在現(xiàn)實(shí)世界中執(zhí)行動(dòng)作。也許它在為我買東西。也許它在提交一個(gè)公關(guān)稿。也許它在代表我發(fā)送便條、電子郵件、Slack 消息。如果它做得不好，就會(huì)有后果。我至少會(huì)感到尷尬，甚至可能會(huì)損失一些錢。因此，可靠性就變得比過(guò)去更加重要。

我認(rèn)為在考慮可靠性時(shí)，有一個(gè)經(jīng)驗(yàn)法則，即從 90% 的可靠性提高到 99% 的可靠性，計(jì)算量可能會(huì)增加一個(gè)數(shù)量級(jí)。這是 10 倍的提升。要從 99% 的可靠性提高到 99.9% 的可靠性，則需要再增加一個(gè)數(shù)量級(jí)的提升。因此，每增加一個(gè)“9”，都要求模型性能有巨大的飛躍。這 10 倍的改進(jìn)是顯著的，代表了一兩年時(shí)間的工作量。

所以我認(rèn)為這是我們首先要面臨的問(wèn)題。我認(rèn)為第二個(gè)有趣的問(wèn)題是，到目前為止，我們所談?wù)摰囊磺卸际轻槍?duì)消費(fèi)者的，對(duì)吧？你沒(méi)有嵌入到企業(yè)中。但是，當(dāng)你在談?wù)撝悄荏w在執(zhí)行任務(wù)時(shí)，對(duì)于我們很多人來(lái)說(shuō)，那將是我們?cè)诠ぷ髦凶龅氖虑�，是嵌入在企業(yè)中的事情。我認(rèn)為這會(huì)帶來(lái)一系列其他的考慮因素。

主持人Jordan： 這很有趣。我們今天在企業(yè)中看到，許多咨詢公司實(shí)際上做得很好，因?yàn)槟壳跋蚱髽I(yè)部署這些技術(shù)需要很多手把手的指導(dǎo)。你認(rèn)為這種手把手指導(dǎo)以及企業(yè)對(duì)幫助的需求會(huì)持續(xù)一段時(shí)間嗎？還是你認(rèn)為它會(huì)變得更加易于使用，企業(yè)將來(lái)可以非常容易地部署這些大型語(yǔ)言模型？

Bob McGrew： 是的，我認(rèn)為這是一個(gè)非常有趣的問(wèn)題。而且，我的意思是，即使是開(kāi)始構(gòu)建，那么在企業(yè)中部署大型語(yǔ)言模型的問(wèn)題是什么呢？好吧，如果它要為你自動(dòng)化一個(gè)任務(wù)或者做你的工作，它可能需要上下文。因?yàn)樵谙M(fèi)者領(lǐng)域，沒(méi)有太多上下文。好吧，你喜歡紅色，很好。沒(méi)什么意思。

主持人Jacob：感謝你用紅色作為例子（自己的播客叫RedPoint）。

Bob McGrew： 但是，你知道，在企業(yè)中，你知道，你的同事是誰(shuí)？你正在從事什么項(xiàng)目？你的代碼庫(kù)是什么？你知道，人們嘗試過(guò)什么？人們喜歡和不喜歡什么？所有這些信息都在企業(yè)中以一種環(huán)境的方式存在。它在你的 Slack 中。它在你的文檔中。你知道，也許它在你的 Figma 或其他什么地方。那么你如何獲得訪問(wèn)權(quán)限呢？

好吧，你需要自己構(gòu)建一些一次性的東西。我認(rèn)為肯定有一種方法是人們構(gòu)建這些連接器的庫(kù)，然后你就可以進(jìn)來(lái)做到這一點(diǎn)。這與我們?cè)?Palantir 所做的工作非常相似，Palantir 解決的根本問(wèn)題是集成企業(yè)中的數(shù)據(jù)。我認(rèn)為這也是為什么像 Palantir 的人工智能平臺(tái) AIP 如此有趣的原因之一。所以我認(rèn)為這是第一條路徑，你有點(diǎn)像在構(gòu)建這些東西的庫(kù)�？梢曰诖藰�(gòu)建整個(gè)平臺(tái)。

另一個(gè)是進(jìn)行計(jì)算機(jī)使用（Computer Use）的機(jī)會(huì)。所以現(xiàn)在，你不再需要這種非常具體且可能定制的方式來(lái)做，你現(xiàn)在擁有一個(gè)可以用來(lái)處理所有事情的工具。Anthropic 推出了這個(gè)；這真的很有趣，我們?cè)?Anthropic 的人在 2020 年離開(kāi) OpenAI 之前就已經(jīng)在討論這些計(jì)算機(jī)使用的智能體了，Google DeepMind 也發(fā)表了關(guān)于這方面的論文。每個(gè)實(shí)驗(yàn)室都考慮過(guò)這個(gè)問(wèn)題，并致力于解決這個(gè)問(wèn)題。

計(jì)算機(jī)使用的智能體與這些程序化 API 集成不同之處在于，現(xiàn)在，由于你控制的是鼠標(biāo)和鍵盤，你現(xiàn)在采取的行動(dòng)涉及更多步驟。你可能需要 10 倍甚至 100 倍于使用這些程序化集成所需的令牌數(shù)量。

所以現(xiàn)在，我們又回到了什么？你需要一個(gè)具有非常長(zhǎng)且連貫的思維鏈的模型，能夠在很長(zhǎng)一段時(shí)間內(nèi)始終如一地決問(wèn)題，這正是 O1 所解決的那類問(wèn)題。我相信還有其他方法可以解決這個(gè)問(wèn)題。但我認(rèn)為這將是我們未來(lái)幾年將會(huì)看到的一個(gè)突破。

主持人Jacob： 明年。你認(rèn)為最終會(huì)如何發(fā)展？因?yàn)槲蚁胍环矫�，顯然，可以在任何上下文中使用計(jì)算機(jī)的通用模型似乎很有吸引力。我想，要達(dá)到 99.999% 的可靠性可能很困難。而且，你知道，在不同的點(diǎn)上可能會(huì)有很多步驟出錯(cuò)。你知道，關(guān)于這如何運(yùn)作的另一種觀點(diǎn)是，我確信，如果以某種方式開(kāi)放底層應(yīng)用程序 API，這些問(wèn)題中的一些可能會(huì)被簡(jiǎn)化，對(duì)吧？或者其他方法，或者你可以為使用 Salesforce 或我不知道的某些特定工具提供特定的模型。如果你可以訪問(wèn)底層體驗(yàn)，那么集成最終將成為一個(gè)巨大的優(yōu)勢(shì)。這樣你就可以在瞬間完成事情，而不是坐在那里看著計(jì)算機(jī)在屏幕上做事。

Bob McGrew：是的，嗯，我的意思是，我認(rèn)為你肯定會(huì)看到這些方法的混合使用，其中一些使用這些集成，而另一些，你知道，計(jì)算機(jī)使用成為一種備用方案，如果你沒(méi)有定制的東西可以使用。然后也許你會(huì)看看人們使用哪些東西，如果可行，你會(huì)提出更詳細(xì)的集成。

我認(rèn)為關(guān)于你會(huì)看到 Salesforce 專用的計(jì)算機(jī)使用（Computer Use）智能體的問(wèn)題，從技術(shù)上講，這對(duì)我來(lái)說(shuō)沒(méi)有太大的意義，因?yàn)槲艺J(rèn)為你從根本上利用的是數(shù)據(jù)。有人出去收集了大量關(guān)于如何使用 Salesforce 的數(shù)據(jù)集。

你可以把這些數(shù)據(jù)扔進(jìn)與 Anthropic、OpenAI 和 Google 分享這些數(shù)據(jù)集對(duì) Salesforce 有利。他們訓(xùn)練自己的模型。我認(rèn)為每個(gè)應(yīng)用程序提供商都會(huì)希望這是公開(kāi)的，并且是每個(gè)基礎(chǔ)模型的一部分。所以我不認(rèn)為，你知道，對(duì)我來(lái)說(shuō)，這似乎沒(méi)有理由以這種方式擁有專門的模型。

主持人Jacob： 不，這確實(shí)是一個(gè)很有說(shuō)服力的觀點(diǎn)，因?yàn)槲矣X(jué)得，當(dāng)你在一個(gè)競(jìng)爭(zhēng)激烈的領(lǐng)域，而你的競(jìng)爭(zhēng)對(duì)手正在公開(kāi)他們的數(shù)據(jù)，并且他們的產(chǎn)品變得更容易使用時(shí)，你肯定也希望你的產(chǎn)品是這樣的。

Bob McGrew： 是的，對(duì)我來(lái)說(shuō)有點(diǎn)神秘，為什么還沒(méi)出現(xiàn)那種人們把數(shù)據(jù)塞進(jìn)大型語(yǔ)言模型的生態(tài)系統(tǒng)。這實(shí)際上就相當(dāng)于谷歌的SEO。

主持人Jacob： 這真是個(gè)很有趣的觀點(diǎn)。你認(rèn)為我們離計(jì)算機(jī)使用的廣泛應(yīng)用還有多遠(yuǎn)？

Bob McGrew： 嗯，我的意思是，我認(rèn)為對(duì)于這些事情有一個(gè)很好的經(jīng)驗(yàn)法則，那就是當(dāng)你看到一個(gè)演示，它超級(jí)有吸引力，但還不太好用。用起來(lái)會(huì)很痛苦。然后，你知道，給它一年時(shí)間，它就會(huì)好十倍。而且，這種改進(jìn)是呈對(duì)數(shù)線性增長(zhǎng)的。所以好十倍，你知道，只是一個(gè)級(jí)別的改進(jìn)。但一個(gè)級(jí)別的改進(jìn)已經(jīng)相當(dāng)了不起。你會(huì)開(kāi)始看到它被用于有限的使用場(chǎng)景。然后再給它第二年。到那時(shí)，它會(huì)出奇地有效，但你不能每次都依賴它。我們現(xiàn)在用聊天機(jī)器人就是這樣，你仍然需要擔(dān)心它們會(huì)產(chǎn)生幻覺(jué)。那么，采用的問(wèn)題實(shí)際上取決于你要求的可靠性水平。任何可以容忍錯(cuò)誤的領(lǐng)域都會(huì)比那些不能容忍錯(cuò)誤的領(lǐng)域更快地實(shí)現(xiàn)自動(dòng)化。

主持人Jacob： 所以我想回到喬丹最初的問(wèn)題，基本上，現(xiàn)在你需要大量的輔助才能集成到正確的數(shù)據(jù)中，并定義定制的防護(hù)措施和工作流程，這是完全有道理的。那么，在“嘿，很棒的計(jì)算機(jī)使用模型，企業(yè)準(zhǔn)備簽約”之間，會(huì)存在什么樣的中間層呢？這個(gè)中間層會(huì)是什么樣的？

Bob McGrew： 伙計(jì)，我認(rèn)為應(yīng)該有初創(chuàng)公司來(lái)定義它。你知道，我認(rèn)為我們還不完全知道答案。我認(rèn)為，當(dāng)你擁有像計(jì)算機(jī)使用這樣的一般工具時(shí)，你會(huì)看到一個(gè)有趣的現(xiàn)象，它解決的問(wèn)題在難度上是分形的，它可以解決很多問(wèn)題。但隨后你會(huì)看到一個(gè)真正重要的問(wèn)題，而你無(wú)法完全解決它。然后你會(huì)說(shuō)，好的，現(xiàn)在我們要針對(duì)這個(gè)做一些非常具體的，也許我們會(huì)為此采用一種程序化的方法。所以我認(rèn)為我們會(huì)在一段時(shí)間內(nèi)看到各種方法的混合。

主持人Jordan： 我很好奇，你顯然一直在研究方面工作，并負(fù)責(zé)一些真正尖端的研究。我們稍微談到了測(cè)試時(shí)計(jì)算。你對(duì)其他哪些領(lǐng)域特別感興趣？

Bob McGrew： 嗯，我認(rèn)為我們已經(jīng)談過(guò)了預(yù)訓(xùn)練。我們已經(jīng)談過(guò)了測(cè)試時(shí)計(jì)算。另一個(gè)真正令人興奮的事情是多模態(tài)。多模態(tài)的重要日子。是的，今天發(fā)布了Sora。實(shí)際上，這在某種程度上是這個(gè)漫長(zhǎng)歷程的頂點(diǎn)。大型語(yǔ)言模型，我們假設(shè)是2018年發(fā)明的。很明顯，你可以應(yīng)用Transformer和一些相同的技術(shù)來(lái)適應(yīng)其他模態(tài)。所以你包含了視覺(jué)，有了圖像輸出、音頻輸入和音頻輸出。

首先，這些東西一開(kāi)始是作為類似DALLE或Whisper的輔助模型。最終，它們被集成到主模型中。長(zhǎng)期以來(lái)一直抵制這種做法的模態(tài)是視頻。我認(rèn)為Sora是第一個(gè)進(jìn)行演示的；其他公司，如Runway，以及一些其他的模型也相繼出現(xiàn)�，F(xiàn)在Sora本身已經(jīng)發(fā)布了。我認(rèn)為視頻與其他模態(tài)相比，有兩個(gè)真正有趣且不同的地方。

當(dāng)你創(chuàng)建圖像時(shí)，你可能真的只想通過(guò)一個(gè)提示來(lái)創(chuàng)建一個(gè)圖像。也許你嘗試幾次。如果你是專業(yè)的平面設(shè)計(jì)師，你可能會(huì)編輯這個(gè)圖像中的一些細(xì)節(jié)。但說(shuō)實(shí)話，我們都不是。這里的很多用途是，你需要一些幻燈片嗎？你是否想要一張圖片來(lái)搭配你的推文或演示文稿？這是一個(gè)非常直接的過(guò)程。

然而，對(duì)于視頻來(lái)說(shuō)，哇。我的意思是，這是一系列擴(kuò)展的事件。它不是一個(gè)提示。所以現(xiàn)在你實(shí)際上需要一個(gè)完整的用戶界面。你需要考慮如何使這個(gè)故事隨著時(shí)間的推移而展開(kāi)。我認(rèn)為這就是我們?cè)赟ora發(fā)布中看到的事情之一。Sora在這方面花費(fèi)了更多的時(shí)間思考；產(chǎn)品團(tuán)隊(duì)在這方面投入了比其他一些平臺(tái)更多的精力。

你還需要考慮的另一件事是，視頻的成本非常高。訓(xùn)練這些模型非常昂貴，運(yùn)行這些模型的成本也非常高。所以，雖然看到Sora質(zhì)量的視頻很有趣而且我認(rèn)為Sora的質(zhì)量確實(shí)更好但你必須稍微注意一下才能看到它的質(zhì)量更好，至少如果你只看一個(gè)短暫的片段的話。

現(xiàn)在，任何擁有Plus賬戶的人都可以使用Sora。OpenAI發(fā)布了每月200美元的Pro賬戶，其中包括無(wú)限制的Sora慢速生成。當(dāng)你擁有這種水平的質(zhì)量和分發(fā)時(shí)，兩個(gè)難題已經(jīng)解決了。這將是其他競(jìng)爭(zhēng)對(duì)手難以企及的高門檻。

主持人Jacob：視頻模型在未來(lái)幾年的發(fā)展會(huì)是什么樣的？我的意思是，顯然在大型語(yǔ)言模型領(lǐng)域，我們已經(jīng)看到了巨大的進(jìn)步，感覺(jué)去年的模型現(xiàn)在便宜了十倍，而且速度快得多。你認(rèn)為視頻方面也會(huì)有類似的改進(jìn)嗎？

Bob McGrew： 實(shí)際上，我認(rèn)為類比非常直接。所以如果我考慮一下今天的視頻模型和兩年后的視頻模型之間的差異，首先是質(zhì)量會(huì)更好�，F(xiàn)在的瞬時(shí)質(zhì)量已經(jīng)非常好了。你可以看到反射。如果你分享一些東西，所有難以解決的難題，你可以指出，哦，看，那里做了反射。有一些煙霧。你知道，困難的是擴(kuò)展的、連貫的生成。

所以SOAR產(chǎn)品團(tuán)隊(duì)擁有一個(gè)故事板功能，允許你在不同的時(shí)間點(diǎn)，比如每五秒或每十秒設(shè)置檢查點(diǎn)，以幫助為生成提供指導(dǎo)。你知道，從根本上說(shuō)，如果你想從幾秒鐘的視頻變成一個(gè)小時(shí)的視頻，這是一個(gè)非常困難的問(wèn)題。我認(rèn)為這是你將在下一代模型中看到的東西。

另一方面，另一個(gè)類比是，我實(shí)際上認(rèn)為它會(huì)非常像大型語(yǔ)言模型，如果你想要一個(gè)GPT-3質(zhì)量的token，它比GPT-3剛出現(xiàn)時(shí)便宜100倍。Sora的情況也會(huì)如此，你將能夠看到這些非常漂亮、逼真的視頻，而且它們的成本幾乎為零。

主持人Jacob： 我覺(jué)得夢(mèng)想是有一部由人工智能生成的完整電影，贏得一些獎(jiǎng)項(xiàng)之類的，你知道，用一個(gè)無(wú)恥的播客問(wèn)題來(lái)問(wèn)，你認(rèn)為我們什么時(shí)候會(huì)有這樣的電影？

Bob McGrew： 我只能猜一下。哦，天哪。是的。說(shuō)實(shí)話，贏得一個(gè)獎(jiǎng)項(xiàng)某種程度上來(lái)說(shuō)門檻太低了，對(duì)吧？我想有很多頒獎(jiǎng)典禮。真的，這是一部你真正想看的電影嗎？是的。我覺(jué)得我們會(huì)在兩年后看到它，但它實(shí)際上會(huì)比我剛才說(shuō)的更沒(méi)那么令人印象深刻，因?yàn)槟阆肟此脑虿皇且驗(yàn)橐曨l本身，而是因?yàn)橛幸晃粚?dǎo)演擁有創(chuàng)意愿景，并使用視頻模型來(lái)實(shí)現(xiàn)他的創(chuàng)意愿景。我認(rèn)為他們這樣做是因?yàn)樗麄兛梢栽谶@種媒介中做一些他們無(wú)法拍攝的東西。我們可以想象一下。我們這里沒(méi)有人是導(dǎo)演，但我們都可以想象很多可能性。我們不是平面設(shè)計(jì)師，也不是導(dǎo)演，但，是的，未來(lái)會(huì)是這樣。

主持人Jordan： 沒(méi)錯(cuò)。是的，我們這里有一些非常特定的技能。是的，我們看到很多公司涌現(xiàn)出來(lái)，試圖成為人工智能領(lǐng)域的皮克斯。我們總是會(huì)問(wèn)這個(gè)問(wèn)題，什么時(shí)候這才是真正可行的？所以聽(tīng)起來(lái)比我們至少預(yù)想的要快得多。

Bob McGrew： 這是我的猜測(cè)。一旦事情進(jìn)展到可以演示的階段，之后的進(jìn)展會(huì)非常快。在此之前，進(jìn)展非常緩慢，或者至少它是不可見(jiàn)的。

主持人Jordan： 我想從視頻轉(zhuǎn)向機(jī)器人，你一開(kāi)始加入 OpenAI 是為了研究很多機(jī)器人方面的東西。我們很想了解你對(duì)這個(gè)領(lǐng)域的看法，以及我們今天的處境，以及你認(rèn)為它將走向何方。

Bob McGrew： 這確實(shí)是一個(gè)非常私人的問(wèn)題。當(dāng)我離開(kāi) Palantir 時(shí)，我的一個(gè)想法是，機(jī)器人將成為深度學(xué)習(xí)變得真實(shí)的領(lǐng)域，而不僅僅是某人網(wǎng)站上的一個(gè)按鈕。所以，我在 Palantir 和 OpenAI 之間花了一年的時(shí)間深入了解機(jī)器人技術(shù)，用深度學(xué)習(xí)編寫了一些關(guān)于視覺(jué)的早期代碼。這是一個(gè)非常具有挑戰(zhàn)性的領(lǐng)域。當(dāng)時(shí)，我以為可能還要五年；那是215年，而那是完全錯(cuò)誤的。但是，我認(rèn)為現(xiàn)在是對(duì)的。我相信機(jī)器人技術(shù)將在五年后得到廣泛應(yīng)用，盡管會(huì)有一些限制。因此，我認(rèn)為現(xiàn)在是創(chuàng)辦一家機(jī)器人公司的好時(shí)機(jī)。

一個(gè)相當(dāng)明顯的觀點(diǎn)是，基礎(chǔ)模型在快速啟動(dòng)和運(yùn)行機(jī)器人方面取得了巨大突破，使其能夠在重要方面進(jìn)行泛化。這有幾個(gè)不同的方面。其中比較明顯的是，利用視覺(jué)并將視覺(jué)轉(zhuǎn)化為行動(dòng)計(jì)劃的能力，這是基礎(chǔ)模型帶來(lái)的。稍微不那么明顯，也許更有趣的方面是整個(gè)生態(tài)系統(tǒng)已經(jīng)發(fā)展起來(lái)了�，F(xiàn)在我已經(jīng)離開(kāi)了 OpenAI，我花了一些時(shí)間和創(chuàng)始人在一起，我和一些機(jī)器人創(chuàng)始人聊過(guò)。一位機(jī)器人創(chuàng)始人告訴我，他們實(shí)際上已經(jīng)設(shè)置了讓機(jī)器人能夠?qū)υ�。這真的很酷而且容易得多；你可以告訴機(jī)器人做什么，它會(huì)理解大意。它使用一些專門的模型來(lái)執(zhí)行操作。以前，寫出你想要的東西很麻煩，你必須坐在電腦前，而不是看著機(jī)器人。現(xiàn)在你只需要和它說(shuō)話就行了。

我認(rèn)為我們?nèi)匀徊磺宄Y(jié)果的一個(gè)主要區(qū)別在于，你是在模擬中學(xué)習(xí)還是在現(xiàn)實(shí)世界中學(xué)習(xí)。我們?cè)跈C(jī)器人領(lǐng)域這兩年的主要貢獻(xiàn)是展示了你可以在模擬器中訓(xùn)練，并使其推廣到現(xiàn)實(shí)世界。使用模擬器有很多原因；例如，在生產(chǎn)系統(tǒng)或現(xiàn)實(shí)世界中運(yùn)行是很麻煩的。你可以進(jìn)行免費(fèi)測(cè)試等等。但是，模擬器擅長(zhǎng)模擬剛體。如果你正在用堅(jiān)硬的物體進(jìn)行抓取和放置的任務(wù)，那就太好了。但是，世界上的很多東西都是軟綿綿的物體。你必須處理布料，或者，當(dāng)考慮倉(cāng)庫(kù)時(shí)，要處理紙板。不幸的是，模擬器在處理這些場(chǎng)景方面做得不是特別好。因此，對(duì)于任何想要真正通用的東西，我們現(xiàn)在唯一的方法就是使用現(xiàn)實(shí)世界的演示。正如你從最近出現(xiàn)的一些工作中所看到的，這實(shí)際上可以產(chǎn)生有希望的結(jié)果。

主持人Jacob： 效果非常好。然后，我想，顯然這在某種程度上是不可知的，比如，你知道的，當(dāng)人們?cè)跈C(jī)器人技術(shù)中發(fā)現(xiàn)縮放定律，以及人們可能需要多少遠(yuǎn)程操作數(shù)據(jù)時(shí)，但是你覺(jué)得我們離它很近了嗎？或者，我的意思是，顯然，你知道，在2015年，你認(rèn)為還有五年。你認(rèn)為我們離人們所說(shuō)的機(jī)器人技術(shù)像 ChatGPT 那樣的時(shí)刻還有多遠(yuǎn)，人們會(huì)說(shuō)，哦，那真的很棒，那看起來(lái)很不一樣而且有效。

Bob McGrew： 關(guān)于預(yù)測(cè)，尤其是關(guān)于機(jī)器人技術(shù)的預(yù)測(cè)，你真的要考慮這個(gè)領(lǐng)域。所以我對(duì)機(jī)器人技術(shù)的大規(guī)模消費(fèi)者采用持相當(dāng)悲觀的態(tài)度，因?yàn)樵诩依镉幸粋€(gè)機(jī)器人是很可怕的。機(jī)器手臂是致命的。它們可能會(huì)殺死你，更重要的是，它們會(huì)殺死你的孩子。而且，你知道，你可以使用不同種類的機(jī)器手臂，它們沒(méi)有這些缺點(diǎn)，但它們有其他缺點(diǎn)。家是一個(gè)非常不受約束的地方。

但我確實(shí)認(rèn)為，在各種形式的零售或其他工作環(huán)境中，我認(rèn)為五年后我們會(huì)看到這種情況。如果你去亞馬遜的倉(cāng)庫(kù)，你甚至可以看到這種情況；他們已經(jīng)擁有解決了他們移動(dòng)問(wèn)題的機(jī)器人。你知道，他們正在研究抓取和放置。我認(rèn)為你會(huì)在倉(cāng)庫(kù)環(huán)境中看到大量機(jī)器人推出。

然后，你知道，它將在一段時(shí)間內(nèi)以領(lǐng)域?yàn)閱挝恢鸩酵七M(jìn)。我不會(huì)預(yù)測(cè)它何時(shí)進(jìn)入家庭，但我認(rèn)為你會(huì)看到它被廣泛應(yīng)用。我認(rèn)為在五年后，我們會(huì)以一種今天會(huì)感覺(jué)奇怪的方式在日常生活中與它們互動(dòng)。

主持人Jacob： 我的意思是，顯然已經(jīng)有一些獨(dú)立的機(jī)器人公司。在某種程度上，顯然機(jī)器人技術(shù)利用了基礎(chǔ)，你知道，LLM 的進(jìn)步。我很好奇，比如，你知道，這一切是否會(huì)融合？顯然有些公司只做視頻模型。有些公司專注于生物、材料科學(xué)。當(dāng)你考慮它的長(zhǎng)期發(fā)展方向時(shí)，你知道，是否會(huì)有一個(gè)龐大的模型涵蓋所有這些？

Bob McGrew： 在最前沿的模型規(guī)模上，我認(rèn)為你應(yīng)該繼續(xù)期望這些公司推出一個(gè)模型。它將在他們所擁有的每種形式的數(shù)據(jù)的每個(gè)維度上做到最好。這是一個(gè)重要的警告。

專業(yè)化真正給你帶來(lái)的是性價(jià)比。在過(guò)去的一年里，你已經(jīng)看到最前沿的實(shí)驗(yàn)室在擁有大量智能的小模型方面做得更好，這些模型可以以非常低的成本完成類似聊天機(jī)器人的用例。

如果你是一家公司，在這一點(diǎn)上，一個(gè)非常常見(jiàn)的模式是，你弄清楚你希望人工智能為你做什么，然后你使用你喜歡的最前沿的模型來(lái)運(yùn)行它。然后，你生成一個(gè)龐大的數(shù)據(jù)庫(kù)，并微調(diào)一些更小的模型來(lái)執(zhí)行該操作。你知道，這是一個(gè)非常常見(jiàn)的做法；OpenAI 提供這項(xiàng)服務(wù)，我相信這在每個(gè)平臺(tái)上都是一個(gè)常見(jiàn)的模式。

你可以說(shuō)，你知道，這非常非常便宜。現(xiàn)在，如果你像這樣訓(xùn)練了一個(gè)聊天機(jī)器人，你的客戶服務(wù)聊天機(jī)器人是這樣訓(xùn)練的，如果有人偏離了腳本，它就不會(huì)像你原來(lái)使用前沿模型那樣好。但這沒(méi)關(guān)系；這是人們?cè)敢饨邮艿男詢r(jià)比。

主持人Jacob： 有一件我覺(jué)得很有趣的事情，我們之前聊天的時(shí)候，你提到了一個(gè)關(guān)于人工智能進(jìn)展的宏觀觀點(diǎn)，基本上是在說(shuō)，在2018年，我們?cè)A(yù)計(jì)，到了2024年，我們會(huì)擁有各種模型能力，你會(huì)從第一性原理出發(fā)認(rèn)為，這些東西已經(jīng)徹底改變了。就像世界相對(duì)于2018年幾乎面目全非。雖然你們確實(shí)對(duì)更廣闊的世界產(chǎn)生了巨大的影響，但我還不能說(shuō)人工智能的普及已經(jīng)完全改變了整個(gè)世界運(yùn)作的方式。你認(rèn)為為什么會(huì)這樣？

Bob McGrew： 嗯，我只是想稍微重述一下，我覺(jué)得，雖然聽(tīng)起來(lái)很奇怪，但關(guān)于人工智能的正確心態(tài)應(yīng)該是深深的悲觀。比如，為什么進(jìn)展如此緩慢？為什么，你知道，有人說(shuō)人工智能導(dǎo)致了GDP增長(zhǎng)了0.1%。但這并不是因?yàn)槭褂萌斯ぶ悄軒?lái)的生產(chǎn)力提升，而是因?yàn)榻⒂?xùn)練人工智能所需的數(shù)據(jù)中心所產(chǎn)生的資本支出。所以，為什么人工智能在生產(chǎn)力統(tǒng)計(jì)數(shù)據(jù)中并不明顯？就像人們?cè)?0世紀(jì)90年代談?wù)摶ヂ?lián)網(wǎng)時(shí)所說(shuō)的那樣。

我認(rèn)為這有幾個(gè)原因。首先，2018年的那種觀點(diǎn)認(rèn)為，一旦你可以和它對(duì)話，它就可以編寫代碼，那么所有人都會(huì)立即實(shí)現(xiàn)自動(dòng)化。這和工程師被要求編寫一個(gè)功能時(shí)的想法是一樣的。你可能會(huì)想，“哦，是的，我可以在幾個(gè)星期內(nèi)搞定。”但是當(dāng)你開(kāi)始編寫代碼時(shí)，你就會(huì)意識(shí)到，“哦，實(shí)際上，這個(gè)功能比我想象的要復(fù)雜得多。” 如果你是一個(gè)優(yōu)秀的工程師，你可能會(huì)估計(jì)兩周，但實(shí)際上項(xiàng)目可能需要兩個(gè)月。如果是一個(gè)糟糕的工程師，他們可能會(huì)發(fā)現(xiàn)這個(gè)功能根本就寫不出來(lái)。

我認(rèn)為當(dāng)我們真正深入研究人類如何完成工作時(shí)，就發(fā)生了這種情況。是的，你可能會(huì)在電話里和他們交談，但這并不意味著他們所做的只是和你交談。其中涉及到真正的工作。從根本上說(shuō)，人工智能可以自動(dòng)化的只是一項(xiàng)任務(wù)。然而，一項(xiàng)工作是由許多任務(wù)組成的。當(dāng)你仔細(xì)研究真實(shí)的工作時(shí)，你會(huì)發(fā)現(xiàn)，對(duì)于大多數(shù)工作來(lái)說(shuō)，有些任務(wù)是無(wú)法自動(dòng)化的。

即使你看看編程，例如，樣板代碼首先被優(yōu)化，而那些更棘手的部分，比如確定你到底想做什么，則是最后才被解決的。所以我認(rèn)為，隨著我們繼續(xù)推廣人工智能，我們將發(fā)現(xiàn)它在自動(dòng)化人類工作的全部范圍方面存在越來(lái)越多的復(fù)雜性和局限性。

主持人Jordan： 那么考慮到這一點(diǎn)，就進(jìn)展而言，你認(rèn)為今天有哪些領(lǐng)域被低估了，應(yīng)該比現(xiàn)在得到更多的關(guān)注？

Bob McGrew： 嗯，好的。這里有一個(gè)答案，我真正感興趣的初創(chuàng)公司是那些人們利用人工智能來(lái)解決一些非常枯燥的問(wèn)題的公司。

想象一下，你經(jīng)營(yíng)一家公司，你可以雇傭所有你想要的聰明人去做一些超級(jí)枯燥的事情，比如檢查你所有的支出，并確保你進(jìn)行了適當(dāng)?shù)谋葍r(jià)。比如，如果你的采購(gòu)部門都是像埃隆馬斯克那樣的人，他們真的非常仔細(xì)地控制支出，那么你可能會(huì)省下很多錢。

沒(méi)有人這樣做，因?yàn)椋阒�，那些真正能省錢的人，他們會(huì)覺(jué)得無(wú)聊。他們會(huì)討厭這份工作，對(duì)吧？但是人工智能是無(wú)限耐心的。

它不必?zé)o限聰明。而且，你知道，我認(rèn)為在任何地方，如果你在經(jīng)營(yíng)你的業(yè)務(wù)，你可以從那些無(wú)限耐心的人所做的事情中獲得價(jià)值，那么這就是人工智能應(yīng)該自動(dòng)化的東西。

主持人Jacob： 這很有趣，因?yàn)槲乙恢闭J(rèn)為咨詢師是讓聰明人去解決枯燥問(wèn)題或在枯燥行業(yè)工作的套利方式。而顯然，有了尖端的人工智能模型，你就可以讓一個(gè)智商很高的人去解決你永遠(yuǎn)不可能讓一個(gè)聰明人去做的問(wèn)題。

Bob McGrew： 是的，我的意思是，我第一次聽(tīng)說(shuō)有人做了生產(chǎn)力研究，結(jié)果表明人工智能確實(shí)帶來(lái)了20%到50%的提升。我就想，哇，太棒了。然后我就發(fā)現(xiàn)，哦，是咨詢師。嗯，你知道，人工智能非常擅長(zhǎng)“扯淡”，而咨詢師的工作就是“扯淡”。所以也許我們不應(yīng)該感到驚訝，生產(chǎn)力的提升首先出現(xiàn)在這里。

主持人Jacob： 是的，我認(rèn)為在表現(xiàn)較差的后一半人中提升幅度也是最大的，對(duì)吧？

Bob McGrew： 沒(méi)錯(cuò)。嗯，實(shí)際上，我認(rèn)為這有點(diǎn)令人充滿希望。因?yàn)槿绻憧纯幢憩F(xiàn)較差的后一半人，你知道，他們擁有人類擁有的、難以自動(dòng)化的技能，這是這個(gè)事情充滿希望的版本。他們知道他們?cè)谧鍪裁�，但他們不知道如何編寫代碼來(lái)實(shí)現(xiàn)它。然后模型出現(xiàn)了，它說(shuō)，哦，我知道如何編寫代碼來(lái)實(shí)現(xiàn)它，但我不知道我應(yīng)該做什么。所以現(xiàn)在這些表現(xiàn)較差的人實(shí)際上可以在他們的工作中得到真正的提升。所以我覺(jué)得這非常令人充滿希望。

主持人Jordan： 我想，就表現(xiàn)而言，你曾經(jīng)并且正在與世界上一些最優(yōu)秀的研究人員合作。你認(rèn)為是什么讓一個(gè)人工智能研究人員成為最優(yōu)秀的？

Bob McGrew： 有許多不同類型的研究人員做著不同的事情。如果你想到像亞歷克拉德福德這樣的人，他發(fā)明了GPT系列和CLIP，你會(huì)發(fā)現(xiàn)他基本上發(fā)明了大型語(yǔ)言模型（LLM），然后繼續(xù)進(jìn)行各種形式的多模態(tài)研究。亞歷克是一個(gè)喜歡在深夜的奇怪時(shí)間獨(dú)自工作的人。相比之下，其他像伊利亞蘇茨克維和雅各布皮喬基這樣的杰出人物，他們分別是OpenAI的第一任和第二任首席科學(xué)家，他們有偉大的想法和愿景。他們幫助其他人解決挑戰(zhàn)，并在為公司制定整體路線圖方面發(fā)揮著關(guān)鍵作用。

最優(yōu)秀的科學(xué)家們都有一個(gè)共同的關(guān)鍵特征，那就是一定的毅力。我永遠(yuǎn)記得看著阿迪亞拉梅什，他發(fā)明了DALL-E，努力解決生成一張不在訓(xùn)練集中的圖像的問(wèn)題，以證明神經(jīng)網(wǎng)絡(luò)具有創(chuàng)造力。DALL-E的最初想法是看看它是否能創(chuàng)造一張粉紅色熊貓?jiān)诒匣膱D片，阿迪亞確信這張圖片不存在于訓(xùn)練數(shù)據(jù)中。他為此工作了18個(gè)月，也許是兩年，試圖實(shí)現(xiàn)這個(gè)目標(biāo)。

我記得大約一年后，伊利亞過(guò)來(lái)給我看了一張照片，說(shuō)：“你看，這是最新一代的。它真的開(kāi)始起作用了。” 我看到的是一片模糊，頂部隱約可見(jiàn)粉紅色，底部是白色只是像素開(kāi)始聚集在一起。我當(dāng)時(shí)還看不出什么，但阿迪亞堅(jiān)持不懈。這種堅(jiān)韌是每一個(gè)成功的科研人員在解決基礎(chǔ)問(wèn)題時(shí)必須具備的。他們必須把這看作是他們的“最后一戰(zhàn)”，并且決心為此堅(jiān)持?jǐn)?shù)年，如有必要的話。

主持人Jacob： 為了使其發(fā)揮作用。你從組建這樣一個(gè)由這樣一群人組成的研究機(jī)構(gòu)中學(xué)到了什么？

Bob McGrew： 嗯，有趣的是，我能想到的最好的類比實(shí)際上來(lái)自 Palantir 的 Alex Carp，他總是說(shuō)工程師是藝術(shù)家。這很有道理。當(dāng)你和一位真正優(yōu)秀的工程師交談時(shí)，他們只想創(chuàng)造。他們心中有某種東西。代碼是他們將心中的雕塑變成現(xiàn)實(shí)的方式。

在 Palantir，你知道，你必須讓他們修復(fù)bug，但每次你這樣做，他們藝術(shù)家的那一面都會(huì)感到悲傷。你必須有一個(gè)流程來(lái)讓人們協(xié)同工作，但他們藝術(shù)家的那一面會(huì)感到悲傷。事實(shí)是，工程師是藝術(shù)家，一個(gè) 10 倍工程師是 10 倍的藝術(shù)家，而研究員是任何工程師的 100 倍藝術(shù)家。

要建立一個(gè)擁有研究人員的組織，需要考慮的事情要多得多。有一種工程管理方式，你會(huì)說(shuō)如果每個(gè)人都是可互換的零件，并且你有一個(gè)允許他們協(xié)同工作的流程，那就太好了。然而，與研究人員合作是非常需要密切關(guān)注的，因?yàn)樽铌P(guān)鍵的是你不能扼殺他們的藝術(shù)性。

正是他們頭腦中對(duì)愿景的熱情，使他們?cè)敢獬惺芩袑⒃妇白優(yōu)楝F(xiàn)實(shí)的挑戰(zhàn)。

主持人Jordan： 你很幸運(yùn)曾在 Palantir 和 OpenAI 工作過(guò)，而且有很多文章都在討論 Palantir 的文化非常特別。當(dāng)你想起 OpenAI 時(shí)，我相信未來(lái)也會(huì)有很多關(guān)于其文化的文章。你認(rèn)為這些文章會(huì)怎么說(shuō)？

Bob McGrew： 是的。我的意思是，我認(rèn)為其中一點(diǎn)是像我們剛才談到的那樣，與研究人員合作。關(guān)于 OpenAI 另一件瘋狂的事情是它經(jīng)歷了多少次轉(zhuǎn)型，或者我更喜歡把它看作是多次重建。所以當(dāng)我加入 OpenAI 時(shí)，它是一個(gè)非營(yíng)利組織。公司的愿景是通過(guò)撰寫論文來(lái)構(gòu)建 AGI。我們知道這是錯(cuò)誤的；感覺(jué)不太對(duì)勁。早期的很多人，Sam、Greg 和我，都是創(chuàng)業(yè)人士，而這條通往 AGI 的道路感覺(jué)不對(duì)。

幾年后，公司從非營(yíng)利組織轉(zhuǎn)型為營(yíng)利組織。這在公司內(nèi)部引起了很大的爭(zhēng)議，部分原因是，我們知道在某個(gè)時(shí)候我們將不得不與產(chǎn)品互動(dòng)。我們必須考慮如何賺錢。與微軟的合作成了另一個(gè)重建時(shí)刻，這也引起了很大爭(zhēng)議。我的意思是，也許賺錢是一回事，但是把它給微軟，給大型科技公司，哇，太糟糕了。

此外，同樣重要的是，我們決定說(shuō)，好吧，我們不僅要與微軟合作，我們還要使用 API 構(gòu)建自己的產(chǎn)品。最后，通過(guò) ChatGPT 將消費(fèi)者服務(wù)添加到企業(yè)服務(wù)中。這些都是初創(chuàng)公司會(huì)經(jīng)歷的決定性的轉(zhuǎn)型。在 OpenAI，感覺(jué)好像每 18 個(gè)月或每?jī)赡辏覀兌荚趶母旧细淖児镜淖谥己驮谀抢锕ぷ鞯娜藗兊纳矸荨?br/>

我們從撰寫論文是你的工作的概念，轉(zhuǎn)變?yōu)闃?gòu)建一個(gè)世界上每個(gè)人都可以使用的模型的想法。真正瘋狂的是，如果你在 2017 年問(wèn)我們正確的使命是什么，那不會(huì)是通過(guò)撰寫論文來(lái)實(shí)現(xiàn) AGI；相反，那會(huì)是我們想構(gòu)建一個(gè)每個(gè)人都可以使用的模型。但是我們不知道如何實(shí)現(xiàn)這一目標(biāo)，所以我們只能探索并一路找出所有這些事情。

主持人Jacob： 你認(rèn)為是什么讓你們?cè)谶M(jìn)行這些重大轉(zhuǎn)變時(shí)如此成功？

Bob McGrew： 嗯，我的意思是，首先是必要性。這些都不是隨意選擇的，對(duì)吧？你有一個(gè)非營(yíng)利組織，你花光了錢，也許你需要找到一種籌集資金的方式；也許為了籌集資金，你必須成為一家營(yíng)利性公司。你與微軟的合作，也許他們沒(méi)有看到你正在創(chuàng)建的模型的價(jià)值，所以你需要構(gòu)建一個(gè) API，因?yàn)樗赡苷娴挠行�。然后你可以向他們展示，人們�?shí)際上想要這些模型。

ChatGPT，我認(rèn)為這是我們?cè)?GPT-3 之后真正相信的，通過(guò)正確的進(jìn)步，正確的形式不僅僅是人們必須通過(guò)中介才能與模型對(duì)話的 API，而是該模型將是你可以直接與之交談的東西。所以這是我認(rèn)為非常刻意的一件事。但眾所周知，它的發(fā)生方式是一個(gè)意外。我們正在研究它。我們實(shí)際上已經(jīng)訓(xùn)練了 GPT-4，并且我們希望在模型足夠好，以至于我們每天都使用它時(shí)發(fā)布。

我們?cè)?11 月都看了 ChatGPT，我們想，它通過(guò)了門檻了嗎？不完全是。領(lǐng)導(dǎo)這個(gè)團(tuán)隊(duì)的聯(lián)合創(chuàng)始人之一 John Schulman 說(shuō)，聽(tīng)著，我真的只想發(fā)布它。我想獲得一些外部經(jīng)驗(yàn)。我記得當(dāng)時(shí)在想，如果有一千人使用它，那將是成功。你知道，我們對(duì)成功的標(biāo)準(zhǔn)相當(dāng)?shù)�。我們做出了一個(gè)決定，沒(méi)有把它放在等待列表之后。

然后，你知道，世界再次迫使我們出手，突然之間，世界上每個(gè)人都想使用它。當(dāng)你發(fā)布它時(shí)，最初的幾天是什么樣的？哦，我的天啊，那是非常緊張的。起初，人們有些不相信這真的會(huì)發(fā)生。有一些焦慮。我們迅速嘗試找出如何獲得 GPU。所以我們暫時(shí)把一些研究計(jì)算資源轉(zhuǎn)移到了那里。

然后就出現(xiàn)了這個(gè)問(wèn)題，它什么時(shí)候會(huì)停止？這種情況會(huì)繼續(xù)下去還是會(huì)成為一種時(shí)尚？因?yàn)槲覀儙缀踉?DALL-E 上也經(jīng)歷過(guò)類似的事情。DALL-E 2 模型曾在互聯(lián)網(wǎng)上引起轟動(dòng)，然后就消失了。所以人們擔(dān)心 ChatGPT 實(shí)際上也會(huì)消失。這是我非常堅(jiān)信它不會(huì)消失的地方，它實(shí)際上會(huì)比 API 更重要。

主持人Jacob： 我的意思是，多么有趣的經(jīng)歷啊。我想其中一件很酷的事情是，你離尖端 AI 研究非常近。我很好奇，在過(guò)去的一年中，你在 AI 領(lǐng)域改變了什么想法？

Bob McGrew： 有趣的是，我不認(rèn)為我改變了什么想法。在 GPT-3 之后，進(jìn)入 2020 年、2021 年，如果你身處其中，那么未來(lái)四五年需要發(fā)生的事情，很多都感覺(jué)是理所當(dāng)然的。我們將擁有這些模型。我們將使模型變得更大，它們將成為多模態(tài)的。即使在 2021 年，我們也在談?wù)撊绾涡枰谡Z(yǔ)言模型上使用 RL，并嘗試找出如何使其工作。而且，2021 年和 2024 年之間的真正區(qū)別不是說(shuō)需要發(fā)生什么，而是我們能夠讓它發(fā)生這個(gè)事實(shí)。而且，你知道，我們，整個(gè)領(lǐng)域，都能夠讓它發(fā)生。但在某種意義上，我們現(xiàn)在的處境也感覺(jué)有點(diǎn)命中注定。

主持人Jacob： 我猜想，展望未來(lái)，當(dāng)你考慮擴(kuò)展預(yù)訓(xùn)練和擴(kuò)展測(cè)試時(shí)計(jì)算時(shí)，感覺(jué)它也像是命中注定要僅憑這兩者就達(dá)到 AGI 嗎？或者，你是如何看待這個(gè)問(wèn)題的？

Bob McGrew：我很難理解AGI（通用人工智能）的概念。而且，我認(rèn)為，如果說(shuō)有什么的話，我對(duì)AGI有一個(gè)很深的批判，那就是不存在一個(gè)明確的轉(zhuǎn)折時(shí)刻，實(shí)際上，這些問(wèn)題是分形的。而且，我們將看到越來(lái)越多的事物被自動(dòng)化。但不知怎么的，我們我不知道。我有一種感覺(jué)，它會(huì)變得非常平庸，不知何故，我們都會(huì)開(kāi)著自動(dòng)駕駛汽車去辦公室，在那里指揮著人工智能大軍。然后我們會(huì)覺(jué)得，哦，這有點(diǎn)無(wú)聊。感覺(jué)仍然像在辦公室，我的老板仍然是個(gè)白癡。這大概就是我們AGI的未來(lái)。我們迫不及待地等待下午五點(diǎn)下班之類的。

更嚴(yán)肅地說(shuō)，我一直覺(jué)得，而且我認(rèn)為這在OpenAI內(nèi)部以及其他前沿實(shí)驗(yàn)室也是一種普遍的觀點(diǎn)，即解決推理是擴(kuò)展到人類水平智能所需的最后一個(gè)基本挑戰(zhàn)。你需要解決預(yù)訓(xùn)練，你需要解決故障模態(tài)，你需要解決推理。此時(shí)，剩下的挑戰(zhàn)就是擴(kuò)展。但這非常重要。

擴(kuò)展非常困難。實(shí)際上，根本沒(méi)有多少基礎(chǔ)性的想法。幾乎所有的工作都是在如何將它們擴(kuò)展到接受越來(lái)越大的計(jì)算量。這是一個(gè)系統(tǒng)問(wèn)題。這是一個(gè)硬件問(wèn)題。這是一個(gè)優(yōu)化問(wèn)題。這是一個(gè)數(shù)據(jù)問(wèn)題。這是一個(gè)預(yù)訓(xùn)練問(wèn)題。所有的問(wèn)題實(shí)際上都只是關(guān)于擴(kuò)展。所以，是的，我認(rèn)為在某種程度上，它已經(jīng)是注定的了。這里的工作是擴(kuò)展它，但這很難。大量的工作。

主持人Jacob： 顯然，我認(rèn)為人們?cè)谡務(wù)撨@些模型擴(kuò)展其能力的社會(huì)影響。我認(rèn)為我們?nèi)匀惶幱谶@種討論的早期階段，可能有很多不同的對(duì)話需要進(jìn)行。但對(duì)哪些方面特別感興趣和充滿熱情，您認(rèn)為我們應(yīng)該談?wù)撃男┓矫妫?br/>

Bob McGrew： 是的。我認(rèn)為最有趣的是，我們正在從一個(gè)智能可能是社會(huì)中最稀缺資源的時(shí)代，過(guò)渡到一個(gè)智能將無(wú)處不在且免費(fèi)的時(shí)代。那么，稀缺的生產(chǎn)要素又是什么呢？而且，我認(rèn)為我們不知道。我猜是能動(dòng)性。也就是說(shuō)，你可以去完成事情。你需要提出什么正確的問(wèn)題？你需要追求哪些正確的項(xiàng)目？我認(rèn)為這些類型的問(wèn)題對(duì)于人工智能來(lái)說(shuō)很難為我們解決。我認(rèn)為這些將是人類需要弄清楚的核心問(wèn)題。而且，并非每個(gè)人都擅長(zhǎng)這一點(diǎn)。所以，我認(rèn)為我們需要思考的是，我們?nèi)绾伟l(fā)展那種讓我們能夠與之合作的能動(dòng)性。

主持人Jordan： 您認(rèn)為這是現(xiàn)在，還是未來(lái)？

Bob McGrew： 我認(rèn)為它會(huì)感覺(jué)非常連續(xù)。這是一條指數(shù)曲線。而指數(shù)曲線的特點(diǎn)是，它們沒(méi)有記憶。你總是感覺(jué)，你總是在以相同的速度、相同的節(jié)奏前進(jìn)。

主持人Jacob： 這些模型最終不會(huì)也弄清楚，我的意思是，如果你考慮一下弄清楚要做什么或項(xiàng)目目標(biāo)，你剛剛提到了幾次？例如，你可以想象，在未來(lái)最基本的層次上，對(duì)模型說(shuō)，嘿，建立一家好公司，或者創(chuàng)作一件有趣的藝術(shù)作品，或者制作一部電影，等等。隨著這些模型變得更強(qiáng)大，這種能動(dòng)性，我想，也許可以談?wù)勥@一點(diǎn)。

Bob McGrew： 是的，我的意思是，你能否直接要求人工智能解決所有問(wèn)題？好吧，我認(rèn)為你可以，而且你會(huì)得到一些結(jié)果。但我們以Sora為例。如果你在制作一個(gè)視頻，你給它一個(gè)非常模糊的提示，它會(huì)完全為你創(chuàng)建一個(gè)視頻。也許它會(huì)是一個(gè)非�？岬囊曨l。也許它會(huì)比你能想到的最酷的視頻還要好。但它可能不是你想要的視頻。

因此，你也可以與它互動(dòng)，你給它一個(gè)非常詳細(xì)的提示，你說(shuō)，我對(duì)我想看到的視頻做了這些具體的選擇。這讓你能夠創(chuàng)建讓你自己或你的觀眾滿意的視頻。

我認(rèn)為這種張力將持續(xù)存在，無(wú)論人工智能多么先進(jìn)，因?yàn)槟闳绾翁畛淇瞻讓Q定最終產(chǎn)品的很多內(nèi)容。

主持人Jacob： 您今天是如何使用最先進(jìn)的O1模型的？

Bob McGrew：我理解模型，并與之交互的首選方法是，我花了很多時(shí)間教我八歲的兒子學(xué)習(xí)編程。他喜歡問(wèn)問(wèn)題，所以我總是在想如何將他今天感興趣的事情與我想教給他的課程聯(lián)系起來(lái)。

例如，有一天他說(shuō)，“爸爸，什么是網(wǎng)絡(luò)爬蟲(chóng)？它是如何工作的？”這給了我一個(gè)機(jī)會(huì)，我說(shuō)，好吧，我可以用一個(gè)簡(jiǎn)短的程序來(lái)教他網(wǎng)絡(luò)是如何工作的嗎？我嘗試使用一個(gè)O1模型，努力創(chuàng)建一個(gè)足夠簡(jiǎn)短的程序，并且不引入太多我還沒(méi)有教過(guò)他的新概念。

目標(biāo)是教他關(guān)于網(wǎng)絡(luò)的知識(shí)，這是我希望他理解的核心概念，同時(shí)確保內(nèi)容對(duì)于一個(gè)八歲的孩子來(lái)說(shuō)是易于理解的。這花了一些時(shí)間來(lái)調(diào)整程序，但我相信學(xué)習(xí)過(guò)程的一部分是實(shí)驗(yàn)，測(cè)試不同的想法是其中一個(gè)重要的方面。

主持人Jordan： 我想在測(cè)試方面，當(dāng)您從研究測(cè)試的角度考慮時(shí)，當(dāng)新模型出現(xiàn)時(shí)，您通常會(huì)進(jìn)行哪些核心評(píng)估，并且您最依賴哪些評(píng)估？

Bob McGrew： 好吧，我的意思是，這里首先要指出的是，它隨著每一代模型而變化。你知道，當(dāng)我們開(kāi)發(fā)O1模型時(shí)，要看的正確指標(biāo)是GPQA，它代表谷歌證明問(wèn)題解答。然而，當(dāng)我們準(zhǔn)備發(fā)布時(shí)，它不再是一個(gè)非常有趣的指標(biāo)，因?yàn)槲覀円呀?jīng)從一開(kāi)始幾乎什么都沒(méi)做到，到它完全飽和。最后剩下的幾個(gè)問(wèn)題通常是措辭不當(dāng)或不太有趣的問(wèn)題。因此，你選擇的指標(biāo)很大程度上取決于你在研究中試圖做的工作，我認(rèn)為這是一個(gè)普遍的經(jīng)驗(yàn)。

然而，在過(guò)去幾年中一直有用的事情是編程。編程是一項(xiàng)結(jié)構(gòu)化的任務(wù)，包括我自己和其他研究人員在內(nèi)的許多人都可以理解，這非常重要。它可以從完成一行代碼擴(kuò)展到編寫整個(gè)網(wǎng)站。我們還沒(méi)有達(dá)到編程被完全解決的程度，我認(rèn)為我們還有很長(zhǎng)的路要走。我相信，在我們可以真正完成一個(gè)真正的軟件工程師的工作之前，還有幾個(gè)數(shù)量級(jí)的差距。

主持人Jacob： 你早期的職業(yè)生涯中有一件事很明顯，你當(dāng)時(shí)正在攻讀計(jì)算機(jī)科學(xué)博士學(xué)位，而且我記得至少有一部分專注于博弈論。顯然，我認(rèn)為使用這些模型來(lái)探索博弈論中的課題有很多有趣的含義。我想問(wèn)的是，一般來(lái)說(shuō)，你認(rèn)為人工智能將如何改變社會(huì)科學(xué)研究、政策制定以及其他相關(guān)領(lǐng)域？如果你今天用這些模型的力量重新審視你之前的工作，你會(huì)嘗試做些什么？

Bob McGrew： 首先，我其實(shí)對(duì)學(xué)術(shù)界非常失望。我認(rèn)為它有一套糟糕的激勵(lì)機(jī)制。在某些方面，我把OpenAI的組織設(shè)計(jì)成學(xué)術(shù)界的鏡像，創(chuàng)造一個(gè)協(xié)作可以蓬勃發(fā)展的地方。

商業(yè)中一個(gè)有趣的方面是，很多產(chǎn)品管理的工作都類似于實(shí)驗(yàn)社會(huì)科學(xué)。你有一個(gè)想法，你想在人類身上測(cè)試一下。你希望在采用良好方法的同時(shí)，看看它是如何工作的。A/B測(cè)試就是一個(gè)很好的例子；當(dāng)你這樣做時(shí)，你實(shí)際上是在進(jìn)行一種社會(huì)科學(xué)。

這是我特別興奮的事情之一：如果你在進(jìn)行A/B測(cè)試，為什么不把你現(xiàn)在與用戶的所有互動(dòng)都拿來(lái)，用這些數(shù)據(jù)微調(diào)一個(gè)模型，然后你就突然有了一個(gè)模擬用戶，它的反應(yīng)方式與你的實(shí)際用戶一致？這意味著你可以在不投入生產(chǎn)的情況下進(jìn)行A/B測(cè)試。也許之后，你可以對(duì)其中一個(gè)模擬用戶進(jìn)行深入訪談，了解他們的想法。

這在今天可行嗎？我不知道。我還沒(méi)有嘗試過(guò)，但明天也許就行了。我認(rèn)為這是一個(gè)很好的普遍原則：每當(dāng)你發(fā)現(xiàn)自己想讓別人為你做某事時(shí)，考慮一下是否可以要求人工智能來(lái)做。而且，人工智能可能可以處理數(shù)百個(gè)任務(wù)，而人類可能只能完成一個(gè)任務(wù)，而且還很費(fèi)勁。

主持人Jordan： 是的，我讓雅各布為我做了很多任務(wù)，所以。

主持人Jacob： 是的，你應(yīng)該停止那樣做。你應(yīng)該開(kāi)始問(wèn)我的模型。感謝你交付了它。你幫我節(jié)省了很多時(shí)間。你提到，我想，你設(shè)計(jì)了學(xué)術(shù)界現(xiàn)有的激勵(lì)機(jī)制，并設(shè)計(jì)了與此形成對(duì)比的OpenAI組織。能多談?wù)勥@方面嗎？

Bob McGrew： 是的，是的。我的意思是，回想一下2017、2018、2019年。當(dāng)時(shí)，人工智能研究實(shí)驗(yàn)室還不是一個(gè)大產(chǎn)業(yè)。它們只是研究實(shí)驗(yàn)室。很多參與其中的人來(lái)自學(xué)術(shù)界。如果你看看學(xué)術(shù)界的結(jié)構(gòu)，就會(huì)發(fā)現(xiàn)它有一套激勵(lì)機(jī)制，對(duì)于其最初的設(shè)計(jì)來(lái)說(shuō)是足夠好的。然而，人們非常關(guān)注功勞到底是誰(shuí)做了這個(gè)？論文上的人名按照什么順序排列？這對(duì)于具有學(xué)術(shù)背景的人來(lái)說(shuō)非常重要。

也許你不想與他人合作，因?yàn)樗鼤?huì)沖淡你對(duì)結(jié)果的貢獻(xiàn)。如果有兩個(gè)人一起解決問(wèn)題，這通常更像是競(jìng)爭(zhēng)，而不是一個(gè)把工作速度提高一倍的機(jī)會(huì)。在這種背景下，我認(rèn)為DeepMind考慮建立一個(gè)模仿學(xué)術(shù)界但又在公司框架內(nèi)運(yùn)作的實(shí)驗(yàn)室，這樣我就可以指導(dǎo)人們，并只專注于深度學(xué)習(xí)。

另一方面，我認(rèn)為Brain最初的目標(biāo)是聚集一些學(xué)者，以一種非常學(xué)術(shù)的方式進(jìn)行探索性研究。我不會(huì)強(qiáng)加方向，而是會(huì)在外部安排產(chǎn)品經(jīng)理，以便他們可能會(huì)抓住這些偉大的想法并將其轉(zhuǎn)化為產(chǎn)品。與此同時(shí)，我們是一群創(chuàng)業(yè)人士，以及一些杰出的研究人員，包括像伊利亞這樣的人。我們的觀點(diǎn)是，研究實(shí)驗(yàn)室應(yīng)該像一家初創(chuàng)公司一樣運(yùn)作。

我們認(rèn)為，在明確前進(jìn)方向的同時(shí)，給予人們很多自由非常重要，特別是那些杰出的研究人員其中一些人我們當(dāng)時(shí)甚至沒(méi)有意識(shí)到他們很出色。我們的目標(biāo)是讓他們找到他們?cè)敢狻盀橹畩^斗”的“山頭”，以創(chuàng)造他們渴望創(chuàng)造的卓越工作。我們強(qiáng)調(diào)合作，確保人們?yōu)榱艘粋€(gè)統(tǒng)一的目標(biāo)而共同努力，而不是僅僅專注于發(fā)表大量的論文。

主持人Jacob： 我喜歡這個(gè)說(shuō)法。我想你早先已經(jīng)回顧了OpenAI歷史上一些最著名的決定，從非營(yíng)利組織到轉(zhuǎn)型，與微軟的合作，發(fā)布ChatGPT的API。有沒(méi)有哪個(gè)也許不是那么有名，但你認(rèn)為是關(guān)鍵的決策點(diǎn)？或者說(shuō)，你認(rèn)為哪個(gè)決策是很難做出的，或者哪個(gè)決策真正改變了組織的走向？

Bob McGrew： 我認(rèn)為我之前沒(méi)有談到的一個(gè)決定，但當(dāng)時(shí)也頗具爭(zhēng)議，那就是決定加倍投入語(yǔ)言建模，并使其真正成為OpenAI的中心焦點(diǎn)。這個(gè)決定很復(fù)雜，原因有很多。這樣的改變涉及到重組和調(diào)整結(jié)構(gòu)，人們必須改變他們的工作。

再次強(qiáng)調(diào)，我們最初的文化鼓勵(lì)嘗試各種不同的方法，看看哪些方法奏效。我們第一個(gè)重要的重大努力是共同努力玩Dota 2游戲，這延續(xù)了人工智能解決越來(lái)越難的游戲的偉大傳統(tǒng)。你從國(guó)際象棋到圍棋，然后到Dota 2和星際爭(zhēng)霸，這在某種程度上感覺(jué)沒(méi)那么酷。然而，我可以向你保證，從數(shù)學(xué)上講，這些游戲真的比圍棋和國(guó)際象棋更難，即使它們沒(méi)那么優(yōu)雅。

Dota 2項(xiàng)目取得了巨大成功，它教會(huì)了我們很多東西。從那次經(jīng)驗(yàn)中，我們得出了這樣一個(gè)信念：你可以通過(guò)擴(kuò)大規(guī)模來(lái)解決問(wèn)題，并有一套用于此目的的技術(shù)工具。因此，通過(guò)決定關(guān)閉更多探索性項(xiàng)目，例如機(jī)器人團(tuán)隊(duì)和游戲團(tuán)隊(duì)，并真正將重點(diǎn)重新放在語(yǔ)言模型和通用生成模型上，包括多模態(tài)工作，我相信這是一個(gè)非常關(guān)鍵的選擇，盡管當(dāng)時(shí)非常痛苦。

主持人Jacob： 我早先注意到一件事，你顯然提到，你在用你八歲的孩子測(cè)試這些模型。而且，我想在你做父母的這段時(shí)間里，顯然八年前的世界與現(xiàn)在大不相同，這在很大程度上歸功于你在人工智能領(lǐng)域推動(dòng)的進(jìn)步。我想知道，無(wú)論是為了你的生活，還是你養(yǎng)育孩子的方式，你是否基于你對(duì)這些模型的力量將在多快的時(shí)間內(nèi)顯現(xiàn)在這個(gè)世界上而更新的信念，從而改變了什么？

Bob McGrew： 是的，我認(rèn)為事實(shí)是我并沒(méi)有改變什么。而且我認(rèn)為這可能是我的一個(gè)失敗之處，對(duì)吧？比如，誰(shuí)比我更適合去搞清楚孩子們應(yīng)該學(xué)習(xí)什么呢？然而，我認(rèn)為我?guī)缀踹€在嘗試教他們和八年前一樣的東西。

當(dāng)ChatGPT可以為他編碼時(shí)，我為什么要教我八歲的兒子編碼呢？我認(rèn)為這是一個(gè)謎。但是，在某種意義上，未來(lái)是注定的，但實(shí)際的運(yùn)作方式的輪廓，我認(rèn)為將是非常神秘的，并且會(huì)隨著時(shí)間的推移向我們揭示。

因此，我認(rèn)為嘗試那些剛好在你能力邊界上的事情的古老真理非常重要。你要努力學(xué)習(xí)數(shù)學(xué)，努力學(xué)習(xí)編碼，寫作，學(xué)習(xí)寫好文章，學(xué)習(xí)廣泛閱讀。我認(rèn)為這些將培養(yǎng)孩子們和坦率地說(shuō)，成年人需要的技能，無(wú)論人工智能最終會(huì)做什么。

因?yàn)閺母旧险f(shuō)，這與編碼無(wú)關(guān)。這與數(shù)學(xué)無(wú)關(guān)。而是關(guān)于你學(xué)習(xí)如何以結(jié)構(gòu)化的方式思考問(wèn)題。

主持人Jordan： 好的，這一切都太棒了。我相信我們可以和您再聊上幾個(gè)小時(shí)。但我們喜歡用一些快速問(wèn)答來(lái)結(jié)束對(duì)話。第一個(gè)問(wèn)題是，在當(dāng)今的AI領(lǐng)域，什么是被過(guò)度炒作的，什么是被低估的？

Bob McGrew： 哇，好的。嗯，對(duì)于什么是過(guò)度炒作的，一個(gè)簡(jiǎn)單的答案是，我認(rèn)為是新的架構(gòu)。市面上有很多新的架構(gòu)。它們看起來(lái)很有趣，但往往在規(guī)�；瘯r(shí)會(huì)崩潰。所以，如果有一個(gè)在規(guī)模化時(shí)不會(huì)崩潰的架構(gòu)，那它就不會(huì)被過(guò)度炒作。在那之前，它們都是被過(guò)度炒作的。至于被低估的，我認(rèn)為是01。我覺(jué)得它被炒作得很厲害，但它是否被恰如其分地炒作了呢？沒(méi)有。我認(rèn)為它被低估了。

主持人Jacob： 我知道我們的聽(tīng)眾都會(huì)很好奇，所以我會(huì)問(wèn)，但您能否分享一些關(guān)于您在這個(gè)時(shí)候離開(kāi)OpenAI的原因？

Bob McGrew： 嗯，事實(shí)是，我在那里工作了八年，我真的覺(jué)得我完成了當(dāng)初我來(lái)這里時(shí)想要完成的大部分事情。而且，我宣布辭職的時(shí)間是在O1預(yù)覽版發(fā)布之后，這并非巧合。你知道，我們開(kāi)發(fā)了一個(gè)特定的項(xiàng)目，一個(gè)研究項(xiàng)目，再次強(qiáng)調(diào)，是預(yù)訓(xùn)練，多模態(tài)推理。這些問(wèn)題都得到了解決。坦率地說(shuō)，這是一份艱苦的工作。當(dāng)我覺(jué)得我已經(jīng)完成了我需要做的事情時(shí)，是時(shí)候把它交給下一代對(duì)這份工作充滿熱情并致力于解決剩余問(wèn)題的人了。我認(rèn)為他們面臨的問(wèn)題非常令人興奮。

你對(duì)未來(lái)有什么打算嗎？我離開(kāi)Palantir后，在加入OpenAI之前花了兩年時(shí)間。我開(kāi)始籌劃一家機(jī)器人公司，并且嘗試了很多事情。我親自動(dòng)手制造東西，并與很多人交談。坦率地說(shuō)，我犯了很多錯(cuò)誤，但沒(méi)有哪個(gè)錯(cuò)誤是真正重要的。在這個(gè)過(guò)程中，我學(xué)到了很多，并形成了自己關(guān)于什么對(duì)世界重要以及技術(shù)進(jìn)步的本質(zhì)是什么的理論。

所有這些經(jīng)歷，我遇到的人，以及我想出的想法都幫助我加入了OpenAI。事實(shí)證明，這比我離開(kāi)Palantir后的前六個(gè)月里所能選擇的任何事情都要好得多。所以，我不著急。我將繼續(xù)與人會(huì)面并弄清楚事情。我真的很享受思考和學(xué)習(xí)新事物的過(guò)程。

主持人Jacob： 既然您現(xiàn)在有更多的時(shí)間了，有沒(méi)有什么您特別想深入研究的領(lǐng)域，或者是一些您一直想花更多時(shí)間但由于日常工作繁忙而無(wú)法顧及的事情？

Bob McGrew： 嗯，你知道，有趣的是，我覺(jué)得自己好像被困在一個(gè)盒子里八年了。這是一個(gè)非常酷的盒子。是的，一個(gè)非�？岬谋焕г诶锩娴暮凶�。但是外面發(fā)生了很多事情。而且，就像我說(shuō)的，我一直在和機(jī)器人領(lǐng)域的創(chuàng)始人交談，看到在OpenAI沒(méi)有做機(jī)器人研究的這段時(shí)間里發(fā)生了很多很酷的事情。而且，與創(chuàng)始人、研究人員、做有趣事情的人建立聯(lián)系，這真的很有趣，也很吸引人。

主持人Jacob： 嗯，這是一次絕對(duì)引人入勝的對(duì)話，我知道這對(duì)我和喬丹以及我們的聽(tīng)眾來(lái)說(shuō)都是如此。感謝您來(lái)這里并分享這一切。我想把最后的話語(yǔ)權(quán)留給您。有什么人們可以去了解更多關(guān)于您的信息的地方嗎？您想給我們的聽(tīng)眾留下什么？或者您想號(hào)召大家一起探索的，您感興趣的方向？或者隨便說(shuō)點(diǎn)什么都可以。

Bob McGrew： 是的，嗯，如果你想關(guān)注我正在思考的事情以及我的進(jìn)展，最好的地方是在Twitter上關(guān)注我，賬號(hào)是@BobMcGrewAI。我認(rèn)為這里最恰當(dāng)?shù)慕Y(jié)束語(yǔ)是，人工智能的進(jìn)步將繼續(xù)下去。而且這將是非常令人興奮的。它不會(huì)放緩，但它會(huì)改變。這很有趣。所以我鼓勵(lì)大家繼續(xù)努力。

主持人Jacob： 好的，鮑勃，非常感謝。真的，這太引人入勝了。隨時(shí)歡迎你再來(lái)。

本文來(lái)自華爾街見(jiàn)聞，歡迎下載APP查看更多

相關(guān)熱詞： openai mcgrew 機(jī)器人 bob gpt-3

上一篇：人工智能如何重塑傳媒內(nèi)容生產(chǎn)模式？這場(chǎng)沙龍上，從業(yè)者熱議

下一篇：軟體機(jī)器人，能否成為具身智能的另一條路線？

前OpenAI首席研究官：AI下一步是什么？
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2024-12-20 20:37:36 瀏覽：100次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

前OpenAI首席研究官：AI下一步是什么？ 來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2024-12-20 20:37:36 瀏覽：100次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

前OpenAI首席研究官：AI下一步是什么？
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2024-12-20 20:37:36 瀏覽：100次