一本无码DVD在线播放,亚洲日韩欧洲不卡在线高清在线观看,亚洲AV综合色区无码一二三区

機(jī)器人邁向ChatGPT時(shí)刻！清華團(tuán)隊(duì)首次發(fā)現(xiàn)具身智能Scaling Laws

來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-11-01 18:36:37 瀏覽：164次

導(dǎo)讀：劃重點(diǎn)01清華大學(xué)交叉信息院的研究團(tuán)隊(duì)發(fā)現(xiàn)具身智能領(lǐng)域的"圣杯"data scaling laws，使機(jī)器人實(shí)現(xiàn)了真正的零樣本泛化。02通過在真實(shí)場景中收集大量人類演示數(shù)據(jù)，團(tuán)隊(duì)發(fā)現(xiàn)了三個(gè)革命性的冪律關(guān)系：模型對新物體的泛化能力與訓(xùn)練物體數(shù)量呈冪律關(guān)系。03研究團(tuán)隊(duì)還破解了數(shù)據(jù)收集的難題，提出了環(huán)境數(shù)量、物體數(shù)量和每個(gè)物體的演示次數(shù)優(yōu)化的策略。04除此之外，研究團(tuán)隊(duì)在模 ......

劃重點(diǎn)

01清華大學(xué)交叉信息院的研究團(tuán)隊(duì)發(fā)現(xiàn)具身智能領(lǐng)域的"圣杯"data scaling laws，使機(jī)器人實(shí)現(xiàn)了真正的零樣本泛化。

02通過在真實(shí)場景中收集大量人類演示數(shù)據(jù)，團(tuán)隊(duì)發(fā)現(xiàn)了三個(gè)革命性的冪律關(guān)系：模型對新物體的泛化能力與訓(xùn)練物體數(shù)量呈冪律關(guān)系。

03研究團(tuán)隊(duì)還破解了數(shù)據(jù)收集的難題，提出了環(huán)境數(shù)量、物體數(shù)量和每個(gè)物體的演示次數(shù)優(yōu)化的策略。

04除此之外，研究團(tuán)隊(duì)在模型規(guī)�；矫嬉灿腥齻€(gè)重要發(fā)現(xiàn)，擴(kuò)大視覺編碼器的規(guī)模能顯著提升性能。

05未來，數(shù)據(jù)規(guī)�；瘜⑼苿訖C(jī)器人技術(shù)走向新紀(jì)元，提升數(shù)據(jù)質(zhì)量可能比盲目增加數(shù)據(jù)量更為重要。

以上內(nèi)容由大模型生成，僅供參考

Ixiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年，機(jī)器之心AIxiv專欄接收報(bào)道了2000多篇內(nèi)容，覆蓋全球各大高校與企業(yè)的頂級實(shí)驗(yàn)室，有效促進(jìn)了學(xué)術(shù)交流與傳播。如果您有優(yōu)秀的工作想要分享，歡迎投稿或者聯(lián)系報(bào)道。投稿郵箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com

想象這樣一個(gè)場景：你正在火鍋店和朋友暢聊，一個(gè)機(jī)器人熟練地為你倒飲料、端菜，完全不需要你分心招呼服務(wù)員。這個(gè)聽起來像科幻的場景，已經(jīng)被清華大學(xué)交叉信息院的研究者們變成了現(xiàn)實(shí)！他們發(fā)現(xiàn)了具身智能領(lǐng)域的 “圣杯”data scaling laws，讓機(jī)器人實(shí)現(xiàn)了真正的零樣本泛化，可以無需任何微調(diào)就能泛化到全新的場景和物體。這一突破性發(fā)現(xiàn)，很可能成為機(jī)器人領(lǐng)域的 “ChatGPT 時(shí)刻”，徹底改變我們開發(fā)通用機(jī)器人的方式！

從火鍋店到電梯，機(jī)器人展現(xiàn)驚人泛化力

研究團(tuán)隊(duì)可不是只在實(shí)驗(yàn)室里玩玩具。他們把機(jī)器人帶到了各種真實(shí)場景：火鍋店、咖啡廳、公園、噴泉旁，甚至是電梯里。更令人震驚的是，機(jī)器人在這些前所未見的環(huán)境中都展現(xiàn)出了超強(qiáng)的適應(yīng)能力！

為了確保研究的可復(fù)現(xiàn)性，團(tuán)隊(duì)慷慨地開源了所有資源，包括耗時(shí)半年收集的海量人類演示數(shù)據(jù)：

機(jī)器人邁向ChatGPT時(shí)刻！清華團(tuán)隊(duì)首次發(fā)現(xiàn)具身智能Scaling Laws

論文標(biāo)題：Data Scaling Laws in Imitation Learning for Robotic Manipulation

論文鏈接：https://arxiv.org/abs/2410.18647

項(xiàng)目主頁：https://data-scaling-laws.github.io/

連 Google DeepMind 的機(jī)器人專家 Ted Xiao 都忍不住為這項(xiàng)研究點(diǎn)贊，稱其對機(jī)器人大模型時(shí)代具有里程碑意義！

機(jī)器人邁向ChatGPT時(shí)刻！清華團(tuán)隊(duì)首次發(fā)現(xiàn)具身智能Scaling Laws

Scaling Laws：從 ChatGPT 到機(jī)器人的制勝法則

還記得 ChatGPT 為什么能橫空出世嗎？答案就是 scaling laws！現(xiàn)在，清華團(tuán)隊(duì)首次證明：這個(gè)法則在機(jī)器人領(lǐng)域同樣適用。事實(shí)上，真正的 scaling laws 包含數(shù)據(jù)、模型和算力三個(gè)維度，而本研究重點(diǎn)突破了最基礎(chǔ)也最關(guān)鍵的數(shù)據(jù)維度。

研究團(tuán)隊(duì)使用便攜式手持夾爪 UMI，在真實(shí)環(huán)境中收集了超過 4 萬條人類演示數(shù)據(jù)。他們采用最新的 Diffusion Policy 方法從這些數(shù)據(jù)中學(xué)習(xí)機(jī)器人控制模型，并通過驚人的 15000 + 次實(shí)機(jī)測試進(jìn)行嚴(yán)謹(jǐn)評估，最終發(fā)現(xiàn)了三個(gè)革命性的冪律關(guān)系：

模型對新物體的泛化能力與訓(xùn)練「物體」數(shù)量呈冪律關(guān)系。

模型對新環(huán)境的泛化能力與訓(xùn)練「環(huán)境」數(shù)量呈冪律關(guān)系。

模型對環(huán)境 - 物體組合的泛化能力與訓(xùn)練「環(huán)境 - 物體對」的數(shù)量呈冪律關(guān)系。

機(jī)器人邁向ChatGPT時(shí)刻！清華團(tuán)隊(duì)首次發(fā)現(xiàn)具身智能Scaling Laws

這意味著什么？簡單說：只要有足夠的數(shù)據(jù)，機(jī)器人就能像 ChatGPT 理解語言一樣，自然地理解和適應(yīng)物理世界！這一發(fā)現(xiàn)不僅證實(shí)了機(jī)器人領(lǐng)域與語言模型存在驚人的相似性，更為預(yù)測數(shù)據(jù)規(guī)模與模型性能的關(guān)系提供了堅(jiān)實(shí)的理論基礎(chǔ)。

顛覆性發(fā)現(xiàn)：數(shù)據(jù)收集原來要這么做！

研究團(tuán)隊(duì)還破解了一個(gè)困擾業(yè)界的難題：對于給定的操作任務(wù)，如何優(yōu)化選擇環(huán)境數(shù)量、物體數(shù)量和每個(gè)物體的演示次數(shù)？

經(jīng)過大量實(shí)驗(yàn)，他們得出了兩個(gè)出人意料的結(jié)論：

1. 當(dāng)環(huán)境數(shù)量足夠多時(shí)，在單一環(huán)境中收集多個(gè)不同的操作物體的數(shù)據(jù)收益極其有限換句話說，每個(gè)環(huán)境只需要一個(gè)操作物體的數(shù)據(jù)就夠了。

機(jī)器人邁向ChatGPT時(shí)刻！清華團(tuán)隊(duì)首次發(fā)現(xiàn)具身智能Scaling Laws

2. 單個(gè)物體的演示數(shù)據(jù)很容易達(dá)到飽和在倒水和擺放鼠標(biāo)等任務(wù)中，總演示數(shù)據(jù)達(dá)到 800 次時(shí)，性能就開始趨于穩(wěn)定。因此，每個(gè)物體 50 次示范基本就能搞定。

機(jī)器人邁向ChatGPT時(shí)刻！清華團(tuán)隊(duì)首次發(fā)現(xiàn)具身智能Scaling Laws

為驗(yàn)證這個(gè)策略，團(tuán)隊(duì)找來 4 個(gè)人，只花了一個(gè)下午就收集到了訓(xùn)練數(shù)據(jù)。結(jié)果令人震驚：在 8 個(gè)全新場景中，機(jī)器人成功率高達(dá) 90%！這意味著，原本可能需要幾個(gè)月的數(shù)據(jù)收集工作，現(xiàn)在可能只需要幾天就能完成！

模型規(guī)�；剿鞯囊馔獍l(fā)現(xiàn)

除了數(shù)據(jù)規(guī)模，研究團(tuán)隊(duì)還在模型規(guī)模化方面有三個(gè)重要發(fā)現(xiàn)：

視覺編碼器必須經(jīng)過預(yù)訓(xùn)練和完整的微調(diào)，缺一不可

擴(kuò)大視覺編碼器的規(guī)模能顯著提升性能

最令人意外的是：擴(kuò)大擴(kuò)散模型的規(guī)模卻沒能帶來明顯的性能提升，這一現(xiàn)象還值得深入研究

機(jī)器人邁向ChatGPT時(shí)刻！清華團(tuán)隊(duì)首次發(fā)現(xiàn)具身智能Scaling Laws

未來展望

數(shù)據(jù)規(guī)�；谕苿訖C(jī)器人技術(shù)走向新紀(jì)元。但研究團(tuán)隊(duì)提醒：比起盲目增加數(shù)據(jù)量，提升數(shù)據(jù)質(zhì)量可能更為重要。關(guān)鍵問題在于：

如何確定真正需要擴(kuò)展的數(shù)據(jù)類型？

如何最高效地獲取這些高質(zhì)量數(shù)據(jù)？

這些都是 Data Scaling Laws 研究正在積極探索的方向。相信在不久的將來，具有超強(qiáng)適應(yīng)力的機(jī)器人將走進(jìn)千家萬戶，讓科幻電影中的場景變?yōu)楝F(xiàn)實(shí)！而這一切，都將從清華團(tuán)隊(duì)發(fā)現(xiàn)的這個(gè)基礎(chǔ)性規(guī)律開始！

關(guān)于作者

該項(xiàng)目有兩位共同一作。一位是清華大學(xué)交叉信息研究院四年級博士生胡英東，專注于具身智能領(lǐng)域的前沿研究。他致力于探索通用機(jī)器人系統(tǒng)所面臨的基礎(chǔ)性問題，旨在使機(jī)器人能夠在各種非結(jié)構(gòu)化的現(xiàn)實(shí)環(huán)境中泛化其學(xué)習(xí)到的行為。

機(jī)器人邁向ChatGPT時(shí)刻！清華團(tuán)隊(duì)首次發(fā)現(xiàn)具身智能Scaling Laws

另一位是交叉信息研究院一年級博士生林凡淇。他專注于將大模型的先驗(yàn)知識融合到機(jī)器人任務(wù)中，幫助機(jī)器人完成日常生活中的復(fù)雜任務(wù)；同時(shí)他希望利用已有的機(jī)器人算法、視覺語言大模型，探索機(jī)器人落地的可能性。

機(jī)器人邁向ChatGPT時(shí)刻！清華團(tuán)隊(duì)首次發(fā)現(xiàn)具身智能Scaling Laws

項(xiàng)目的通訊作者是清華大學(xué)交叉信息研究院的助理教授高陽，他主要研究計(jì)算機(jī)視覺與機(jī)器人學(xué)。此前，他在美國加州大學(xué)伯克利分校獲得博士學(xué)位，師從 Trevor Darrell 教授。他還在加州伯克利大學(xué)與 Pieter Abbeel 等人合作完成了博士后工作。在此之前，高陽從清華大學(xué)計(jì)算機(jī)系畢業(yè)，與朱軍教授在貝葉斯推理方面開展了研究工作。他在 2011-2012 年在谷歌研究院進(jìn)行了自然語言處理相關(guān)的研究工作、2016 年在谷歌自動駕駛部門 Waymo 的相機(jī)感知團(tuán)隊(duì)工作，在 2018 年與 Vladlen Koltun 博士在英特爾研究院在端到端自動駕駛方面進(jìn)行了研究工作。高陽在人工智能頂級會議 NeurIPS，ICML，CVPR，ECCV，ICLR 等發(fā)表過多篇學(xué)術(shù)論文，谷歌學(xué)術(shù)引用量超過 2000 次。

機(jī)器人邁向ChatGPT時(shí)刻！清華團(tuán)隊(duì)首次發(fā)現(xiàn)具身智能Scaling Laws

機(jī)器人邁向ChatGPT時(shí)刻！清華團(tuán)隊(duì)首次發(fā)現(xiàn)具身智能Scaling Laws
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-11-01 18:36:37 瀏覽：164次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

機(jī)器人邁向ChatGPT時(shí)刻！清華團(tuán)隊(duì)首次發(fā)現(xiàn)具身智能Scaling Laws 來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-11-01 18:36:37 瀏覽：164次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

機(jī)器人邁向ChatGPT時(shí)刻！清華團(tuán)隊(duì)首次發(fā)現(xiàn)具身智能Scaling Laws
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-11-01 18:36:37 瀏覽：164次