展會信息港展會大全

清華大學(xué)教授孫富春:具身智能是AI進(jìn)入物理世界進(jìn)行交互的載體
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-12-07 10:09:19   瀏覽:208次  

導(dǎo)讀:每經(jīng)記者:王晶每經(jīng)編輯:梁梟2024年12月6日,“2024數(shù)智科技大會”在成都召開,活動以“奔向數(shù)智新時代”為主題,由成都傳媒集團(tuán)指導(dǎo),每日經(jīng)濟(jì)新聞主辦,中央財經(jīng)大學(xué)數(shù)字經(jīng)濟(jì)融合創(chuàng)新發(fā)展中心提供學(xué)術(shù)支持,數(shù)智未來場景實(shí)驗(yàn)室進(jìn)行智略支持。會上,清華大學(xué)計算機(jī)科學(xué)與技術(shù)系教授、中國人工智能學(xué)會副理事長孫富春圍繞“具身智能賦能產(chǎn)業(yè)發(fā)展”發(fā)表主題演講。他首先回顧了 ......

每經(jīng)記者:王晶每經(jīng)編輯:梁梟

2024年12月6日,“2024數(shù)智科技大會”在成都召開,活動以“奔向數(shù)智新時代”為主題,由成都傳媒集團(tuán)指導(dǎo),每日經(jīng)濟(jì)新聞主辦,中央財經(jīng)大學(xué)數(shù)字經(jīng)濟(jì)融合創(chuàng)新發(fā)展中心提供學(xué)術(shù)支持,數(shù)智未來場景實(shí)驗(yàn)室進(jìn)行智略支持。

會上,清華大學(xué)計算機(jī)科學(xué)與技術(shù)系教授、中國人工智能學(xué)會副理事長孫富春圍繞“具身智能賦能產(chǎn)業(yè)發(fā)展”發(fā)表主題演講。他首先回顧了具身智能的起源,提到沃倫S麥卡洛克探討認(rèn)知與身體的關(guān)系、艾倫圖靈通過心智的發(fā)育和具身來發(fā)展智能,以及赫爾德和海因證明了主動行為與感覺反饋的互動對認(rèn)知發(fā)展至關(guān)重要。

清華大學(xué)教授孫富春:具身智能是AI進(jìn)入物理世界進(jìn)行交互的載體

孫富春發(fā)表主題演講 圖片來源:每經(jīng)記者 張建 攝

孫富春還解釋了具身智能與離身智能體的區(qū)別!半x身智能體不具備物理形態(tài),被動接受人類采集制作好的數(shù)據(jù),停留在‘紙上談兵’,而具身智能是給機(jī)器一個物理的身體或形式來與物理世界交互(如家用服務(wù)機(jī)器人、無人車等)。1963年麻省理工學(xué)院Richard Held教授用一對貓做學(xué)習(xí)訓(xùn)練,一只貓放在籃子里并蒙上眼睛,另一只貓在物理世界自主行動,結(jié)果與物理世界進(jìn)行感知與交互的貓學(xué)會了行走,這個例子進(jìn)一步說明具身的重要性。”

然而,要實(shí)現(xiàn)真正的“智能”,具身智能系統(tǒng)需要具備場景感知、認(rèn)知、多模態(tài)的連續(xù)學(xué)習(xí)等能力為機(jī)器人提供更為豐富和全面的環(huán)境理解能力。孫富春舉例稱:“人要做好一件事通常要將抽象的感知提升為認(rèn)知,而認(rèn)知最重要的承載是知識,把蘋果放在桌子上可以分解為三步。首先,找蘋果,這是感知技能加認(rèn)知技能的結(jié)合,我們的大腦指揮頸部帶動眼睛掃描;第二步,抓住蘋果;第三步,放置蘋果。在知識引導(dǎo)下,機(jī)器也會如同人一樣迅速完成各類任務(wù),并且可以根據(jù)操作對象的不同形態(tài)、大小、軟硬來完成操作。不僅如此,具身智能還體現(xiàn)在智能體做多任務(wù)和跨任務(wù)方面!

當(dāng)前,具身智能的快速發(fā)展,為眾多行業(yè)帶來了前所未有的變革機(jī)遇。在制造業(yè)領(lǐng)域,具身智能機(jī)器人能夠精準(zhǔn)執(zhí)行復(fù)雜的生產(chǎn)任務(wù),提高生產(chǎn)效率和產(chǎn)品質(zhì)量;在醫(yī)療領(lǐng)域,具身智能也展現(xiàn)出了巨大的應(yīng)用潛力。例如,在外科手術(shù)中,醫(yī)療機(jī)器人可以輔助醫(yī)生進(jìn)行高精度的手術(shù)操作,降低了手術(shù)風(fēng)險,提高了手術(shù)成功率。此外,具身智能還在智能家居、安防監(jiān)控、智慧交通等領(lǐng)域發(fā)揮著重要作用。

展望具身智能的未來,孫富春提出,具身智能的發(fā)展將主要圍繞四大核心要素展開:本體,具身智能體,數(shù)據(jù)、知識和場景以及學(xué)習(xí)和進(jìn)化架構(gòu)。

具體來看,本體作為實(shí)際的執(zhí)行者,是在物理或者虛擬世界進(jìn)行感知和任務(wù)執(zhí)行的機(jī)構(gòu),具有廣泛適應(yīng)性的機(jī)器人本體是非常必要的。其次,具身智能體是具身于本體之上的智能體,負(fù)責(zé)感知、理解、決策、控制等核心工作,能夠與環(huán)境進(jìn)行自主交互是具身智能的核心。目前,具有通用能力的LLM(大語言模型)和VLM(視覺語言模型)等模型可以賦予具身智能體強(qiáng)大的泛化能力。第三,數(shù)據(jù)是泛化的關(guān)鍵,但涉及機(jī)器人的數(shù)據(jù)稀缺且昂貴。為了適應(yīng)復(fù)雜環(huán)境和任務(wù)的泛化性,模型規(guī)模變得越來越大,而大規(guī)模的模型對于數(shù)據(jù)的要求為嚴(yán)格。第四,真實(shí)物理環(huán)境的諸多方面目前往往難以模擬,如何對簡單的仿真和復(fù)雜的真實(shí)世界進(jìn)行有效的Sim2Real建模,也是智能體設(shè)計的關(guān)鍵。

每日經(jīng)濟(jì)新聞

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港