展會信息港展會大全

2024澎湃科創(chuàng)先鋒|閆維新:通用AI與機(jī)器人結(jié)合引領(lǐng)產(chǎn)業(yè)變革
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-11-14 14:14:44   瀏覽:67次  

導(dǎo)讀:“機(jī)器人是人工智能和物理世界交互的最優(yōu)化選擇之一,能夠復(fù)現(xiàn)人工智能積累的信息和數(shù)據(jù),在生產(chǎn)、教育、裝配、交互及危險場景等領(lǐng)域發(fā)揮作用。”上海交通大學(xué)博士生導(dǎo)師、上海人工智能研究院首席科學(xué)家、上海智元新創(chuàng)技術(shù)有限公司聯(lián)合創(chuàng)始人閆維新在“2024(第五屆)科創(chuàng)先鋒大會暨產(chǎn)業(yè)創(chuàng)新跨區(qū)域協(xié)同發(fā)展圓桌會議”上表示。上海交通大學(xué)博士生導(dǎo)師、上海人工智能研究院首席科 ......

“機(jī)器人是人工智能和物理世界交互的最優(yōu)化選擇之一,能夠復(fù)現(xiàn)人工智能積累的信息和數(shù)據(jù),在生產(chǎn)、教育、裝配、交互及危險場景等領(lǐng)域發(fā)揮作用!鄙虾=煌ù髮W(xué)博士生導(dǎo)師、上海人工智能研究院首席科學(xué)家、上海智元新創(chuàng)技術(shù)有限公司聯(lián)合創(chuàng)始人閆維新在“2024(第五屆)科創(chuàng)先鋒大會暨產(chǎn)業(yè)創(chuàng)新跨區(qū)域協(xié)同發(fā)展圓桌會議”上表示。

2024澎湃科創(chuàng)先鋒|閆維新:通用AI與機(jī)器人結(jié)合引領(lǐng)產(chǎn)業(yè)變革

上海交通大學(xué)博士生導(dǎo)師、上海人工智能研究院首席科學(xué)家閆維新

11月13日,2024澎湃科創(chuàng)先鋒大會暨產(chǎn)業(yè)創(chuàng)新跨區(qū)域協(xié)同發(fā)展圓桌會議在上海成功舉辦。本次大會由澎湃新聞主辦,南通市科技局、南通報業(yè)傳媒集團(tuán)協(xié)辦,上海臨港集團(tuán)、江蘇啟東呂四港經(jīng)濟(jì)開發(fā)區(qū)特別支持,同時特別鳴謝陽光保險集團(tuán)的支持。大會以“科創(chuàng)向新,共促提質(zhì)”為主題,旨在匯聚政府領(lǐng)導(dǎo)、產(chǎn)業(yè)領(lǐng)袖、學(xué)術(shù)專家及科創(chuàng)生態(tài)鏈的知名人物,共同探討科技創(chuàng)新與產(chǎn)業(yè)協(xié)同發(fā)展的新路徑,為推動經(jīng)濟(jì)社會的高質(zhì)量發(fā)展貢獻(xiàn)力量。

2024澎湃科創(chuàng)先鋒|閆維新:通用AI與機(jī)器人結(jié)合引領(lǐng)產(chǎn)業(yè)變革

在論壇上,閆維新展示了人工智能技術(shù)的巨大潛力,分享了通用人工智能技術(shù)在機(jī)器人領(lǐng)域的最新應(yīng)用成果,并探討了未來機(jī)器人產(chǎn)業(yè)的發(fā)展趨勢。他提到,人形機(jī)器人將具備人類的形態(tài),對智能化要求更高,并且是多交叉融合的行為,對人形機(jī)器人而言或者對機(jī)器人而言涉及電子、機(jī)械、硬件、軟件、人工智能等。而基于此,未來機(jī)器人產(chǎn)業(yè)的發(fā)展將會帶來產(chǎn)業(yè)的變革。

以下是演講全文:

我給大家進(jìn)行一次交流,關(guān)于人工智能和機(jī)器人,機(jī)器人是建立人工智能和整個物理世界的一個最優(yōu)化的選擇之一,可以將之前的人工智能所積累的知識,通過機(jī)器人來復(fù)現(xiàn),處理在生產(chǎn)、教育、裝配、交互,特別是危險場景中很多人不太喜歡的、在危險環(huán)境中難以勝任的一些事情。

下面是我本人博士、博士生導(dǎo)師在機(jī)器人應(yīng)用領(lǐng)域涉及過的若干項目。這是一個最早做的跟烹飪相關(guān)的機(jī)器人作業(yè)單元,是做漢堡包的。它通過軌跡規(guī)劃完成整個工藝流程,在整個過程中對整個烹飪工藝進(jìn)行解析,解析完之后凝練出做若干個動作的元素,通過機(jī)器人復(fù)現(xiàn),20秒鐘左右一個漢堡包可以做出來。冬季奧運(yùn)會的機(jī)器人餐廳就是類似的方案,當(dāng)時的漢堡包、炒、蒸、燒等烹飪機(jī)器人方案都是我參與設(shè)計的。當(dāng)時根據(jù)表面的情況判斷烹飪情況,這也是用傳統(tǒng)工具來做炸薯條,就像人一樣,原材料出來之后就直接倒進(jìn)油鍋,它沒有辦法應(yīng)對突發(fā)情況,早先的人工智能還沒有參與機(jī)器人餐飲領(lǐng)域,當(dāng)時的機(jī)器人泛化性有限,魯棒性有限,很多突發(fā)情況做不了。

人工智能實(shí)際上推動了人形機(jī)器人產(chǎn)業(yè),為什么會有人形機(jī)器人這么火爆?一個是工業(yè)機(jī)器人和協(xié)作機(jī)器人夯實(shí)了關(guān)鍵零部件的基礎(chǔ)。第二個是大語言模型的出現(xiàn)讓人機(jī)交互成為可能,同時這種思路為大樣本、大算力情況下的具身智能垂類模型的出現(xiàn)奠定了基礎(chǔ),可以將人形機(jī)器人完成早先難以完成的、具備一些自主決策的工作,它將是未來產(chǎn)業(yè)再造基礎(chǔ)的牽引,我思考過一件事情,就是新能源汽車的存在,是對原有的汽車的一個增量、升級,而人形機(jī)器人是有望重塑整個產(chǎn)業(yè)鏈布局。

第一個是柔性制造方向,包括焊接、噴涂等,都可以在工業(yè)機(jī)器人上做,但是很多是與裝配類、柔性相關(guān)的,枯燥乏味的場景還有很大的空間。第二是特種替身方面,這是我最看好的。我去了一趟廣州南方電網(wǎng)的盾構(gòu)機(jī)現(xiàn)場,廣東不像上海,上海沖積平原,地質(zhì)比較單一,但是到了廣東,當(dāng)通過人口更換刀頭的時候,一旦造成失衡,很容易造成人員傷亡,危險場景替代是現(xiàn)有人形機(jī)器人或者現(xiàn)有機(jī)器人具身智能或者遠(yuǎn)程操作最有機(jī)會的情況。第三個是教學(xué)科研。

現(xiàn)在是第四代機(jī)器人,第四代通用機(jī)器人相當(dāng)于是一個機(jī)器人本體能夠在某些領(lǐng)域完成比較通用的泛化能力,人也是不一樣的,有的人像劉翔可以跑得特別快,有的人腦袋特別好,機(jī)器人本體也是不同的構(gòu)型,只是在某一大類上面可以做到通用性。第二個觀點(diǎn),人形機(jī)器人今后下工廠,而工業(yè)和協(xié)作機(jī)器人在已有工廠上的智能化升級比人形機(jī)器人落地更早,因為這種情況下只用在原先的基礎(chǔ)上增加了感知、算法、算力之后,其實(shí)能夠完成很多以前難以完成的工作,所以通用人形機(jī)器人、通用人工智能不是只賦予人形機(jī)器人,而是對所有具備操作能力的機(jī)器人賦予一定的自主規(guī)劃、自主決策、自主執(zhí)行能力。

到2028年之后,第四代機(jī)器人將會有比較大的發(fā)展,去年是人形機(jī)器人的元年,今年是小批量的應(yīng)用落地,我們也在做若干的試驗,包括分揀、PTC工作,在我們的更高算力的情況下,在樣本空間更大的情況下,在整個應(yīng)用利用垂類模型更豐富的情況下,我們將會在2028年之后邁向第四代整個機(jī)器人的時代。

整個國內(nèi)外機(jī)器人化的發(fā)展情況,我們國內(nèi)做得很早。最早是我們覺得人形機(jī)器人是科研領(lǐng)域用的,后來發(fā)現(xiàn),用兩三萬美金完成一個人形機(jī)器人及其背后的具身智能處理能力是可行的。江浙滬地區(qū)基本可以找到機(jī)器人所需要的零部件,但在算力部分我們是有差距的,同時國內(nèi)也有公司在做相應(yīng)的算力部署,在樣本方面我覺得是我們最大的優(yōu)勢,海量的應(yīng)用空間,尤其是江浙滬長三角這邊應(yīng)用的整個包羅性可以為機(jī)器人應(yīng)用落地提供大量的機(jī)會。

人形機(jī)器人將具備人類的形態(tài),對智能化要求更高,并且是多交叉融合的行為,對人形機(jī)器人而言或者對機(jī)器人而言涉及電子、機(jī)械、硬件、軟件、人工智能,其實(shí)這個事情今后的發(fā)展情況會帶來產(chǎn)業(yè)的變革,產(chǎn)業(yè)變革會分為幾個方面。

第一是可認(rèn)知能力,它會越來越聰明,另外是辨識,高效高速開發(fā)能力,增強(qiáng)迭代能力、大量的制造能力和超低成本的國產(chǎn)化制造能力,在五個技術(shù)方面進(jìn)行重大突破,計算、運(yùn)控、能源、驅(qū)動和整個結(jié)構(gòu),尤其是我的本體。

目前來說,to B汽車產(chǎn)業(yè)為例,在一些復(fù)雜場景中還是由人工完成,而現(xiàn)有的工業(yè)機(jī)器人基本上不具備這種能力,包括整個機(jī)器人的自主決策能力、觸覺和視覺的交叉融合感知下的任務(wù)執(zhí)行能力,對于這種情況下,車廠大量需求這樣的工種,對于人形機(jī)器人而言,它會有一定的空間。

有一個想法,大家一直覺得我們的腿真的是很完美的嗎?其實(shí)除了腿以外,輪子其實(shí)也是很完美的,針對足式來說,在外高動態(tài)特性以及比較需要強(qiáng)的負(fù)載下的抗擾動力強(qiáng)的情況下,需要剛?cè)狁詈系脑O(shè)計,最后完成機(jī)器人腦的布局,小腦、腦干、大腦,腦干是做每個關(guān)節(jié)速度環(huán)、電流環(huán)以及扭矩環(huán)的控制,小腦是做運(yùn)動控制、步態(tài)控制、上肢的運(yùn)動控制,大腦是做感知決策相關(guān)的。有了這個設(shè)計之后,需要一個端側(cè)算力底座,目前來說國內(nèi)還是比較欠缺的,我們現(xiàn)在還需要努力完成,這種卡脖子卡得非常難受。

人形機(jī)器人算力包括,電關(guān)節(jié)、AI計算和超算中心,這是整個產(chǎn)業(yè)鏈新的布局。這個新的布局之后,我進(jìn)行了深入思考,目前人形機(jī)器人如何被我的人工智能賦予?一個是靈巧操作能力,現(xiàn)在的人形機(jī)器人看起來只是走來走去,它們實(shí)際上能做什么呢?它要干活,靈巧操作能力和具身智能的整個平臺搭建,而對于整個靈巧操作能力來說,靈巧手做了很多年,現(xiàn)在的靈巧手關(guān)鍵在于特定構(gòu)型。

后面我做了一個清單,包括任務(wù)清單,以居家服務(wù)機(jī)器人為主,并且包括提拉端抓按壓等若干個動作進(jìn)行嘗試。之后我再把我的具身智能算法進(jìn)行賦能,完成我的整個感知,加了很多傳感器,而且它能夠做出若干超人的動作,我們?nèi)酥荒茏龅?00到760納米的可視范圍,而機(jī)器人可以在紅外、紫外光譜下進(jìn)行感知。第二個事情是可以像我們的背后也可以加攝像頭,所以這樣的情況下可以做全場景的感知,有可能完成在感知方面超越人的能力,同時在運(yùn)動執(zhí)行方面超越人的能力。

然后我做了一個廚子,我們完成了智能餐廳,把常規(guī)類的烹飪結(jié)合在一起,進(jìn)行一個人形機(jī)器人的應(yīng)用場景搭建,完成了幾個烹飪工藝,之后還有清潔部分,左邊是我們整個對烹飪相關(guān)工具類和整個操作的清單,逐一完成。有了這個之后,我們就要做具身智能,具身智能要完成碳基生命和硅基生命的結(jié)合,它的結(jié)合就是人機(jī)共融模式,用具身智能來賦能人形機(jī)器人,而這個時候需要我們有一個標(biāo)準(zhǔn)的數(shù)據(jù)采集平臺,之后有整個訓(xùn)練集,采集人的動作、環(huán)節(jié)動作,作為樣本、作為模型的建立,建立完之后復(fù)現(xiàn)出來。我們現(xiàn)在發(fā)現(xiàn)一件事情,在一些特定工作訓(xùn)練的時候,萬級以上的數(shù)據(jù)可以大大提高任務(wù)完成的成功率,可以達(dá)到98%,然而長程動作還在攻克過程中。

在建立數(shù)據(jù)采集平臺之后,我們可以展望通用人工智能與通用機(jī)器人的結(jié)合,包括我個人、我參與的公司,包括在上海交通大學(xué)個人想做的事情。第一個,我會做一個數(shù)據(jù)采集平臺,并不簡簡單單是一個遠(yuǎn)程遙操作,而是把機(jī)器人抓取到的物體的力反饋到人類。第二是20度以上的靈巧手,第三是針對人形機(jī)器人做特定的關(guān)節(jié)模組,之后我會做一些串并聯(lián)的混合,包括跟人的姿態(tài)不太一樣的機(jī)器人。其實(shí)已經(jīng)開始了,明年年后大家可以看到,我的研究方向還包括開放型場景的具身智能研究,很多特種行業(yè),包括危險場景處置,主被動液電混合模式復(fù)雜地形應(yīng)用。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港