人形機(jī)器人擁有聰慧的“大腦”、敏捷的“小腦”、靈活的“肢體”,是通用人工智能的理想載體,蘊(yùn)藏著巨大的市場(chǎng)空間和發(fā)展機(jī)遇。在今年的機(jī)器人博覽會(huì)上,共有27款人形機(jī)器人亮相,讓觀眾感覺(jué)離未來(lái)又近了一步。
人形機(jī)器人發(fā)展還面臨哪些挑戰(zhàn)?未來(lái)它們有哪些終極應(yīng)用場(chǎng)景?對(duì)此,新京報(bào)記者采訪了北京郵電大學(xué)人工智能學(xué)院教授方斌,北京航空航天大學(xué)副教授、博士生導(dǎo)師陶永,北京具身智能機(jī)器人創(chuàng)新中心數(shù)據(jù)智能負(fù)責(zé)人李廣宇。
8月22日,2024世界機(jī)器人大會(huì)機(jī)器人博覽會(huì),“天工”人形機(jī)器人被團(tuán)團(tuán)簇?fù)。新京?bào)記者 李木易 攝
問(wèn)題1
人形機(jī)器人有何特點(diǎn)?它和具身智能的關(guān)系是什么?
方斌表示,人形機(jī)器人在形態(tài)上仿人。一方面是移動(dòng)能力,像人下肢一樣運(yùn)動(dòng);另一方面是仿人手臂的靈巧操作能力。具身智能是機(jī)器人本體和人工智能結(jié)合形成的物理閉環(huán)系統(tǒng)。人形機(jī)器人是具身智能非常典型的應(yīng)用。由于人工智能僅依靠數(shù)據(jù)和算力,所以迭代的速度比機(jī)器人本體更快一些。
陶永認(rèn)為,更寬泛的人形機(jī)器人還有環(huán)境感知能力和人機(jī)交互能力。
李廣宇介紹,人形機(jī)器人相當(dāng)于是具身智能機(jī)器人的一個(gè)典型應(yīng)用示范。首先在技術(shù)上是高地,如果把人形機(jī)器人的技術(shù)問(wèn)題都解決的話,可以向下兼容其他類(lèi)型的機(jī)器人,比如把腿換成輪式底盤(pán),這就是現(xiàn)在比較流行的輪臂機(jī)器人。
在通用性上,世界上大部分的設(shè)計(jì)都是以人為核心用戶(hù),所以做人形機(jī)器人在細(xì)分場(chǎng)景的效率不一定最高,但泛化性和通用性是最好的。從倫理的角度來(lái)說(shuō),人形機(jī)器人更能和人產(chǎn)生情感的共鳴。
問(wèn)題2
人形機(jī)器人“大腦”“小腦”的作用是什么?
陶永介紹,人形機(jī)器人擁有聰慧的“大腦”、敏捷的“小腦”、靈活的“肢體”。“大腦”作為人形機(jī)器人控制系統(tǒng)的中心,承擔(dān)著類(lèi)似于人類(lèi)大腦的復(fù)雜認(rèn)知和決策功能。基于通用大模型、數(shù)據(jù)集、高效計(jì)算架構(gòu)、多模態(tài)融合感知等關(guān)鍵技術(shù),“大腦”使人形機(jī)器人具備了學(xué)習(xí)與適應(yīng)能力,使其能夠處理基本運(yùn)算、圖像處理、視覺(jué)識(shí)別、決策規(guī)劃和智能決策。
“小腦”在人形機(jī)器人運(yùn)動(dòng)控制與協(xié)調(diào)方面發(fā)揮重要作用,是實(shí)現(xiàn)精確動(dòng)作的保證。“小腦”由傳感器融合模塊、動(dòng)力學(xué)模型和控制器等組成,制定運(yùn)動(dòng)策略,確保機(jī)器人動(dòng)作的流暢性和穩(wěn)定性。
問(wèn)題3
近幾年,人形機(jī)器人的熱度為何這么高?
陶永表示,特斯拉等公司研發(fā)的人形機(jī)器人向大眾展示了它的潛力,引起了關(guān)注。人形機(jī)器人搭建了一個(gè)通用的平臺(tái),可以將人工智能、大模型技術(shù)遷移到人形機(jī)器人上進(jìn)行驗(yàn)證,比如將汽車(chē)上基于視覺(jué)的環(huán)境識(shí)別、避障運(yùn)動(dòng)、路徑規(guī)劃的功能遷移到機(jī)器人上后,將發(fā)揮更大的優(yōu)勢(shì)。
在相關(guān)領(lǐng)軍企業(yè)的推動(dòng)下,人形機(jī)器人的技術(shù)正在加速迭代、快速研發(fā),硬件成本不斷降低,有望更廣泛地出現(xiàn)在檢測(cè)、搬運(yùn)等場(chǎng)景中。
李廣宇認(rèn)為,這很大程度上歸功于大模型發(fā)展突飛猛進(jìn),特別是過(guò)去兩三年,從ChatGPT的發(fā)布到最近多模態(tài)大模型的進(jìn)展,都遠(yuǎn)遠(yuǎn)超出業(yè)界預(yù)期,已經(jīng)走向公眾視野。但大模型畢竟是在軟件層面,和現(xiàn)實(shí)的物理世界缺少交互媒介,所以業(yè)界希望給通用的人工智能加一個(gè)身體,也就是具身智能。
另外,這也歸功于國(guó)內(nèi)多年來(lái)產(chǎn)業(yè)鏈的發(fā)展,包括傳感器技術(shù)、電機(jī)技術(shù)等,使人形機(jī)器人研發(fā)門(mén)檻降低。同時(shí),國(guó)家在政策引導(dǎo)方面對(duì)人形機(jī)器人產(chǎn)業(yè)給予了較大支持。
問(wèn)題4
人形機(jī)器人和工業(yè)機(jī)器人等相比有何優(yōu)勢(shì)?
陶永認(rèn)為,人形機(jī)器人可以適應(yīng)復(fù)雜地形,比如在電力巡檢過(guò)程中,輪式機(jī)器人邁不過(guò)去的臺(tái)階,人形機(jī)器人可以上得去。另外,人形機(jī)器人上肢有更多自由度,可以實(shí)施精確操作。
李廣宇表示,工業(yè)機(jī)器人重復(fù)定位精度非常高,但沒(méi)有泛化性,基本按照編程重復(fù)進(jìn)行。人形機(jī)器人既有移動(dòng)能力,也有操作能力,其泛化性帶來(lái)了通用能力的預(yù)期,在物料分揀、上下貨等環(huán)節(jié)可以對(duì)工業(yè)機(jī)器人進(jìn)行補(bǔ)位。
GALBOT G1人形機(jī)器人展示超市工作場(chǎng)景。新京報(bào)記者 李木易 攝
問(wèn)題5
發(fā)展人形機(jī)器人還有哪些技術(shù)需要突破?
人形機(jī)器人不僅使用了計(jì)算芯片、存儲(chǔ)芯片、控制芯片、觸覺(jué)傳感器,還應(yīng)用了各類(lèi)軟件、各類(lèi)關(guān)節(jié)、伺服電機(jī)、人造皮膚等新材料。
方斌說(shuō),目前,經(jīng)過(guò)人形機(jī)器人這波熱潮,小型化的電機(jī)、驅(qū)控一體化的關(guān)節(jié)相對(duì)成熟了不少。受限的在于關(guān)鍵的傳感器件,包括類(lèi)似于人皮膚的觸覺(jué)傳感器,類(lèi)似人手的靈巧手操作末端,和人類(lèi)相比還欠缺很多。比如在手機(jī)裝配線上,工人可以熟練地進(jìn)行精細(xì)的工業(yè)裝配,但人形機(jī)器人還完成不了這些任務(wù)。
陶永也表示,從硬件上來(lái)說(shuō),高能量密度小體積的關(guān)節(jié)、低成本的傳感器等仍需提升。軟件方面,要實(shí)現(xiàn)人形機(jī)器人在草地、沙地、崎嶇路面的穩(wěn)定行走,目前有基于步態(tài)的虛擬仿真訓(xùn)練平臺(tái)進(jìn)展較快,但仍然需要不斷完善。
他說(shuō),目前人形機(jī)器人價(jià)格偏高,未來(lái),隨著硬件價(jià)格和軟件研發(fā)成本降低,應(yīng)用場(chǎng)景日漸成熟,人形機(jī)器人有望批量化生產(chǎn),價(jià)格下降。
李廣宇表示,“大腦”部分得益于大模型的發(fā)展,比“小腦”和“本體(肢體)”更成熟一點(diǎn),主要負(fù)責(zé)人機(jī)交互和日常任務(wù)的規(guī)劃拆解。“小腦”負(fù)責(zé)具體執(zhí)行,目前業(yè)內(nèi)正在嘗試不同技術(shù)路線的方向,還需要一定的探索。
“本體(肢體)”包括上肢、下肢和傳感器三個(gè)方面。在上肢方面,多關(guān)節(jié)、多自由度的機(jī)械臂發(fā)展得相對(duì)成熟,但上肢末端靈巧手的精細(xì)操作需要快速迭代。通過(guò)近些年四足機(jī)器人的發(fā)展,下肢研發(fā)的進(jìn)展比較快。傳感器方面,視覺(jué)傳感器比較成熟,末端的觸覺(jué)傳感器在不斷迭代當(dāng)中。未來(lái),人形機(jī)器人將走多模態(tài)傳感器融合的路線,所以不同種類(lèi)的傳感器都需快速發(fā)展。
問(wèn)題6
人形機(jī)器人要實(shí)現(xiàn)成熟應(yīng)用還面臨哪些挑戰(zhàn)?
方斌說(shuō),人形機(jī)器人整體運(yùn)動(dòng)的敏捷性仍有所欠缺,在通用場(chǎng)景下執(zhí)行任務(wù)的操作能力有待提升。人工智能和本體的系統(tǒng)集成能力還需要進(jìn)一步發(fā)展。
要增加人形機(jī)器人運(yùn)動(dòng)的感知能力,通過(guò)深度強(qiáng)化學(xué)習(xí)增加抗干擾性,使人工智能算法和機(jī)器人本體的結(jié)構(gòu)控制耦合得更緊密。
李廣宇表示,具身智能的數(shù)據(jù)比較稀缺,是制約產(chǎn)業(yè)發(fā)展的一個(gè)關(guān)鍵因素。目前,北京具身智能機(jī)器人創(chuàng)新中心正牽頭建設(shè)人形機(jī)器人世界上規(guī)模最大、信息最稠密、最通用的高質(zhì)量具身智能數(shù)據(jù)集。為推動(dòng)行業(yè)加快發(fā)展,創(chuàng)新中心還公布了“百臺(tái)天工計(jì)劃”,將向重點(diǎn)科研機(jī)構(gòu)與高校提供超百臺(tái)“天工”系列機(jī)器人,共同探索機(jī)器人在各種細(xì)分場(chǎng)景中如何更好落地。
小朋友和有陪伴功能的人形機(jī)器人對(duì)話。新京報(bào)記者 李木易 攝
問(wèn)題7
人形機(jī)器人的終極應(yīng)用場(chǎng)景包括哪些?多久可以實(shí)現(xiàn)?
陶永認(rèn)為,人形機(jī)器人正處于核心技術(shù)快速突破階段。在未來(lái)10年里,人形機(jī)器人有望在惡劣和特殊環(huán)境下,代替人類(lèi)進(jìn)行值守、巡邏和作業(yè)。同時(shí),在關(guān)鍵技術(shù)突破的情況下,人形機(jī)器人可能在智能工廠進(jìn)行巡檢、加工、檢測(cè)。另外,它們或?qū)?yīng)用在教育中,在大學(xué)中成為實(shí)驗(yàn)平臺(tái)。在更遠(yuǎn)的未來(lái),人形機(jī)器人也有可能進(jìn)入公共場(chǎng)所或者家庭,進(jìn)行陪護(hù)。
方斌認(rèn)為,人形機(jī)器人作為通用的具身智能本體,未來(lái)就像人類(lèi)職業(yè)分工一樣,可以應(yīng)用于不同場(chǎng)景,有的做醫(yī)生,有的當(dāng)廚師,有的在生產(chǎn)線上做工人,有的做家政護(hù)理等。在家庭應(yīng)用方面,由于老人、兒童對(duì)人形機(jī)器人的安全性要求更高,它有可能率先在中青年家庭中應(yīng)用清潔打掃功能。
問(wèn)題8
科幻片中非常逼真的仿生人形機(jī)器人何時(shí)才能實(shí)現(xiàn)?有哪些關(guān)鍵技術(shù)要突破?
陶永說(shuō),這一場(chǎng)景還比較遙遠(yuǎn),比如仿生機(jī)器人手眼協(xié)同能力還需要提升,做飯、疊衣服、裝配零件,這些日常操作對(duì)人來(lái)說(shuō)很容易,但對(duì)機(jī)器人來(lái)說(shuō),涉及視覺(jué)、手臂末端觸覺(jué)力、運(yùn)動(dòng)控制協(xié)調(diào)等,都要仿人的智能化程度來(lái)實(shí)現(xiàn),中間有很多關(guān)鍵技術(shù)需要突破。
比如仿生人形機(jī)器人的面部表情,如果做不好會(huì)給人帶來(lái)恐怖的感覺(jué),電子皮膚也要像人類(lèi)皮膚一樣有感知、交互功能,這些都需要一點(diǎn)點(diǎn)攻克。未來(lái),仿生人形機(jī)器人有望在展覽、科普?qǐng)鲳^中率先使用。
新京報(bào)記者 張璐
編輯 白爽 校對(duì) 楊許麗