伊隆馬斯克創(chuàng)辦的人工智能組織 OpenAI 展示了一個具有里程碑意義的成果,其去年首次發(fā)布的機械手 Dactyl ,已經(jīng)學(xué)會了單手解魔方,而這項技能是 Dactyl 自學(xué)而成的。
Dactyl 解魔方的手法還稍顯笨拙,需要花費 4 分鐘左右才能完成,這比起熟練的魔方高手還是有很大差距。
但解魔方的手速并不是 Dactyl 新能力的重點,而是這意味著我們距離理想中的 AI 機器人更近一步了:那是一種可以通過學(xué)習(xí)執(zhí)行各種現(xiàn)實任務(wù)的機器人,而且無需經(jīng)過長達(dá)數(shù)月到數(shù)年的訓(xùn)練,甚至無需專門編程。
實際上,機器人解魔方并不是什么新鮮事。2016 年半導(dǎo)體制造商英飛凌制造的一個機器人,能在不到 1 秒鐘之內(nèi)復(fù)原一個魔方,遠(yuǎn)遠(yuǎn)超過了人類的最快紀(jì)錄。兩年后麻省理工學(xué)院開發(fā)的一款機器人把將這個時間縮短到了 0.4 秒。
但這些機器人的形態(tài)大都和人手很不一樣,這樣的設(shè)計也注定了無法完成更多不同的任務(wù)。而 Dactyl 采用的是模仿人手的 24 關(guān)節(jié)機械手,研究人員希望 Dactyl 能學(xué)習(xí)如何像人類一樣來控制這些關(guān)節(jié)。
OpenAI 的機器人技術(shù)主管 Peter Welinder 表示,其實很多機器人都能輕易解魔方,但 Dactyl 與這些機器人最大的不同在于,那些機器人是制造出來專門用于解魔方的,但 Dactyl 卻能完成更多任務(wù)。
我們正在嘗試制造一個通用的機器人,能像人手一樣完成多種操作,而不是局限于某項特定任務(wù)。
因此, Dactyl 真正了不起的地方不在于能單手解魔方,而是如何學(xué)習(xí)這項技能的過程。因為在整個過程中,研究人員其實并沒有專門為機械手的操作進(jìn)行編程,一切都要靠 Dactyl 自己領(lǐng)悟。
而要讓機器人「自學(xué)成才」則離不開人工智能。Dactyl 采用的是一種在虛擬環(huán)境中進(jìn)行的深度學(xué)習(xí)模型,這種虛擬環(huán)境的訓(xùn)練模式有一個好處,那就是不會耗費現(xiàn)實世界的時間,此外還不用擔(dān)心機器人在訓(xùn)練中摔壞或者傷害他人。
Dactyl 在虛擬世界中積累數(shù)萬年的訓(xùn)練經(jīng)驗,但在現(xiàn)實中只過了幾個月時間,頗有點山中方一日,世上已千年的感覺,這種訓(xùn)練方式大大縮短了 AI 的學(xué)習(xí)時間,背后則需要數(shù)千個超高性能的 CPU 和 GPU 同時運行。
通過這種訓(xùn)練而成的 Dactyl 還能自行應(yīng)對各種突發(fā)情況!