展會(huì)信息港展會(huì)大全

任澤平對(duì)談田豐:“人工智能+”的新機(jī)遇
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-04-18 08:54:24   瀏覽:3407次  

導(dǎo)讀:新一輪人工智能浪潮席卷而來,帶來前所未有的機(jī)遇與挑戰(zhàn)。 4月10日,任澤平博士對(duì)話商湯智能產(chǎn)業(yè)研究院院長(zhǎng)田豐,深入剖析了人工智能的奧秘與挑戰(zhàn)。 人工智能+和新質(zhì)生產(chǎn)力有什么影響關(guān)系? 人工智能+與互聯(lián)網(wǎng)+有哪些關(guān)鍵不同? 未來30年我們會(huì)迎來哪些拐點(diǎn)...

任澤平對(duì)談田豐:“人工智能+”的新機(jī)遇

新一輪人工智能浪潮席卷而來,帶來前所未有的機(jī)遇與挑戰(zhàn)。

4月10日,任澤平博士對(duì)話商湯智能產(chǎn)業(yè)研究院院長(zhǎng)田豐,深入剖析了人工智能的奧秘與挑戰(zhàn)。

“人工智能+”和“新質(zhì)生產(chǎn)力”有什么影響關(guān)系?

“人工智能+”與“互聯(lián)網(wǎng)+”有哪些關(guān)鍵不同?

未來30年我們會(huì)迎來哪些“拐點(diǎn)”和“變革時(shí)刻”?

對(duì)談文字稿見下方

大咖會(huì)客廳/ “人工智能+”的新機(jī)遇

任澤平對(duì)談田豐:“人工智能+”的新機(jī)遇

大模型+機(jī)器人

任澤平:今天,我們有幸邀請(qǐng)到商湯科技的田豐院長(zhǎng),與我們深入探討當(dāng)前熱門話題:人工智能+。首先,請(qǐng)您從大模型+機(jī)器人的角度,分享下您的看法。

田豐:從英偉達(dá)黃仁勛先生的未來戰(zhàn)略來看,如果我們對(duì)比OpenAI與英偉達(dá),可以發(fā)現(xiàn)背后涉及大模型的兩條發(fā)展路徑。第一條路徑是基于全球人類知識(shí)數(shù)據(jù)訓(xùn)練出的GPT基礎(chǔ)大模型,它對(duì)人類知識(shí)有著深刻的理解。第二條路徑是認(rèn)識(shí)到僅從互聯(lián)網(wǎng)獲取數(shù)據(jù)是不夠的,未來的發(fā)展需要從物理世界中獲取數(shù)據(jù),例如工廠、生產(chǎn)線或供應(yīng)鏈。黃仁勛先生正在布局一個(gè)宏大的戰(zhàn)略,不僅涉及底層的GPU芯片,還包括Omniverse這樣的工業(yè)平臺(tái)。

目前,寶馬、奔馳、西門子、三星等工業(yè)制造企業(yè)都已接入Omniverse Cloud。這是一個(gè)云平臺(tái),利用一套AI算法分析產(chǎn)業(yè)鏈中的各種數(shù)據(jù)。從工廠的規(guī)劃、設(shè)計(jì)到部署、調(diào)試,甚至培訓(xùn)和運(yùn)營(yíng),都可以在Omniverse Cloud上進(jìn)行。

以寶馬在亞洲建廠為例,可以由多個(gè)國(guó)家團(tuán)隊(duì)在云平臺(tái)上共同設(shè)計(jì),將生產(chǎn)線的虛擬設(shè)備放入數(shù)字工廠中運(yùn)行。建成后,類似有一個(gè)線上數(shù)字工廠與實(shí)體工廠同步運(yùn)作,簡(jiǎn)單講,就是打造一個(gè)從物理世界、工業(yè)領(lǐng)域匯聚數(shù)據(jù),進(jìn)行工業(yè)智能制造全流程管理的模型平臺(tái)。下一步的重點(diǎn)是如何從物理世界獲取更多與生產(chǎn)相關(guān)的數(shù)據(jù),并利用人類知識(shí)進(jìn)行各種生成式應(yīng)用。我將這稱為“新智生產(chǎn)力”。

有人稱去年為大模型的元年,今年則是機(jī)器人技術(shù)爆發(fā)的一年。今年,我們需要特別關(guān)注美國(guó)的3-4家公司。首先是英偉達(dá),在GTC大會(huì)上,60%的時(shí)間都在討論Omniverse工業(yè)領(lǐng)域的AI平臺(tái),目前已有許多機(jī)器人創(chuàng)業(yè)公司接入。其次是特斯拉,馬斯克不僅涉足大模型Grok和計(jì)算中心,還致力于機(jī)器人技術(shù)。第三家是谷歌,擁有Gemini大模型和遠(yuǎn)超OpenAI的算力中心。最后是OpenAI與微軟的合作,他們也投資了兩家機(jī)器人公司。這四家公司正全力將物理世界融入大模型中,或者可以說是將大模型嵌入到物理世界的機(jī)器人執(zhí)行體中。

任澤平對(duì)談田豐:“人工智能+”的新機(jī)遇

任澤平:傳統(tǒng)的機(jī)器人只能執(zhí)行單一功能,現(xiàn)在我們稱之為具身智能。那么,具備人工智能的機(jī)器人與以往的機(jī)械手臂有何不同?它們將帶來哪些變革?

田豐:過去制造機(jī)器人的首要任務(wù)是解決零部件問題。例如,國(guó)內(nèi)一些機(jī)器人創(chuàng)業(yè)公司致力于讓機(jī)器人關(guān)節(jié)的電機(jī)更小巧、更輕便。

第二步,如美國(guó)的機(jī)器人創(chuàng)業(yè)公司,廣泛采用仿真測(cè)試環(huán)境。例如,谷歌在加州灣區(qū)的實(shí)驗(yàn)室里,線下有十臺(tái)機(jī)器人進(jìn)行打掃衛(wèi)生等任務(wù)的訓(xùn)練,而線上則有超過一千個(gè)虛擬機(jī)器人在不停地進(jìn)行訓(xùn)練。線上訓(xùn)練僅消耗算力,大幅節(jié)約成本。訓(xùn)練到一定程度后,將虛擬的機(jī)器人模型移植到物理機(jī)器人上,這一過程可以隨時(shí)同步,顯著加快了機(jī)器人的訓(xùn)練進(jìn)程。這可以理解為在仿真環(huán)境中的快速進(jìn)化。

第三步,是將機(jī)器人投入到真實(shí)的生產(chǎn)環(huán)境中進(jìn)行測(cè)試。例如,特斯拉的擎天柱機(jī)器人在超級(jí)工廠中安裝汽車。谷歌則專注于開發(fā)通用人工智能機(jī)器人。以往的機(jī)器人在生產(chǎn)線上只能執(zhí)行幾個(gè)固定動(dòng)作,且需預(yù)先編程。現(xiàn)在的機(jī)器人則是通用型,通過攝像頭和傳感器感知不同的零部件。它們甚至具備大模型帶來的人機(jī)交互和常識(shí)能力,無論是生產(chǎn)線上的柔性生產(chǎn)還是日常生活中的各種問題,它們都能靈活應(yīng)對(duì),無需預(yù)先訓(xùn)練。

當(dāng)然,大模型本身需要經(jīng)過預(yù)訓(xùn)練。一旦將大模型與機(jī)器人結(jié)合,就可以根據(jù)人類的自然語言指令,讓機(jī)器人靈活執(zhí)行各種非標(biāo)準(zhǔn)任務(wù),這也帶來了“泛在感知”和“泛在智能”的概念。黃仁勛先生甚至認(rèn)為:在未來,所有移動(dòng)的物體都將是機(jī)器人。在我們有生之年,可能會(huì)看到AGI(通用人工智能)與機(jī)器人的結(jié)合。

在軟件層面上,我們認(rèn)為機(jī)器人中應(yīng)該集成的是大模型構(gòu)成的智能體。智能體與大模型的區(qū)別在于:大模型依靠的是自身能力,即基礎(chǔ)模型,具有廣泛的應(yīng)用能力,但存在邊界。而智能體承認(rèn)自身能力的局限性,能夠調(diào)用其他軟件和工具,類似于管理者,能夠協(xié)調(diào)軟硬件資源,完成復(fù)雜任務(wù)的分配。

任澤平:您剛才提到,將大模型嵌入機(jī)器人,使其更加智能化,能夠?qū)崿F(xiàn)更加人性化的生產(chǎn)。那么,未來面向企業(yè)和消費(fèi)者的應(yīng)用空間應(yīng)該會(huì)非常廣闊。

田豐:任博的見解非常獨(dú)到。我們可以用三個(gè)圓圈來表示這種應(yīng)用需求。左邊的圓圈代表物理世界,右邊的圓圈代表人類的精神世界,中間的圓圈則是大模型存在的數(shù)字世界。實(shí)際上,我們可以看到兩個(gè)方向的應(yīng)用需求:一是工業(yè)領(lǐng)域,它越來越逼真地重現(xiàn)物理世界,更多地表現(xiàn)為功能性工具,如完成生產(chǎn)制造的機(jī)器人;另一個(gè)方向是大模型越來越能夠與人類共情,例如目前非常流行的虛擬寵物、虛擬男女朋友等。

任澤平對(duì)談田豐:“人工智能+”的新機(jī)遇

任澤平:這些虛擬伴侶既能聊天,又能不斷學(xué)習(xí)用戶的愛好,如果真的成為人類的虛擬伴侶,那么生育率是否會(huì)大幅下降?

田豐:我們目前觀察到,年輕人將這些技術(shù)作為一種游戲來玩。外向型的人更愿意在現(xiàn)實(shí)中進(jìn)行社交,內(nèi)向型的人則可能設(shè)計(jì)自己的分身。

例如,一位男性大學(xué)生正在上課,沒有時(shí)間回復(fù)女朋友的信息,他可以讓數(shù)字分身,即語言大模型掛機(jī)回復(fù),以促進(jìn)兩性關(guān)系的和諧。如果對(duì)“分身”的性格不滿意,可以根據(jù)MBTI進(jìn)行優(yōu)化,比如從偏知性改為偏感性。白天與真實(shí)的男朋友相處,晚上與虛擬男朋友聊天,我認(rèn)為這可能成為未來的常態(tài)。當(dāng)前的大模型正在不斷為人類提供情感價(jià)值。真正的大模型,未來不會(huì)以取代真人為目標(biāo),而是作為情感的補(bǔ)充。

電影《非誠(chéng)勿擾3》中有與機(jī)器人和真人談戀愛的情節(jié),這代表了人類多了一種選擇。如果人們對(duì)真人寄予希望和感情,那么機(jī)器人就只是游戲工具。如果在兩性關(guān)系中受過傷害,人工智能的語言模型可以成為心理咨詢師,幫助人類走出失戀的陰影,重新面對(duì)真實(shí)世界。機(jī)器人制造商、大模型研發(fā)企業(yè)和運(yùn)行平臺(tái)都肩負(fù)著社會(huì)責(zé)任。任何科技的出現(xiàn),都應(yīng)符合人類倫理,不論手機(jī)還是AI,應(yīng)縮短人與人之間的距離,也不能影響人類的傳宗接代。無論是機(jī)器人還是大模型,都必須清楚自己的本職工作和使命。

《流浪地球2》中有一句臺(tái)詞從科幻角度闡述了數(shù)字生命的意義:"數(shù)字生命的意義在于什么?我個(gè)人覺得在于輔助人使得人類文明得以延續(xù)。”在未來的星際大航海時(shí)代,人類可能會(huì)先派遣有情感的機(jī)器人去開發(fā)其他資源行星,在改造到一定程度后,再迎來人類的宇航員。按照劉慈欣的觀點(diǎn),人工智能、機(jī)器人、具身智能是跨星際文明的一張船票。如果沒有人工智能和機(jī)器人,我們可能仍處于地球母親的子宮中,無法走出太陽系。因此,數(shù)字生命對(duì)人類文明的進(jìn)化具有極其重要的意義。

大模型時(shí)代,我們?nèi)绾伟l(fā)力?

任澤平:人工智能有幾個(gè)核心要素:算力、算法、數(shù)據(jù)、模型以及各種應(yīng)用。那么,中國(guó)在算法和數(shù)據(jù)方面是否具有優(yōu)勢(shì)?我們?cè)诎l(fā)展大模型時(shí)應(yīng)該在哪些維度上發(fā)力?

田豐:任博的問題直指人工智能競(jìng)爭(zhēng)力的本質(zhì)。我們先討論優(yōu)勢(shì),再談挑戰(zhàn)。優(yōu)勢(shì)方面,有傳言稱OpenAI啟動(dòng)了一個(gè)包含一百萬塊GPU的集群來訓(xùn)練GPT,我相信GPT5和GPT6都在其訓(xùn)練過程中。GPT-4有17萬億的參數(shù)量。而現(xiàn)在,當(dāng)我們訓(xùn)練具有百萬億參數(shù)量的模型時(shí),能源消耗巨大,對(duì)電網(wǎng)造成了巨大沖擊。人工智能的終極問題在于能源。中國(guó)在全球新能源中位居前列,新能源成本低廉,如生產(chǎn)的光伏組件、中西部廣闊的土地成本。我們完全有能力在青海、甘肅、新疆等地建立集中式的光伏廠或風(fēng)電廠。如果未來的超大規(guī)模AI智算中心緊鄰核電站或光伏集群建設(shè),中國(guó)將具有比較優(yōu)勢(shì)。許多歐洲和東南亞國(guó)家并不具備如此廣闊的土地優(yōu)勢(shì)。

第二是數(shù)據(jù)方面的優(yōu)勢(shì)。無論是OpenAI還是中國(guó)的一些領(lǐng)先人工智能企業(yè),都在進(jìn)行合成數(shù)據(jù)的生成。通過虛擬的數(shù)字孿生環(huán)境,使機(jī)器人、自動(dòng)駕駛汽車、無人機(jī)產(chǎn)生更多的合成數(shù)據(jù)。這種合成數(shù)據(jù)是大模型的未來。有預(yù)測(cè)顯示,到2025年合成數(shù)據(jù)將超過真實(shí)世界產(chǎn)生的數(shù)據(jù),到2030年合成數(shù)據(jù)將完全替代真實(shí)世界的數(shù)據(jù)。因此,合成數(shù)據(jù)是未來的戰(zhàn)略要地。從傳統(tǒng)數(shù)據(jù)優(yōu)勢(shì)來看,中國(guó)14億人口產(chǎn)生的數(shù)據(jù)量自然超過美國(guó)3億人口,中國(guó)130多億的智能終端產(chǎn)生的物理數(shù)據(jù)也超過美國(guó)30多億的智能終端。但在合成數(shù)據(jù)方面,我們必須加大科研投入。

第三是算力。OpenAI和微軟計(jì)劃投資1000億美元,打造一個(gè)相當(dāng)于現(xiàn)有算力100倍的超級(jí)計(jì)算機(jī)星際之門。OpenAI認(rèn)為,其算力目前明顯落后于谷歌。谷歌在英偉達(dá)發(fā)布BG200時(shí),大量采購(gòu)了最新的芯片,而且目前本身就是全球云計(jì)算領(lǐng)域的領(lǐng)頭羊。谷歌擁有自己的TPU,同時(shí)還在采購(gòu)最先進(jìn)的芯片,有可能打造出地球上最大的AI計(jì)算中心。微軟實(shí)際上也提出了條件,如果OpenAI不能繼續(xù)證明GPT5取得重大突破,那么1000億美元的投資可能不會(huì)那么快到位,納德拉會(huì)根據(jù)AI近期的進(jìn)展來決定是否分期投資。話說回來,所有人工智能企業(yè)都面臨著算力和數(shù)據(jù)的短缺。Transformer模型決定了尺度定律,投入越多的算力、越多的數(shù)據(jù),模型的效果就越好,參數(shù)量也越大。人類的大腦有1000億的神經(jīng)元,但功耗很校那為什么AI還沒有達(dá)到通用人工智能?人類其實(shí)擁有非常節(jié)能、環(huán)保而且效率很高的思考模式和神經(jīng)網(wǎng)絡(luò);氐降谝恍栽,就有可能出現(xiàn)下一代架構(gòu),甚至顛覆式創(chuàng)新現(xiàn)在的Transformer。

現(xiàn)在很多大模型都在卷算力,一秒鐘回復(fù)答案。但OpenAI等公司卻在開發(fā)圍棋里的“長(zhǎng)考”。思考時(shí)間很長(zhǎng),但給出的是一個(gè)非常嚴(yán)謹(jǐn)?shù)拇鸢,通過反復(fù)推敲,多個(gè)數(shù)據(jù)源的交叉驗(yàn)證。真正的科學(xué)研究是需要這種“長(zhǎng)考”的。我相信在未來很快會(huì)出現(xiàn)推理更精準(zhǔn)可靠,貼近人類科研思維的模型架構(gòu)。中國(guó)受到的算力限制更緊迫,所以更有動(dòng)力去探索新的架構(gòu)模式。美國(guó)依靠“大力出奇跡”的慣性時(shí)間會(huì)更長(zhǎng)一些。

歷史總是辯證的。當(dāng)年錢學(xué)森先生回到中國(guó)研發(fā)導(dǎo)彈、兩彈合一、衛(wèi)星等被超級(jí)大國(guó)封鎖的前沿技術(shù)。當(dāng)時(shí)美國(guó)每個(gè)零件做的精度都比我們小幾個(gè)數(shù)量級(jí)。錢學(xué)森先生就研發(fā)出了工程控制學(xué),每一個(gè)零件的精度都比較差,但能通過一套有效的體系達(dá)到整體最優(yōu)。科研競(jìng)賽就像打冰球,想要搶球就得看到球運(yùn)動(dòng)的方向,下一個(gè)位置在哪。所以中國(guó)現(xiàn)在更多的是要去思考下一代的Transformer架構(gòu)。下一代能夠顛覆GPU的架構(gòu)是什么?下一代的算力集群應(yīng)該怎么提升整體的效率?

無人駕駛

任澤平:從算力到數(shù)據(jù),中國(guó)目前還很難達(dá)到美國(guó)的水平。但是在全球來看,穩(wěn)居第二問題不大。我們未來可能會(huì)利用豐富的綠電資源,而不是像美國(guó)那樣純粹堆算力。當(dāng)人工智能進(jìn)入大規(guī)模商用以后,豐富的應(yīng)用場(chǎng)景可能就爆發(fā)出來了。中國(guó)大規(guī)模的生產(chǎn)能力和降成本的能力是非常強(qiáng)的。

我們?cè)诠夥、鋰電、新能源汽車領(lǐng)域勢(shì)頭迅猛。現(xiàn)在特斯拉都不敢公布Model 2了,因?yàn)樗l(fā)現(xiàn)中國(guó)已經(jīng)推出十萬人民幣以下的新能源汽車了。馬斯克宣布在8月8號(hào)將推出Robotaxi,無人駕駛的出租車,換一個(gè)玩法和賽道。您對(duì)此怎么看?

任澤平對(duì)談田豐:“人工智能+”的新機(jī)遇

田豐:馬斯克還有其他的自動(dòng)駕駛公司說2017年就能實(shí)現(xiàn)L4級(jí)別,但始終卡在L3級(jí)別。我認(rèn)為這有技術(shù)的原因,也有非技術(shù)的原因。自動(dòng)駕駛涉及到一個(gè)責(zé)任的判定,L3級(jí)別及以上出了問題,車要負(fù)全責(zé)。L3以下就是人做決策,不能甩鍋給算法。但是世界科技的進(jìn)程是由少數(shù)人來決定的。如果馬斯克真的在8月8號(hào)大量投入無人駕駛汽車,那我相信會(huì)反向驅(qū)動(dòng)中國(guó)自動(dòng)駕駛向L3.5、L4級(jí)別跟進(jìn)。

任澤平:我今天看到一個(gè)新聞,廣汽埃安和滴滴簽訂戰(zhàn)略協(xié)議,快速推進(jìn)無人駕駛的出租車或者共享車。

田豐:商湯絕影與廣汽埃安合作的L2++自動(dòng)駕駛解決方案,從廣州到深圳100公里路程里完成一鏡到底視頻的拍攝,全程零接管。我們開啟輔助駕駛的車輛可以自動(dòng)去變道超車、上下匝道,去應(yīng)對(duì)各種復(fù)雜的場(chǎng)景。所以現(xiàn)在中國(guó)的制度是非常領(lǐng)先的。中國(guó)的自動(dòng)駕駛有三位一體的實(shí)驗(yàn)制度。一個(gè)是汽車的生產(chǎn)商,包括自動(dòng)駕駛的算法商、提供商。然后是城市的交通運(yùn)營(yíng)商,比如滴滴。然后是監(jiān)管者,當(dāng)?shù)氐恼H灰惑w負(fù)責(zé)自動(dòng)駕駛在各地的試點(diǎn)和推廣創(chuàng)新。

還有一個(gè)更有價(jià)值的地方就是數(shù)據(jù)。特斯拉的車上只有攝像頭,但是其他的自動(dòng)駕駛廠商都有激光雷達(dá),能夠捕捉大量的現(xiàn)實(shí)環(huán)境中的數(shù)據(jù)去訓(xùn)練大模型。把攝像頭放到自動(dòng)駕駛汽車上自動(dòng)運(yùn)行,它就像一個(gè)城管,可以去監(jiān)控環(huán)境,本身就是一個(gè)數(shù)據(jù)源。

英偉達(dá)Omniverse的工業(yè)軟件平臺(tái)已經(jīng)接入了蘋果的Vision Pro,F(xiàn)在大家可能覺得Vision Pro不是剛需,但是很有可能未來所有的AR眼鏡都是一個(gè)數(shù)據(jù)采集員。我覺得要先解決物理世界數(shù)據(jù)收集難的問題,F(xiàn)在工業(yè)的軟件百分之九十是歐洲的,和中國(guó)的大模型是很難對(duì)接上的。那么我們完全可以由國(guó)家去牽頭明星制造型企業(yè),組成一個(gè)國(guó)家級(jí)的數(shù)據(jù)制造平臺(tái)。這些制造的數(shù)據(jù)都可以以付費(fèi)或者開源的形式用于訓(xùn)練真正的工業(yè)大模型,帶來長(zhǎng)足的發(fā)展。

現(xiàn)在歐洲已經(jīng)有像西門子APP這樣的工業(yè)軟件。但是美國(guó)英偉達(dá)率先宣稱做所有制造企業(yè)、制造廠商的伙伴,把數(shù)據(jù)都放在它這,它給你提供服務(wù)。包年的服務(wù)費(fèi)用是一百萬美金,對(duì)于很多公司來說并不貴。但是美國(guó)的智能制造企業(yè)就會(huì)依靠這樣的數(shù)據(jù),訓(xùn)練它本土的機(jī)器人公司。這是一個(gè)不能忽視的問題。所以中國(guó)在制造數(shù)據(jù)領(lǐng)域一定要形成完善機(jī)制。

任澤平:所以說,數(shù)據(jù)要開放共享,共同用于訓(xùn)練我們的大模型是吧?

田豐:對(duì),尤其是工業(yè)數(shù)據(jù)。如果不分享,那中國(guó)后面就會(huì)面臨非常大的問題。如果人家用歐洲甚至全球的工業(yè)數(shù)據(jù)訓(xùn)練出柔性生產(chǎn)機(jī)器人,中國(guó)或者是亞洲的勞動(dòng)力成本是完全打不過的。如果不做這一步,那就是災(zāi)難性的、釜底抽薪的問題。

剛才任博說到一個(gè)很重要的人才問題。中國(guó)不能光是依靠應(yīng)用層的創(chuàng)新。舉一個(gè)例子,過去的八十年到一百年,美國(guó)為全球貢獻(xiàn)了30-50%的科技貢獻(xiàn)。得益于1922年像狹義相對(duì)論和量子力學(xué)這樣基礎(chǔ)理論的研發(fā),二十多年后1950年代就出現(xiàn)了第一臺(tái)計(jì)算機(jī)、激光、核電等很多新技術(shù)應(yīng)用。基礎(chǔ)理論的突破,只要二、三十年就可以帶來產(chǎn)業(yè)的、科技的領(lǐng)先。中國(guó)在基礎(chǔ)科研領(lǐng)域還是要不遺余力去投資、去實(shí)踐。

有兩點(diǎn)要注意,一個(gè)是R&D這些基礎(chǔ)科研投資的比例。現(xiàn)在我們是2.5%左右,美國(guó)常年保持在3%左右。想彎道超車,這樣的力量是遠(yuǎn)遠(yuǎn)不夠的。另一個(gè)在于,中國(guó)其實(shí)出了很多華人的科學(xué)家,如何給他們一個(gè)非常開放、待遇優(yōu)厚的基礎(chǔ)科研環(huán)境非常關(guān)鍵。

之前有兩個(gè)問題,一個(gè)是李約瑟之問,一個(gè)是錢學(xué)森之問。李約瑟之問是,為什么第一二次工業(yè)革命沒有發(fā)生在中國(guó)?錢學(xué)森之問是,為什么中國(guó)的大學(xué)里面涌現(xiàn)不出來諾貝爾學(xué)獎(jiǎng)得主或者大師級(jí)的人物?說明中國(guó)依然要加大基礎(chǔ)科研的投入,人才的培養(yǎng)。OpenAI在2017年的時(shí)候是一個(gè)邊緣化的研發(fā)機(jī)構(gòu),大家會(huì)覺得它的研發(fā)路徑太瘋狂超前,不一定能實(shí)現(xiàn)。實(shí)際上,任何一個(gè)未來可能產(chǎn)生爆點(diǎn)的方向,現(xiàn)在很可能處于邊緣位置。從這個(gè)角度來看,大家一定要長(zhǎng)線思考投入,由戰(zhàn)略科學(xué)家做出正確的方向性決策,堅(jiān)持長(zhǎng)期主義。

任澤平:我們?cè)趹?yīng)用的研發(fā)領(lǐng)域,其實(shí)已經(jīng)很強(qiáng)大了,但中國(guó)的基礎(chǔ)性研究還是有差距的。我們還是要解放思想,只有多元化的思想市場(chǎng)才能誕生偉大的創(chuàng)新。解放思想、實(shí)事求是檢驗(yàn)真理的唯一標(biāo)準(zhǔn)。十幾年前,華爾街都覺得馬斯克是個(gè)騙子,現(xiàn)在來看確實(shí)封神了。如今像人工智能、無人駕駛等領(lǐng)域也可能存在這樣的爭(zhēng)議。我覺得社會(huì)一定要變得開放包容,才能夠誕生偉大的創(chuàng)新。

田豐:對(duì)失敗的包容非常重要,不創(chuàng)新試錯(cuò)是達(dá)不到終點(diǎn)的。同時(shí),研發(fā)方向性、戰(zhàn)略性決策也至關(guān)重要,能夠加大最終的成功概率。

多模態(tài)大模型

任澤平:接下來請(qǐng)您給我們講講多模態(tài)大模型吧。

田豐:先簡(jiǎn)單給大家做一個(gè)科普,人工智能其實(shí)就相當(dāng)于一個(gè)算數(shù)機(jī)器。文本輸入到機(jī)器里面,輸出的也是文本,這叫單模態(tài)的語言大模型。多模態(tài)就是不管輸入的是文本、語音還是視頻,它能夠綜合去學(xué)習(xí)理解,然后生成多模態(tài)的產(chǎn)物。在這個(gè)基礎(chǔ)上,還有超模態(tài)。比如醫(yī)療領(lǐng)域的儀器影像,工業(yè)領(lǐng)域的時(shí)序信號(hào),或者氣象遙感衛(wèi)星的數(shù)據(jù)等。人類從降生起就會(huì)通過五感認(rèn)知世界,而不只是通過文本去學(xué)習(xí)。

人工智能的上半場(chǎng)是知識(shí)工程,下半場(chǎng)叫工業(yè)革命。Sora目前看起來更像是人類精神層面的一個(gè)模擬器。它沒有在真實(shí)世界中去體驗(yàn)過,所以對(duì)于有些現(xiàn)象不能理解。它有兩個(gè)價(jià)值。第一是可以生成很多符合人類想象力的超現(xiàn)實(shí)作品;第二是對(duì)視頻的自動(dòng)標(biāo)注,生成的提示詞、描述詞越準(zhǔn),標(biāo)注越準(zhǔn),訓(xùn)練的效果就越好。

其實(shí),現(xiàn)在對(duì)世界模擬最逼真的不是大模型,而是游戲引擎。PS5上面的GT7賽車游戲,當(dāng)賽車拐彎道的時(shí)候,旁邊的草都會(huì)微微抖動(dòng),且不同時(shí)間的場(chǎng)景光照都不一樣。游戲引擎為現(xiàn)在的多模態(tài)大模型提供了很好的訓(xùn)練視頻。據(jù)說Sora就取自了像UE這樣的一些游戲引擎。它甚至買了“我的世界”的開源版。所以它現(xiàn)在生成“我的世界”的游戲視頻是沒有任何瑕疵的,大家無法去分辨是真實(shí)的玩家還是Sora。中國(guó)其實(shí)有很多的工業(yè)數(shù)據(jù)積累,完全可以去做各種仿真的平臺(tái)匯集數(shù)據(jù),在逼真的數(shù)字孿生環(huán)境里面去訓(xùn)練大模型機(jī)器人。

我們認(rèn)為現(xiàn)在最有可能做出多模態(tài)大模型的是像特斯拉、谷歌和英偉達(dá)這種公司。OpenAI現(xiàn)在也著急,所以它投了一些機(jī)器人公司。Sora只是冰山一角,并不是一個(gè)成熟如ChatGPT的產(chǎn)品,所以未來它背后可能隱藏著一個(gè)更大的技術(shù)突破。人類經(jīng)常說地球上只有我們能夠?qū)W會(huì)使用工具,F(xiàn)在智能體AI也會(huì)去調(diào)用其他的工具。美國(guó)戰(zhàn)略里就提到,要去研究新一代的人機(jī)協(xié)同模式是什么,這個(gè)對(duì)于中國(guó)同樣重要。

任澤平:往多模態(tài)大模型里喂大量數(shù)據(jù),它就會(huì)理解很多物理的規(guī)律,從而進(jìn)行模擬現(xiàn)實(shí)的世界。數(shù)據(jù)越多,算力算法越好,模擬會(huì)越來越逼真。未來更厲害的是,它可能會(huì)推理做科研,對(duì)吧?

田豐:對(duì),人工智能其實(shí)現(xiàn)在已經(jīng)能做一些常識(shí)性的推理了。人類是做快速反應(yīng)的常識(shí)性推理。它現(xiàn)在要解決的是演繹推理,就是亞里士多德的三段論。一個(gè)大前提,一個(gè)小前提,然后得出一個(gè)結(jié)論。比如說,所有的哺乳動(dòng)物都是要睡覺的,貓是哺乳動(dòng)物。這兩個(gè)前提定了以后,結(jié)論就是貓也會(huì)睡覺,F(xiàn)在人工智能大模型正在不斷實(shí)現(xiàn)這種一環(huán)套一環(huán)的推理模式。一旦能突破,就會(huì)實(shí)現(xiàn)錢學(xué)森先生說的,中國(guó)不管是四億還是五億的勞動(dòng)人口,一多半都會(huì)去搞科研了。傳統(tǒng)的執(zhí)行類的工作由機(jī)器人來替代。

人工智能帶來的變革時(shí)刻

任澤平:我看前一段時(shí)間大家還在炒作用大模型、人工智能研發(fā)藥,未來的應(yīng)用場(chǎng)景真的是非常豐富。您再給我們講講,人工智能在哪些領(lǐng)域還會(huì)帶來這種變革時(shí)刻?

田豐:大家最關(guān)心的。第一個(gè)肯定是機(jī)器人。現(xiàn)在請(qǐng)真人阿姨,未來每個(gè)家庭里都標(biāo)配服務(wù)型的機(jī)器人。

任澤平對(duì)談田豐:“人工智能+”的新機(jī)遇

第二個(gè),我預(yù)測(cè)算力芯片會(huì)有一個(gè)拐點(diǎn)。它的價(jià)格會(huì)持續(xù)下降。當(dāng)年IBM大型機(jī)小型機(jī)非常貴,然后直接降到了云計(jì)算的價(jià)格。現(xiàn)在大學(xué)生如果想創(chuàng)業(yè),三塊八就能租一個(gè)月的虛擬機(jī)。今年的A100GPU服務(wù)器租一個(gè)小時(shí)的費(fèi)用是兩塊錢。未來算力的價(jià)格下來以后,各種模型類的應(yīng)用會(huì)馬上來到我們面前。突破成本的拐點(diǎn)之后,社會(huì)的需求就特別大了。所以現(xiàn)在一方面,國(guó)家會(huì)不斷去加大算力基建的投入,另外一方面力求在芯片成本上創(chuàng)新和突破。

第三點(diǎn),剛才提到了AGI,通用人工智能,我并不認(rèn)為這是一個(gè)終極目標(biāo)。它實(shí)際上是一個(gè)里程碑。很可能當(dāng)人類發(fā)現(xiàn)AGI誕生的時(shí)候,其實(shí)它已經(jīng)變成了超級(jí)智能。

任澤平:有點(diǎn)像科幻片,人被虛擬人或者是一套系統(tǒng)統(tǒng)治了。

田豐:人工智能更像是一張白紙,其發(fā)展和應(yīng)用取決于我們?nèi)绾嗡茉旌鸵?guī)范它。各國(guó)正在逐步建立相應(yīng)的治理體系,以確保人工智能的發(fā)展符合人類社會(huì)的共同利益。中國(guó)提出的智能向善的理念,強(qiáng)調(diào)了人工智能應(yīng)用于促進(jìn)人類福祉的重要性。通過積極構(gòu)建倫理規(guī)范的AI智能體,我們可以確保人工智能始終在可控的范圍內(nèi)發(fā)展。

剛才事實(shí)上還說到類人智能。簡(jiǎn)單講,類人智能指的人工智能系統(tǒng)在特定領(lǐng)域內(nèi)模仿人類的認(rèn)知能力,如語音識(shí)別或圖像處理,但通常不具備廣泛的認(rèn)知范圍;通用人工智能則是指人工智能系統(tǒng)具備與人類相似的廣泛認(rèn)知能力,能夠在多種不同的環(huán)境和情境中理解、學(xué)習(xí)和應(yīng)用知識(shí),解決各種問題。我們預(yù)計(jì),通用人工智能將是一個(gè)過渡階段,很快就會(huì)發(fā)展到超級(jí)智能的階段。正如黃仁勛和山姆奧特曼所預(yù)測(cè)的,這一轉(zhuǎn)變可能在未來五年內(nèi)實(shí)現(xiàn)。盡管如此,目前的能源和算力限制可能阻礙了這一進(jìn)程的快速發(fā)展。因此,在短期內(nèi)要密切關(guān)注美國(guó)提出的尺度定律,大力出奇跡的科研規(guī)律是根據(jù)現(xiàn)象總結(jié)出來的唯象理論,仍有待嚴(yán)謹(jǐn)?shù)幕A(chǔ)理論推理。

長(zhǎng)期來看,我們需要探索不同的發(fā)展路徑和基礎(chǔ)理論。當(dāng)通用人工智能到來時(shí),像黃仁勛所說,所有能移動(dòng)的物體都能夠理解喜怒哀樂,提供恰到好處的服務(wù)。第一、二、三產(chǎn)業(yè)將真正迎來巨大發(fā)展。合成數(shù)據(jù)將變得越來越逼真,為數(shù)據(jù)產(chǎn)業(yè)帶來巨大的機(jī)遇。

人類歷史上每一次重大的科技變革和生產(chǎn)力的躍遷,都源于幾個(gè)關(guān)鍵因素:能源的突破、計(jì)算技術(shù)的進(jìn)步、交通工具的革新以及軟件的發(fā)展。特別是軟件領(lǐng)域,人工智能輔助編程和自動(dòng)化編程工具的出現(xiàn),將極大地釋放人類的創(chuàng)新潛力。

第一個(gè),能源產(chǎn)生巨大突破。從當(dāng)年的水利能源到后來的發(fā)電機(jī),現(xiàn)在的核電再到后面的新能源和可控核聚變,能源是非常大的一個(gè)躍遷。

第二個(gè),計(jì)算。從原來的算籌算盤到手搖計(jì)算器,從機(jī)械計(jì)算器到計(jì)算機(jī),再到未來的量子計(jì)算,是巨大的躍遷。

第三個(gè),交通。當(dāng)自動(dòng)駕駛降低交通的成本后,每一袋米、每一瓶醋的成本都能夠被攤保

第四個(gè),軟件。以前是十年培訓(xùn)出一個(gè)很資深的程序員,80億人口中只有大概5%的人會(huì)編程,F(xiàn)在人工智能正在進(jìn)入AI輔助編程,甚至未來會(huì)有AI自動(dòng)化編程工具,到那時(shí)候80億人口都能編程。能源專家可以用AI編出核電站或者電網(wǎng)的調(diào)度程序,天文學(xué)家用自然語言就可以寫一個(gè)尋找超新星爆發(fā)的程序,鋰電池的專家可以讓人工智能編出提升單元密度的新電池結(jié)構(gòu),人類的創(chuàng)新潛力被極大釋放出來,F(xiàn)在大家用大語音模型生成數(shù)據(jù)庫(kù)SQL語句,DBA數(shù)據(jù)庫(kù)管理員就減輕很多工作量。大家可以通過語言把SQL語句自動(dòng)地寫出來。

下一代,其實(shí)可能就在三五年內(nèi),會(huì)從基礎(chǔ)的編程衍生到復(fù)雜程序的編程。這個(gè)時(shí)候代表著全民生產(chǎn)力的一個(gè)巨大提升。硬件負(fù)責(zé)執(zhí)行,軟件負(fù)責(zé)策略。而策略不斷優(yōu)化,最好就是由AI產(chǎn)生更優(yōu)的AI模型。由算法來去給下一個(gè)算法做調(diào)優(yōu),機(jī)器人去生產(chǎn)機(jī)器人。這個(gè)本質(zhì)上就是萬物摩爾定律。這個(gè)時(shí)候人類只需要想清楚人機(jī)協(xié)同的分工邊界在哪兒。如何去打造一個(gè)可信可控的AI。基本上這四個(gè)維度就可以去讓人類的生產(chǎn)力躍升到太陽系的太空時(shí)代了。

人工智能大爆發(fā),如何培養(yǎng)孩子?

任澤平:有觀點(diǎn)認(rèn)為,人工智能能干很多工作,那么我們應(yīng)該如何培養(yǎng)孩子,是否還需要讓他們學(xué)習(xí)編程?

田豐:回到第一性原理,或者回到非常自然的辯證唯物主義。

第一,我建議孩子們的第一個(gè)學(xué)位應(yīng)該是數(shù)學(xué)和物理,這兩個(gè)基礎(chǔ)學(xué)科是其他科學(xué)創(chuàng)新的基石。第二個(gè)學(xué)位可以選擇人工智能或他們感興趣的其他領(lǐng)域,以便更好地應(yīng)用于產(chǎn)業(yè)實(shí)踐。

第二,培養(yǎng)孩子提出問題的能力至關(guān)重要,因?yàn)閯?chuàng)新往往源于對(duì)權(quán)威的批判性思考。最后,我們還需要培養(yǎng)孩子的專業(yè)素養(yǎng),以確保他們能夠有效地驗(yàn)證和調(diào)優(yōu)人工智能的結(jié)果。

任澤平:在人工智能極其發(fā)達(dá)并大規(guī)模商用的未來,世界將會(huì)是什么樣子?

田豐:我們可能會(huì)發(fā)現(xiàn),公司中的智能體將超過真實(shí)的員工。機(jī)器人將具備高度的情商,能夠理解和滿足人類的情感需求。

同時(shí),管理人工智能的能力將成為每個(gè)人的重要技能,這將提升我們的指揮和管理層級(jí)。此外,快速而準(zhǔn)確的決策能力將變得至關(guān)重要。例如,錢學(xué)森先生在1989年就提出了直接發(fā)展電動(dòng)車的構(gòu)想。未來,人類將面臨選擇:是沉浸在信息繭房中,還是去探索地球或外太空的世界。

人工智能將為我們提供更多的自由度,但并非所有人都會(huì)選擇沉浸在虛擬世界中,那些渴望創(chuàng)新的人將會(huì)奔向更廣闊的宇宙。

任澤平對(duì)談田豐:“人工智能+”的新機(jī)遇

總結(jié)

任澤平:田院長(zhǎng),您今天的講解非常精彩,主要涵蓋了六個(gè)重要方面:

第一,大模型和機(jī)器人將帶來重要變革,更加智能化、人性化的生產(chǎn)可能會(huì)實(shí)現(xiàn);

第二,中國(guó)雖然在算力方面暫時(shí)落后,但是在數(shù)據(jù)等領(lǐng)域位居一線梯隊(duì);

第三,特斯拉將公布它的無人駕駛情況,中國(guó)的很多汽車廠商也會(huì)快速跟進(jìn),這將加速推動(dòng)無人駕駛時(shí)代的到來;

第四,通用人工智能(AGI)、無人駕駛和教育等領(lǐng)域?qū)⒊霈F(xiàn)激動(dòng)人心的應(yīng)用場(chǎng)景;

第五,人工智能的發(fā)展需要得到有效監(jiān)管,確?萍枷蛏疲

第六,中國(guó)需要在基礎(chǔ)科研領(lǐng)域加大投入,鼓勵(lì)創(chuàng)新思維。

田豐:確實(shí),人腦和人工智能都在不斷進(jìn)化,它們各有所長(zhǎng)。人類一定要終身學(xué)習(xí),AI進(jìn)化得再快,人腦也有獨(dú)特的優(yōu)勢(shì)。我們應(yīng)該鼓勵(lì)孩子們閱讀歷史文化類書籍和科學(xué)家傳記,以培養(yǎng)他們的科學(xué)素養(yǎng)和人文關(guān)懷。對(duì)于成年人來說,閱讀哲學(xué)書籍可以讓我們汲取智慧,經(jīng)濟(jì)學(xué)書籍可以幫助我們理解經(jīng)濟(jì)周期,科技?xì)v史書籍可以讓我們了解技術(shù)的局限性和潛力。最終,我們需要理解人性,并承擔(dān)起研究人性和世界的責(zé)任。

任澤平:非常感謝田院長(zhǎng)的精彩分享。

往期大咖會(huì)客廳精彩分享

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港