導讀:9月5日,香港科技大學校董會主席、美國國家工程院外籍院士沈向洋在2024 Inclusion外灘大會上分享了他對大模型產(chǎn)業(yè)落地的八個思考。他認為,AI Agent時代的到來,不會是一個神奇而強大的模型突然代替了所有工作流,它涉及技術(shù)、工程與市場的不斷磨合,最終以...
9月5日,香港科技大學校董會主席、美國國家工程院外籍院士沈向洋在2024 Inclusion·外灘大會上分享了他對大模型產(chǎn)業(yè)落地的八個思考。他認為,AI Agent時代的到來,不會是一個神奇而強大的模型突然代替了所有工作流,它涉及技術(shù)、工程與市場的不斷磨合,最終以超預期的服務呈現(xiàn)給人類。
“今天做大模型,做深度學習,首先最重要的事情是要有算力。”沈向陽表示。他指出,從2010年開始,大模型需要的算力以6、7倍的速度增長。這幾年穩(wěn)定下來,大概每年有4倍的增長。模型越來越大,參數(shù)量越來越大,算力的需求也隨著參數(shù)的增長,呈現(xiàn)出平方向的增長。在他看來,整個計算機芯片行業(yè)的發(fā)展已經(jīng)從原來的“摩爾定律”變成了“黃氏定律”。以前摩爾定律認為,算力每隔18個月增長一倍。如今預測,GPU將推動AI算力實現(xiàn)逐年翻倍。“講卡傷感情,沒卡沒感情。以前有一句話叫貧窮限制想象力,現(xiàn)在貧窮可能扭曲想象力,因為如果沒有卡,能想象要做的項目可能就不太一樣了。”沈向陽感慨道.思考二:關(guān)于數(shù)據(jù)的數(shù)據(jù)公開資料顯示,GPT3的訓練數(shù)據(jù)達到了2個T的token(吞吐量),GPT4則達到了12個T左右。據(jù)沈向陽預判,GPT5的訓練數(shù)據(jù)可能會達到200個T。目前互聯(lián)網(wǎng)上的數(shù)據(jù)遠遠不能滿足未來模型訓練的需求,還需要思考用什么辦法去挖掘更多的數(shù)據(jù)。在人工智能領(lǐng)域,數(shù)據(jù)被視為模型的“燃料”,模型需要從這些數(shù)據(jù)中學習和提取有用信息。因此,數(shù)據(jù)的數(shù)量、質(zhì)量和多樣性都會直接影響到模型的準確性和性能。沈向陽表示,之前作為互聯(lián)網(wǎng)最核心的積累,數(shù)據(jù)大多被谷歌用來做搜索引擎,以后這些數(shù)據(jù)都會被拿來訓練大模型。“互聯(lián)網(wǎng)40年積累的數(shù)據(jù),好像就是為了這樣一個AI時刻”。下一步到底要干什么?沈向陽認為,大模型產(chǎn)業(yè)未來的發(fā)展路徑已經(jīng)非常明確,將會從之前的大語言模型,到多模態(tài)模型,未來邁向世界模型。從技術(shù)上講,肯定要走理解和生成統(tǒng)一起來的道路。“未來一定會往具身智能方向上走,往機器人上面走,其中一個特殊形態(tài)就是自動駕駛。”沈向陽說道。實際上,關(guān)于世界模型業(yè)內(nèi)并沒有形成一個標準的定義。OpenAI推出的Sora模型曾引發(fā)業(yè)內(nèi)對“世界模型”的探討。OpenAI將其視為能夠理解和模擬現(xiàn)實世界的模型的基礎,相信其能力是實現(xiàn)AGI(通用人工智能)的重要里程碑。然而,沈向陽認為,“Sora模型雖然做的非常好了,但還不是那么強大,里面的物理性質(zhì)是不能保證的,做不到一個世界模型。”大模型可分為通用大模型、行業(yè)大模型、企業(yè)大模型和個人大模型。沈向陽指出,通用大模型是AI的基礎,要訓練一個通用大模型至少需要萬卡;行業(yè)大模型是做領(lǐng)域應用的底座,需要千卡級別的訓練;企業(yè)大模型是企業(yè)數(shù)據(jù)價值的再發(fā)現(xiàn),需要百卡級別的訓練。這些大模型都對算力的要求極高。“最激動人心的是個人大模型,比如聯(lián)想、微軟在推AIPC和蘋果的Apple Intelligence等都是朝著個人智能這個方向發(fā)展的。”沈向陽說道。截至今年7月底,中國已備案大模型達到了197個,其中30%是通用大模型,70%是行業(yè)大模型。“可以看到,行業(yè)大模型占到絕大多數(shù),未來肯定還會越來越多。”沈向陽表示。2024年5月,微軟公司創(chuàng)始人比爾·蓋茨公開表示,AI Agent不僅會改變每個人與計算機交互的方式,還將顛覆軟件行業(yè),帶來從鍵入命令到點擊圖標以來,最大的計算革命。沈向陽對此觀點表示認同。他認為,人工智能時代,真正了不起的超級應用就是AI Agent。AI Agent從愿景到落地的過程中,需要始終以需求為圓點,深刻理解模型的能力,并構(gòu)建一個AI深度參與的工作流程。“今天在一家公司里工作的話,整個工作流是非常復雜的,ChatGPT雖然很強大,但遠遠沒達到Agent的程度,它只實現(xiàn)了單點突破,真正要向前走還得融入整個工作流。”他說。AI治理非常重要。今年世界人工智能大會(WAIC)的主題就是在講AI治理,各個國家對于這件事情的看法有很多不一樣。AI的發(fā)展,對民眾、公司、政府監(jiān)管、社會發(fā)展等各個方面都產(chǎn)生了強大的沖擊,引發(fā)了公眾對于其安全治理的擔憂。“我覺得接下來人工智能的發(fā)展很重要的一點,從全球各個國家角度來講,是一定要做主權(quán)人工智能,而主權(quán)人工智能背后一定需要有一個主權(quán)云來支持主權(quán)人工智能的發(fā)展。”沈向陽表示。“GPT帶來的沖擊有多少是人機交互的震撼,又有多少是機器智能的發(fā)展?”沈向陽認為應該重新思考人機之間的關(guān)系。他指出,AI為人類提供了與技術(shù)共生的全新語境,人機交互的新方式指向“AI與IA”的融合共進。IA(Intelligent Augmentation),即智能增強,代表著一種以人為本的 AI 發(fā)展路徑。它聚焦于運用技術(shù)提升人類的能力,而非取代人類,強調(diào)了人類與 AI 之間的協(xié)作關(guān)系。“紐約時報專欄作者John Markoff 提到,計算機過去幾十年的發(fā)展路程里,真正的贏家是做人機交互的。不管是什么技術(shù),最后的目的都應該是幫助人類更好地使用機器。”沈向洋表示,“到了AI時代,人機交互最本質(zhì)的是對話,就像ChatGPT這樣。ChatGPT加上微軟,會不會成為AI時代最偉大的公司?我想只有時間才能夠驗證。”今天,GPT的發(fā)展如火如荼,但實際上,人們對智能的理解還是非常有限的。不同于物理學,上到浩瀚的星空,下到微小的量子,都能有一個大一統(tǒng)的理論可以解釋;今天的深度學習很多東西都是不可解釋的,沒有魯棒性。“智能的本質(zhì)是神經(jīng)網(wǎng)絡與符號系統(tǒng)的世紀之爭。”沈向陽說道,“今天,雖然人工智能的發(fā)展還處在一個相對來講比較早期的階段,但是行業(yè)上已經(jīng)有很多的應用,值得下定決心去做,我對未來的發(fā)展充滿信心。”
贊助本站