編者按:
財聯(lián)社、科創(chuàng)板日報旗下《AI daily》推出的“Insight·AI鋒線”深度報道與人物訪談,聚焦國內(nèi)外人工智能及大模型領(lǐng)域優(yōu)秀企業(yè)、創(chuàng)業(yè)者、領(lǐng)軍學(xué)者、投資人等,帶來AI賦能千行百業(yè)的最新探索、實踐與思考!癐nsight·AI鋒線”,洞見,先鋒,一線!最新一期“Insight·AI鋒線”人物為讀者IDEA研究院創(chuàng)院理事長、美國國家工程院外籍院士沈向洋。
《科創(chuàng)板日報》11月26日訊(記者 毛明江 黃心怡)沈向洋,華人圈中成就最高的計算機科學(xué)家之一,同時也是杰出的人工智能學(xué)者。
沈向洋出生于江蘇鎮(zhèn)江溧水縣,他就讀的第一所學(xué)校在他自己記憶中是“牛棚小學(xué)”。1980年代,他先后在南京工學(xué)院、香港大學(xué)求學(xué)。1996年獲得卡內(nèi)基梅隆大學(xué)獲得機器人專業(yè)的博士學(xué)位,博士論文是世界上最早有關(guān)將照片轉(zhuǎn)換成虛擬現(xiàn)實的研究。
1998年,微軟中國研究院在北京成立時,他應(yīng)院長李開復(fù)的要求前往加盟,并于2004年擔任院長。2013年,他出任微軟全球執(zhí)行副總裁,直接向時任微軟CEO鮑爾默匯報工作,負責(zé)幫助微軟確立技術(shù)上的發(fā)展方向。現(xiàn)已分拆獨立Al聊天機器人小冰,就是在沈向洋領(lǐng)導(dǎo)下研發(fā)推出。
因“為計算機視覺和計算機圖形學(xué)做出了貢獻,并在工業(yè)研究和產(chǎn)品開發(fā)方面發(fā)揮了領(lǐng)導(dǎo)的作用”,沈向洋于2017年當選美國國家工程院外籍院士。2019年,在做出“一生中最艱難的決定”后,這位微軟的“中國先生”宣布離開微軟。后受聘擔任香港科技大學(xué)校董會主席。
2021年作為創(chuàng)院理事長,沈向洋帶領(lǐng)下的粵港澳大灣區(qū)數(shù)字經(jīng)濟研究院(International Digital Economy Academy,簡稱“IDEA研究院”)成立。作為致力于人工智能和數(shù)字經(jīng)濟領(lǐng)域的前沿研究與產(chǎn)業(yè)落地的國際化創(chuàng)新型機構(gòu),IDEA在粵港澳大灣區(qū)被寄予厚望。IDEA迄今已延攬了數(shù)百名的頂尖科學(xué)家團隊,沈向洋特別強調(diào)加入IDEA的人才要有“科學(xué)家頭腦,企業(yè)家素質(zhì),創(chuàng)業(yè)者精神。”
一身深藍的西裝,儒雅親和的外表,敏銳前瞻的思考,不時脫口而出的幽默金句。在上周深圳舉行IDEA2024大會上,《科創(chuàng)板日報》記者見到了低調(diào)而忙碌的沈向洋。作為IDEA研究院創(chuàng)院理事長,沈向洋以大會主持身份,帶來了一場精彩的涉及人工智能、低空經(jīng)濟等“學(xué)研產(chǎn)投”的多成果發(fā)布會,也暢談了他對于人工智能的最新思考。
“講卡傷感情,沒卡沒感情”
在人工智能蓬勃發(fā)展的浪潮中,算力已成為這場科技競賽的核心戰(zhàn)場之一。沈向洋一句“講卡傷感情,沒卡沒感情”,生動地描繪出當前人工智能領(lǐng)域算力的重要性與激烈的資源競爭。
回顧計算行業(yè)的發(fā)展歷程,算力一直是推動行業(yè)進步的關(guān)鍵因素。曾經(jīng)摩爾定律主導(dǎo)著算力的提升節(jié)奏,每18個月芯片性能近乎翻倍,為信息技術(shù)的飛速發(fā)展奠定了堅實基礎(chǔ)。然而大模型的出現(xiàn),如同一頭算力“巨獸”,其參數(shù)量從百億級迅速攀升至千億級、萬億級,對算力的需求呈指數(shù)級增長。以GPT系列模型為例,GPT3使用了2T數(shù)據(jù),GPT4的訓(xùn)練數(shù)據(jù)量更是達到20T左右,而預(yù)計未來的GPT5預(yù)計將達到200T規(guī)模。如此龐大的數(shù)據(jù)量,對算力的要求超乎想象。
在沈向洋看來,英偉達在這場算力革命中占據(jù)了機器有利的位置。其芯片產(chǎn)品,尤其是H100芯片,成為眾多中外企業(yè)競相追逐的對象。用沈向洋話說,“今天拿得到英偉達的卡,那你就成功了一半。”
在上周六香港科技大學(xué)授予英偉達創(chuàng)始人黃仁勛榮譽博士的典禮上,沈向洋與黃仁勛換上了同款紀念皮衣,并進行了一場前沿對話。
黃仁勛與沈向洋在港科大授予黃仁勛榮譽博士典禮上
他提及“黃氏定律”,以模型訓(xùn)練衡量算力增長,按當前大模型算力需求每年四倍多的增長速度,十年可能預(yù)見100萬倍的算力需求增長,算力需求與參數(shù)呈平方關(guān)系,未來的增長極為龐大。
黃仁勛對此表示認同,并表示,“我們現(xiàn)在經(jīng)歷的是,你的神經(jīng)網(wǎng)絡(luò)越大,訓(xùn)練的數(shù)據(jù)越多,人工智能似乎就越智能。”
合成數(shù)據(jù)是百億美元的創(chuàng)業(yè)機會
在人工智能技術(shù)迅猛發(fā)展的當下,大模型的演進對數(shù)據(jù)量與質(zhì)的要求達到了前所未有的高度。隨著大模型如GPT系列的不斷迭代升級,數(shù)據(jù)需求呈爆炸式增長。GPT3使用了2T數(shù)據(jù),GPT4則使用了12T到20T數(shù)據(jù),據(jù)預(yù)測,GPT5預(yù)計將需要200T數(shù)據(jù)。
然而,互聯(lián)網(wǎng)現(xiàn)有數(shù)據(jù)的局限性逐漸暴露,其存量難以滿足如此龐大的需求。在沈向洋看來,“缺數(shù)據(jù)”已成為大模型行業(yè)的普遍共識。互聯(lián)網(wǎng)上洗干凈的數(shù)據(jù)量約為20萬億Tokens,距離提供GPT5所需的200T數(shù)據(jù)相去甚遠,且社交媒體數(shù)據(jù)質(zhì)量也不盡如人意,私域數(shù)據(jù)又因安全孤島問題難以被充分利用。
在此背景下,合成數(shù)據(jù)應(yīng)運而生,成為人工智能領(lǐng)域新的“寶藏”。沈向洋指出,人工智能要繼續(xù)向前發(fā)展,制造和合成數(shù)據(jù)成為必然趨勢,而這其中蘊含著百億美元的創(chuàng)業(yè)商機。這里面關(guān)鍵在于如何合成數(shù)據(jù)。例如,1萬億的數(shù)據(jù)約等于500萬本書、20萬張高清照片或500萬篇論文,人類歷史上的書籍總量約為21億Tokens,微博有38億Tokens,F(xiàn)acebook約有140T Tokens的數(shù)據(jù),即便如此仍無法滿足大模型日益增長的需求。
沈向洋指出,合成數(shù)據(jù)在多模態(tài)應(yīng)用中的重要性尤為突出。GPT系列模型主要依賴互聯(lián)網(wǎng)語料數(shù)據(jù),在編程、物理、化學(xué)等多模態(tài)應(yīng)用場景中,所需的更強邏輯性和專業(yè)性數(shù)據(jù)往往無法從互聯(lián)網(wǎng)直接獲取,合成數(shù)據(jù)則為解決這一問題提供了關(guān)鍵路徑。通過合理生成合成數(shù)據(jù),可為多模態(tài)模型提供豐富訓(xùn)練資源,推動多模態(tài)技術(shù)發(fā)展。
AI For Science,從技術(shù)突破到產(chǎn)業(yè)融合
“今天我們一定要做的一件事情是AI For Science。講得稍微夸張一點,難以想象今天還有什么事情比AI For Science更重要。”沈向洋呼吁,當前人工智能不管是研究者還是產(chǎn)業(yè)端,“拼命的推動大模型的技術(shù)落地是最重要的。”
他以今年諾貝爾物理獎與化學(xué)獎獲獎結(jié)果,說明AI For Science的重要性。
沈向陽帶領(lǐng)下的IDEA在大模型領(lǐng)域的探索與實踐,展現(xiàn)出其對AI For Science的堅定決心。盡管受到算力等因素的限制,IDEA在超大模型方向未進行過度擴張,但在垂直大模型領(lǐng)域取得了令人矚目的成果;瘜W(xué)大模型、學(xué)術(shù)大模型、營銷大模型、經(jīng)濟大模型、運籌大模型、投資大模型、視覺大模型等一系列垂直模型的成功研發(fā),彰顯了沈向洋帶領(lǐng)下的團隊在特定領(lǐng)域的技術(shù)實力和創(chuàng)新能力。
IDEA還與與美團、比亞迪、騰訊等行業(yè)領(lǐng)軍企業(yè)開展合作,在無人機智能技術(shù)、工業(yè)機器人智能化、人居環(huán)境具身智能等前沿領(lǐng)域共同探索。通過產(chǎn)學(xué)研用的深度融合,推動人工智能從實驗室技術(shù)創(chuàng)新到產(chǎn)業(yè)規(guī);l(fā)展的跨越,為社會經(jīng)濟發(fā)展注入新的活力和動力。
發(fā)展低空經(jīng)濟要建“四張網(wǎng)”
2022年以來,IDEA研究院持續(xù)發(fā)布低空經(jīng)濟發(fā)展白皮書。今年IDEA大會上,沈向洋也帶來了IDEA撰寫的《低空經(jīng)濟發(fā)展白皮書3.0安全體系》。白皮書認為低空經(jīng)濟發(fā)展需遵循應(yīng)用為王、政府為主、技術(shù)為底、安全至上的原則。
沈向洋深度解析低空經(jīng)濟發(fā)展安全體系,從“點-飛行安全”、“線-航路安全”、“面-運行安全”、“體-社會安全”四個維度指出構(gòu)建低空經(jīng)濟安全體系的重要性和緊迫性,認為規(guī);涂战(jīng)濟要解決安全、效率、成本三大問題,為行業(yè)發(fā)展提供前沿洞察與指引
“我們跟深圳市政府一起研究這個問題,提出必須要打造低空智能融合基礎(chǔ)設(shè)施,具體來講要建四張網(wǎng):1、設(shè)施網(wǎng),所有的硬件。2、航路網(wǎng),飛機在天上可以怎么樣飛,哪里可以飛,哪里不可以飛。3、空聯(lián)網(wǎng),得知道在空域環(huán)境里,監(jiān)控可以看到的信號是什么。4、服務(wù)網(wǎng)!
同時,IDEA研究院還發(fā)布了開放的智能融合低空系統(tǒng)OpenSILAS 1.0 Alpha版,這一智能融合低空系統(tǒng)低空的“大腦”,來統(tǒng)籌、協(xié)調(diào)、管理、分配低空時空資源,支撐、管理、服務(wù)各類低空飛行活動。此外,大會發(fā)起共建OpenSILAS創(chuàng)新聯(lián)合體,IDEA研究院與17家首批發(fā)起單位攜手,共同打造一個開放共享、技術(shù)領(lǐng)先、不斷迭代的系統(tǒng)和平臺,
“從經(jīng)濟的最大增長,到人類的最大福祉”
在當今時代,人工智能的影響力正以前所未有的速度蔓延至社會的各個角落,引發(fā)了廣泛而深刻的關(guān)注與思考。沈向洋最后談到了人工智能治理的問題。
在今年上海舉行的世界人工智能大會上,沈向洋就與與國際知名的瑞迪教授、布盧姆教授和姚期智教授等學(xué)界泰斗共同研討人工智能治理的方向與路徑。
在沈向洋看來,從社會發(fā)展的宏觀視角審視,農(nóng)業(yè)社會生產(chǎn)力受限,GDP增長微乎其微;工業(yè)社會與信息社會雖取得一定進展,但增長幅度仍相對有限。而AI時代的來臨,有望大幅提升生產(chǎn)效率,據(jù)經(jīng)濟學(xué)家預(yù)測,平均GDP增長或?qū)④S升至百分之十幾。然而,這一預(yù)測背后隱藏著更深層次的追問:AI推動的經(jīng)濟高速增長,能否切實轉(zhuǎn)化為人類的福祉?
對于從事人工智能技術(shù)研發(fā)和產(chǎn)業(yè)落地的人員來說,這是必須思考的關(guān)鍵問題。在人工智能在諸多領(lǐng)域已展現(xiàn)出超越人類的能力的當下,在追求技術(shù)進步和經(jīng)濟利益的同時,如何確保人工智能的發(fā)展造福人類,如何平衡技術(shù)發(fā)展與社會公平、倫理道德等多方面關(guān)系,每個問題都不能忽視。沈向洋呼吁行業(yè)關(guān)注AI治理,重視人工智能對社會發(fā)展的全面影響,引導(dǎo)人工智能朝著有利于人類的方向發(fā)展,實現(xiàn)科技與人文的和諧共生。
(科創(chuàng)板日報記者 毛明江 黃心怡)