【文/觀察者網(wǎng) 陳思佳】近年來(lái),ChatGPT掀起了一股人工智能(AI)浪潮,生成式人工智能和人工智能生成內(nèi)容(AIGC)的概念迅速進(jìn)入社會(huì)各界的視野。在AI技術(shù)高速發(fā)展的當(dāng)下,AIGC似乎已在不知不覺間滲透進(jìn)人們的日常生活的方方面面。
7月6日至8日,以“智聯(lián)世界 生成未來(lái)”為主題的第六屆世界人工智能大會(huì)(WAIC)在上海舉行,展覽涵蓋核心技術(shù)、智能終端、應(yīng)用賦能、前沿技術(shù)四大板塊,包括大模型、芯片、機(jī)器人、智能駕駛等領(lǐng)域,參展企業(yè)超400家,優(yōu)秀初創(chuàng)企業(yè)超50家,首發(fā)首展新品達(dá)30余款。
大模型和AIGC無(wú)疑是本次大會(huì)的焦點(diǎn),華為、阿里、百度、科大訊飛等多家廠商的30余款大模型亮相世博展覽館,涵蓋圖片生成、視頻生成、數(shù)字人等諸多AIGC項(xiàng)目的展臺(tái)更是吸引大批觀眾。
但AI技術(shù)的迅猛發(fā)展也促使人們開始思考,大模型和AIGC具有什么樣的前景?它們會(huì)給日常生活帶來(lái)怎樣的變革?生成式AI技術(shù)又有什么樣的潛在發(fā)展門檻和風(fēng)險(xiǎn)?對(duì)此,在7月7日舉行的“聚焦大模型時(shí)代AIGC新浪潮論壇”上,來(lái)自多家機(jī)構(gòu)、企業(yè)和高校的專家分享了他們的看法。
2023世界人工智能大會(huì)
30余款大模型同臺(tái)競(jìng)技
本屆WAIC聚焦大模型和AIGC,華為云盤古大模型、科大訊飛星火認(rèn)知大模型、商湯商量中文語(yǔ)言大模型、阿里云通義千問(wèn)、百度文心一言等30余款大模型亮相現(xiàn)場(chǎng),各大廠商推出的產(chǎn)品涵蓋算力底座、模型即服務(wù)(MaaS)、通用大模型、垂直應(yīng)用大模型等方方面面。
作為本次大會(huì)的“鎮(zhèn)館之寶”之一,華為帶來(lái)的騰AI“大模型超級(jí)工廠”覆蓋大模型的數(shù)據(jù)&模型準(zhǔn)備、算力準(zhǔn)備&模型訓(xùn)練、模型部署上線&集成等階段全流程。
目前基于騰AI原生孵化了業(yè)界首個(gè)兩千億參數(shù)的中文NLP大模型鵬城.盤古、業(yè)界首個(gè)多模態(tài)大模型紫東.太初以及華為云盤古系列在內(nèi)的20多個(gè)國(guó)產(chǎn)大模型。同時(shí),騰AI也已適配支持了ChatGLM、LLaMA、GPT-3、BLOOM等數(shù)十個(gè)業(yè)界主流開源開放的大模型。
7月7日,華為云CEO張平安還在華為開發(fā)者大會(huì)2023上宣布,盤古大模型3.0正式發(fā)布。據(jù)他介紹,該模型是一個(gè)完全面向行業(yè)的大模型系列,“盤古大模型不作詩(shī),也沒有時(shí)間作詩(shī),因?yàn)樗钊氲礁餍懈鳂I(yè)中去,讓AI賦予各行各業(yè)價(jià)值。”
商湯科技“日日新SenseNova”大模型體系則覆蓋文本生成、圖像生成、數(shù)字人等多個(gè)領(lǐng)域。其中“商量SenseChat”是該體系下的千億級(jí)參數(shù)語(yǔ)言大模型,具備領(lǐng)先的語(yǔ)義理解、多輪對(duì)話、知識(shí)掌握、邏輯推理的綜合能力。目前,“商量SenseChat 2.0”已在醫(yī)療、金融、移動(dòng)終端、代碼開發(fā)等領(lǐng)域?yàn)榭蛻籼峁┓⻊?wù)。
作為“模型即服務(wù)”的倡導(dǎo)者,阿里云展出的通義大模型允許企業(yè)微調(diào)、訓(xùn)練模型,打造模型開放平臺(tái),提供一站式模型服務(wù)。阿里云還展示了其云計(jì)算技術(shù)體系的三層架構(gòu),從下到上分別包括基礎(chǔ)設(shè)施即服務(wù)(IaaS)、平臺(tái)即服務(wù)(PaaS)和模型即服務(wù)(MaaS)。
此外,多款應(yīng)用于垂直領(lǐng)域的大模型也亮相本屆WAIC。例如,達(dá)觀數(shù)據(jù)發(fā)布的“曹植”大模型主要面向金融、政務(wù)等行業(yè),具備長(zhǎng)文本、垂直化和多語(yǔ)言等特點(diǎn)。蜜度發(fā)布的“蜜度文修”大模型則專為校對(duì)這一垂直領(lǐng)域打造,在中文拼寫勘誤、語(yǔ)法糾正等方面的表現(xiàn)優(yōu)于通用大模型ChatGPT。
圖片生成、音樂(lè)創(chuàng)作、數(shù)字人……AIGC觸及生活方方面面
在迅猛發(fā)展的大模型的支持下,AIGC技術(shù)成為本屆WAIC的一大亮點(diǎn),圖像生成、數(shù)字人直播、文本生成PPT、自動(dòng)剪輯等多種生成式AI應(yīng)用與大模型同步推出,相關(guān)展臺(tái)可謂人山人海。
商湯科技展臺(tái)展示了“秒畫SenseMirage”生成的圖像,這是一個(gè)包含商湯自研AIGC大模型和便捷的LoRA訓(xùn)練能力,并提供第三方社區(qū)開源模型加速推理的創(chuàng)作平臺(tái)。據(jù)介紹,秒畫SenseMirage 3.0的自研生成大模型參數(shù)提升至70億量級(jí),具有更強(qiáng)的中文理解能力、更多樣化的風(fēng)格選擇。
燧原科技也展示了文生圖MaaS平臺(tái)服務(wù)產(chǎn)品“燧原曜圖”,基于燧原科技“邃思”系列芯片的算力支持,為用戶提供面向AIGC時(shí)代的高效易用、安全可靠的文生圖服務(wù)。通過(guò)軟硬件一體方案,該產(chǎn)品可以降低大規(guī)模AIGC應(yīng)用的工程難度和算力成本。
網(wǎng)易伏羲推出了自研圖片生成模型“丹青”和創(chuàng)意輔助產(chǎn)品“丹青約”,推動(dòng)將AI技術(shù)應(yīng)用于企業(yè)美術(shù)資產(chǎn)的生產(chǎn)創(chuàng)作流程中,將上線有靈美術(shù)平臺(tái)。據(jù)介紹,“丹青”是基于原生中文語(yǔ)料數(shù)據(jù)及網(wǎng)易自有高質(zhì)量圖片數(shù)據(jù)訓(xùn)練,為100%的國(guó)產(chǎn)大模型。
金山辦公的具備大語(yǔ)言模型能力的人工智能應(yīng)用WPS AI則已經(jīng)接入金山辦公旗下WPS文字、演示、表格、PDF、智能文檔和智能表格等組件。金山辦公表示,這是國(guó)內(nèi)協(xié)同辦公賽道的首個(gè)類ChatGPT式應(yīng)用,未來(lái)錨定AIGC、人機(jī)交互、知識(shí)再利用三個(gè)戰(zhàn)略方向發(fā)展。
在音樂(lè)創(chuàng)作方面,騰訊多媒體實(shí)驗(yàn)室基于AIGC技術(shù)推出XMusic生成式通用作曲框架,支持視頻、圖片、文字、標(biāo)簽、哼唱等多模態(tài)內(nèi)容作為輸入提示詞,生成情緒、曲風(fēng)、節(jié)奏可控的音樂(lè)。在視頻配樂(lè)、互動(dòng)娛樂(lè)、輔助創(chuàng)作、音樂(lè)教育等眾多領(lǐng)域都具有廣闊的應(yīng)用前景。
騰訊還展出了將生成式AI應(yīng)用于電子游戲、科研、實(shí)時(shí)翻譯等領(lǐng)域的探索。例如,騰訊優(yōu)圖展示的AI探星計(jì)劃,利用AI技術(shù)和騰訊云的算力助力“中國(guó)天眼”(FAST),已在較短時(shí)間內(nèi)快速發(fā)現(xiàn)數(shù)十顆脈沖星。
在智能手機(jī)的時(shí)代,AI技術(shù)也在與移動(dòng)終端結(jié)合。美國(guó)高通公司展出了終端側(cè)生成式AI用例演示,在搭載第二代驍龍8移動(dòng)平臺(tái)的安卓手機(jī)運(yùn)行超10億參數(shù)的Stable Diffusion模型,實(shí)現(xiàn)15秒內(nèi)20步推理。
“大模型的產(chǎn)生并非一蹴而就”
AI熱潮席卷全球,也促使人們開始思考,生成式AI技術(shù)會(huì)給社會(huì)生產(chǎn)帶來(lái)怎樣的變化?AIGC又具備怎樣的發(fā)展前景?對(duì)此,7月7日上午舉行的“聚焦大模型時(shí)代AIGC新浪潮論壇”上,來(lái)自多家機(jī)構(gòu)、企業(yè)和高校的專家分享了他們的觀點(diǎn)。
京東探索研究院院長(zhǎng)、京東科技智能服務(wù)與產(chǎn)品部總裁何曉東表示,生成式AI在今年取得了巨大的進(jìn)展,可以做到文本生成、代碼生成、圖片生成、視頻生成等,產(chǎn)生了生產(chǎn)力的變革。他認(rèn)為,大模型帶來(lái)了AI流行的機(jī)遇,從傳統(tǒng)的基于某一個(gè)場(chǎng)景、某一個(gè)應(yīng)用定制AI模型,進(jìn)入到一個(gè)大的通用的模型可以服務(wù)于多個(gè)場(chǎng)景。
“一方面模型本身的成本是提高了,因?yàn)槲覀兌贾溃竽P捅旧硇枰罅康乃懔,需要大量的?shù)據(jù),需要一個(gè)很大、很強(qiáng)的綜合性團(tuán)隊(duì)。在另一方面它的部署成本其實(shí)極大地降低了,因?yàn)橐粋(gè)模型可以部署到更多的地方。”何曉東說(shuō),“這就像我們進(jìn)入工業(yè)時(shí)代,雖然工具更昂貴了,但它生產(chǎn)產(chǎn)品的效率反而提升了。”
何曉東表示,希望AIGC能加入更有創(chuàng)作力的領(lǐng)域,比如圖像繪畫生成等,“京東通過(guò)打造一站式的人工智能應(yīng)用平臺(tái)言犀平臺(tái),集成大量AI從感知到認(rèn)知到生成的技術(shù),使得我們可以在各個(gè)層次組合出各種各樣豐富的應(yīng)用式產(chǎn)品,服務(wù)各行各業(yè)。各行各業(yè)都能從這一次的人工智能技術(shù)進(jìn)展中得到真正的提升。”
京東探索研究院院長(zhǎng)、京東科技智能服務(wù)與產(chǎn)品部總裁何曉東發(fā)表講話
HiDream.ai創(chuàng)始人、加拿大工程院外籍院士梅濤認(rèn)為,多模態(tài)AIGC主要面臨三大挑戰(zhàn):第一是標(biāo)記化(Tokenization),有沒有一種比較好的集合,能夠把文本、視覺、語(yǔ)音等信息包含在一起。第二是解碼(Decoder),大語(yǔ)言模型中常用的Transformer架構(gòu)并沒有在圖像、視頻中得到很好的應(yīng)用。第三是對(duì)齊(Alignment),我們能不能做到不同模態(tài)之間交叉相關(guān)性的對(duì)齊。
梅濤指出,目前主流的視覺模型的能力邊界基本都在幾十億參數(shù)的區(qū)間,在圖像生成方面,人臉細(xì)節(jié)、手指細(xì)節(jié)、物體細(xì)節(jié)等問(wèn)題都還沒有解決,還有很多工作要做。
“我們想做的一件事就是問(wèn)問(wèn)自己,到底我們有沒有可能把現(xiàn)在視覺多模態(tài)的基礎(chǔ)模型,從它現(xiàn)在能力對(duì)標(biāo)GPT-2.0的時(shí)代,走向GPT-3.0的時(shí)代。當(dāng)然這也是我們HiDream的一個(gè)初心。”梅濤說(shuō)。
HiDream.ai創(chuàng)始人、加拿大工程院外籍院士梅濤發(fā)表講話
九章云極聯(lián)合創(chuàng)始人尚明棟則談及人工智能基礎(chǔ)設(shè)施的變革。他表示,大模型的產(chǎn)生并非一蹴而就,而是需要完整的基礎(chǔ)設(shè)施升級(jí),無(wú)法依靠單獨(dú)一個(gè)大模型解決更多的問(wèn)題。他指出,基礎(chǔ)設(shè)施的構(gòu)成包括算力、數(shù)據(jù)和軟件等方面。
尚明棟提到,美國(guó)初創(chuàng)公司CoreWeave在最近使用3584張H100芯片,僅用時(shí)11分鐘就完成GPT-3模型的訓(xùn)練,整體開銷約2萬(wàn)美元。但在2020年訓(xùn)練GPT-3模型需要450萬(wàn)美元,在2022年依然需要45萬(wàn)美元。“我們看到,隨著算力和并行的一些基礎(chǔ)軟件的演進(jìn),我們算力的成本在持續(xù)下降。而算力成本下降的速度,我們判斷也會(huì)快于模型大小增長(zhǎng)。所以,以后算力將不會(huì)構(gòu)成大模型計(jì)算的一個(gè)鴻溝。”
他指出,訓(xùn)練更高質(zhì)量、更高效的模型,就需要質(zhì)量更好的數(shù)據(jù),“我們也知道,受限于數(shù)據(jù)的邊界,考慮到數(shù)據(jù)隱私、數(shù)據(jù)安全等多方面因素,我們很難讓它直接在通用的數(shù)據(jù)中流通。所以我們需要構(gòu)建垂直領(lǐng)域大模型,結(jié)合從算力、數(shù)據(jù)到基礎(chǔ)軟件去賦能于千行百業(yè)。”
九章云極聯(lián)合創(chuàng)始人尚明棟發(fā)表講話
在基礎(chǔ)軟件方面,尚明棟認(rèn)為,基礎(chǔ)軟件的核心價(jià)值在兩點(diǎn),一是高效地調(diào)度、管理數(shù)據(jù)和算力,將原先復(fù)雜的大模型構(gòu)建變得更加容易。二是通過(guò)對(duì)基礎(chǔ)軟件高效的工程化、模塊化和自動(dòng)化,提高訓(xùn)練的效率;A(chǔ)軟件效率的提升意味著算力的節(jié)省和成本的降低。
“所以,大模型未來(lái)的挑戰(zhàn)在于,我們希望大模型能夠落地各行各業(yè),那么落地于千行百業(yè)就需要和各個(gè)行業(yè)的業(yè)務(wù)結(jié)合在一起,并結(jié)合行業(yè)的業(yè)務(wù)知識(shí)。”尚明棟說(shuō)。
“AI存在風(fēng)險(xiǎn),但我們不應(yīng)該因噎廢食”
然而,AIGC的發(fā)展也面臨諸多爭(zhēng)議,從發(fā)展的門檻和壁壘到AI的風(fēng)險(xiǎn)和安全性都受到頗多質(zhì)疑。對(duì)此,在“聚焦大模型時(shí)代AIGC新浪潮論壇”的圓桌討論環(huán)節(jié)中,多位專家指出,生成式AI發(fā)展可能面臨諸多挑戰(zhàn)和風(fēng)險(xiǎn),但我們不能“因噎廢食”,需要在長(zhǎng)期的發(fā)展中尋找應(yīng)對(duì)的方案。
上海人工智能實(shí)驗(yàn)室主任助理喬宇認(rèn)為,大模型還存在很多問(wèn)題,例如人們常說(shuō)的“幻覺”、價(jià)值對(duì)齊、效率等,但社會(huì)各界需要用發(fā)展的目光看待AI,安全和發(fā)展是“一體兩翼”的關(guān)系,特別是中國(guó)的大模型還處于追趕階段,需要從發(fā)展的角度去看待安全問(wèn)題。
談及大模型可能存在的價(jià)值觀方面的問(wèn)題,喬宇表示,大模型的價(jià)值觀是由訓(xùn)練數(shù)據(jù)得來(lái)的,“我們是不是能從訓(xùn)練數(shù)據(jù)端去解決?有些模型用在專業(yè)領(lǐng)域的時(shí)候,圍繞這個(gè)專業(yè)領(lǐng)域,我們對(duì)它有一些安全要求,有可能從中繼承一些。所以要從大模型技術(shù)研發(fā)的不同環(huán)節(jié)來(lái)思考安全問(wèn)題。”
喬宇強(qiáng)調(diào),大模型的安全不單單是某一個(gè)科研團(tuán)體、某一個(gè)產(chǎn)業(yè)領(lǐng)域或是中國(guó)單獨(dú)面臨的問(wèn)題,它是全世界乃至全人類面臨的問(wèn)題,“所以我認(rèn)為在安全領(lǐng)域,我們應(yīng)該展開更多的國(guó)際交流和合作,來(lái)共同面對(duì)和解決。”
“聚焦大模型時(shí)代AIGC新浪潮論壇”圓桌討論環(huán)節(jié)
香港中文大學(xué)助理教授王歷偉從人才和研究的角度切入,他認(rèn)為,從人才培養(yǎng)的速度來(lái)看,很大的優(yōu)秀科研人員基礎(chǔ)可以降低未來(lái)研發(fā)的門檻,訓(xùn)練大模型的算力需求成本看起來(lái)也比較樂(lè)觀。“我覺得從短期或中長(zhǎng)期來(lái)看,無(wú)論是人才儲(chǔ)備還是算力,大模型的研發(fā)門檻可能在慢慢降低。”
王歷偉表示,科研人員需要關(guān)注如何理解和評(píng)價(jià)大模型的能力,“如果我們持續(xù)從一種評(píng)價(jià)方式去衡量大模型的能力,可能多多少少還是比較片面。”他認(rèn)為,學(xué)術(shù)領(lǐng)域人士很適合去更多地探索安全性和AI治理等方向的內(nèi)容。
螞蟻集團(tuán)機(jī)器智能部副總經(jīng)理、螞蟻安全天實(shí)驗(yàn)室主任張?zhí)煲肀硎荆竽P蛶?lái)的風(fēng)險(xiǎn)問(wèn)題不一定是新的問(wèn)題,但更加深度的應(yīng)用可能造成更全面的影響,包括生成內(nèi)容安全問(wèn)題、技術(shù)安全、隱私問(wèn)題、合規(guī)問(wèn)題以及倫理問(wèn)題等。
張?zhí)煲碚J(rèn)為,當(dāng)前大模型存在三方面的風(fēng)險(xiǎn),一是技術(shù)相關(guān)問(wèn)題,模型本身可能被攻擊、被突破、被劫持。二是產(chǎn)業(yè)類風(fēng)險(xiǎn),AI是否會(huì)帶來(lái)壟斷、勞動(dòng)替代等問(wèn)題。三是內(nèi)容類的問(wèn)題,是否會(huì)向用戶提供不安全的內(nèi)容。
他表示,大模型的風(fēng)險(xiǎn)問(wèn)題沒有“靈丹妙藥”,必然是一個(gè)長(zhǎng)期對(duì)抗和博弈發(fā)展的過(guò)程,“比如說(shuō)現(xiàn)在安全行業(yè)內(nèi)的一個(gè)很直接的應(yīng)用,我們也會(huì)用大模型來(lái)對(duì)抗更多大模型中的風(fēng)險(xiǎn),這也會(huì)是一個(gè)‘用魔法打敗魔法’的方向。”
云天勵(lì)飛副總裁、AI技術(shù)平臺(tái)總經(jīng)理肖嶸則為生成式AI的發(fā)展總結(jié)了四個(gè)問(wèn)題,分別是生成內(nèi)容存在“幻覺”的問(wèn)題、工具使用和外部知識(shí)整合能力、邏輯推理能力和不具備持續(xù)學(xué)習(xí)能力的問(wèn)題。
在安全問(wèn)題上,肖嶸認(rèn)為,大模型其實(shí)具備“價(jià)值觀”,它所認(rèn)定的知識(shí)不一定就是事實(shí),“解決這個(gè)問(wèn)題其實(shí)有兩個(gè)路徑,第一個(gè)是它為什么會(huì)產(chǎn)生有錯(cuò)的東西?可能它學(xué)的東西都是不對(duì)的……所以我們需要對(duì)語(yǔ)料有體系地治理,保證其安全、可控。第二個(gè)也是我們正在大力推動(dòng)的,比如對(duì)模型輸出的治理。”
但他也強(qiáng)調(diào),AI是一種工具。“越強(qiáng)大的工具被用來(lái)作惡,可能影響也越大。”肖嶸說(shuō),“我認(rèn)為,工具用得好不好,更多是人的問(wèn)題。我們不應(yīng)該因噎廢食,不是看到強(qiáng)大的工具就不去使用,而是更多地想想怎么把它有序化。”
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。