撰文| 懂懂
編輯 | 秦言
來(lái)源:懂懂筆記
從ChatGPT問(wèn)世至今,已經(jīng)過(guò)去2年。大模型和生成式AI帶給人們的,除了無(wú)限暢想,還有理想與現(xiàn)實(shí)的差距。即便AI手機(jī)、AI PC、AI汽車相繼問(wèn)世;即便隨便打開(kāi)一個(gè)大模型,讓AI搜集一些資料、擴(kuò)展一篇文章,已經(jīng)“So Easy”,但大多數(shù)人仍覺(jué)得“不解渴”。用一句話總結(jié),人民群眾日益增長(zhǎng)的AI理想與AI現(xiàn)實(shí)之間存在巨大矛盾。那么,如果從專業(yè)角度,該如何評(píng)價(jià)過(guò)去兩年大模型和生成式AI的發(fā)展?
“AI先生”李彥宏11月12日做了總結(jié):“大模型最大的變化是基本消除了幻覺(jué),回答問(wèn)題的準(zhǔn)確性大大地提升,變得可用、可被信賴!蓖瑫r(shí),他認(rèn)為智能體是AI應(yīng)用的最主流形態(tài),即將迎來(lái)爆發(fā)點(diǎn)。
消除幻覺(jué)的一個(gè)標(biāo)志性產(chǎn)品是百度自研的iRAG,將百度搜索的億級(jí)圖片資源跟強(qiáng)大的基礎(chǔ)模型能力相結(jié)合,沒(méi)有了幻覺(jué),少了AI味兒。比如車企可以用iRAG生成宣傳海報(bào),還原真實(shí)的車型,再也不用畫(huà)幾十萬(wàn)去拍攝了。再比如馬斯克在故宮旅游,不僅馬斯克和故宮都能精準(zhǔn)呈現(xiàn),還能將人與場(chǎng)景非常自然地融合在一起。
作為國(guó)內(nèi)大模型和生成式AI參與國(guó)際競(jìng)爭(zhēng)的種子選手,百度在AI領(lǐng)域的進(jìn)展值得關(guān)注。11月12日的百度世界大會(huì)上,李彥宏就重點(diǎn)介紹了百度大模型和生成式AI的當(dāng)下進(jìn)展以及未來(lái)空間。
陡峭增長(zhǎng),日調(diào)用量超15億
北京上班的小徐,最近嘗到了AI的甜頭。因公司設(shè)計(jì)人員不多,且集中精力備戰(zhàn)雙十一,給領(lǐng)導(dǎo)做PPT的任務(wù)就落在他頭上?伤簧瞄L(zhǎng)文字工作,制作PPT是短板,心里犯怵。經(jīng)同事點(diǎn)撥,他知道了百度文庫(kù)可以一鍵生成PPT,將發(fā)言稿全文上傳后,就能生成個(gè)七七八八,再更換下配圖、調(diào)整下文字圖片大小即可。這可幫了他大忙,接到領(lǐng)導(dǎo)這樣的任務(wù),他再也不擔(dān)心了。百度文庫(kù)的一鍵生成PPT功能背后正是百度文心大模型在發(fā)揮作用,小徐的每次使用,都需要調(diào)用一次大模型。除了制作PPT,用戶每一次在百度App搜索智能體,每一次在文心一言問(wèn)答,每一次用文心一言生成圖文都會(huì)調(diào)用文心大模型。除了C端用戶,B端企業(yè)用戶的數(shù)字人、智能客服等每一次服務(wù)用戶,也都會(huì)調(diào)用一次文心大模型。這個(gè)調(diào)用量規(guī)模有多大呢?
李彥宏透露,截至11月初,百度文心大模型的日均調(diào)用量超15億。這足以表明大模型已經(jīng)深入用戶日常生活。更值得關(guān)注的是,日調(diào)用量增長(zhǎng)的速度。李彥宏表示,百度內(nèi)部曾討論大模型的未來(lái),“怎么才叫成了”。他當(dāng)時(shí)說(shuō),如果文心一言大模型日均API調(diào)用量,一年之內(nèi)漲10倍,從今年5月初的2億到明年5月漲到20億,就認(rèn)為成了。因?yàn)檫@說(shuō)明,大家是真的需要。而目前,僅半年過(guò)去,就超過(guò)15億,逼近20億,這條超出百度預(yù)期的陡峭增長(zhǎng)曲線,正是中國(guó)大模型應(yīng)用大爆發(fā)的縮影。此外,文心一言用戶規(guī)模達(dá)到4.3億。AI從量變迎來(lái)了質(zhì)量時(shí)刻。
AI需求側(cè)的爆發(fā)式增長(zhǎng),離不開(kāi)供給側(cè)的持續(xù)迭代。比如,百度研發(fā)了“理解檢索生成”協(xié)同優(yōu)化的檢索增強(qiáng)技術(shù)。檢索增強(qiáng)是大模型去幻覺(jué),增強(qiáng)答案可靠性的主要路徑,即用海量搜索信息指導(dǎo)內(nèi)容生產(chǎn),提高準(zhǔn)確度。再比如,服務(wù)程序員的智能代碼助手文心快碼升級(jí)至3.0版本,不僅功能開(kāi)發(fā)、代碼測(cè)試、問(wèn)題修復(fù)等能力有所提升,還能實(shí)現(xiàn)多個(gè)智能體流水線協(xié)同,進(jìn)一步提升程序員工作成效。面向產(chǎn)業(yè)端,百度構(gòu)建了文心大模型矩陣,包括ERNIE 4.0 Turbo等旗艦大模型、ERNIE Speed等輕量模型,以及基于基礎(chǔ)模型生產(chǎn)的系列思考模型和場(chǎng)景模型,滿足不同應(yīng)用的需要。當(dāng)然,這更離不開(kāi)百度AI先人一步出發(fā)。ALL in AI到李彥宏獲評(píng)AI先生,百度幾乎是國(guó)內(nèi)唯一持續(xù)多年在AI領(lǐng)域做投入、開(kāi)源、人才培養(yǎng)、生態(tài)共建的企業(yè)。10多年來(lái),百度為人工智能和自動(dòng)駕駛研發(fā)投入超過(guò)1700億,聘請(qǐng)2024物理諾獎(jiǎng)得主辛頓、吳恩達(dá)、Dario Amodei等全球科技領(lǐng)軍人物,使得百度在大模型領(lǐng)域成為真正的扛旗者。
打開(kāi)多個(gè)增長(zhǎng)通道
AI正在重塑百度。除了大眾知道的百度將旗下產(chǎn)品全部AI化以外,文心大模型還在至少三個(gè)維度為百度提供新的增長(zhǎng)動(dòng)力,由內(nèi)到外改變這家公司。
一是智能體。這被李彥宏看作是AI原生時(shí)代,融合內(nèi)容、信息、服務(wù)的新載體,類似PC時(shí)代的官網(wǎng),移動(dòng)時(shí)代的自媒體賬號(hào)。與智能體緊密相關(guān)的是百度的搜索業(yè)務(wù),以前用戶百度搜索之后的結(jié)果頁(yè)是官網(wǎng)或者其他SEO之后的內(nèi)容,如今得到的更大概率會(huì)是智能體。
有何區(qū)別呢?以往,用戶在百度App搜索比亞迪,通過(guò)首個(gè)結(jié)果進(jìn)入比亞迪官網(wǎng),自主瀏覽、查看,F(xiàn)在,搜索結(jié)果第一條是比亞迪智能體,變成了一個(gè)類似生成式AI的互動(dòng)界面。用戶可以問(wèn)某款車型信息,多款車型對(duì)比,或者線下門(mén)店信息等,智能體可第一時(shí)間生成答案,告知用戶。這種模式下,品牌與用戶的鏈接更精準(zhǔn)、高效。
在百度看來(lái),搜索是智能體最大分發(fā)入口,智能體的爆發(fā)會(huì)使搜索成為AI時(shí)代的第一入口。數(shù)據(jù)顯示,截至2024年11月,百度文心智能體平臺(tái)已經(jīng)吸引了15萬(wàn)家企業(yè)、80萬(wàn)名開(kāi)發(fā)者入駐。
越來(lái)越多的智能體出現(xiàn),將徹底改變?cè)械乃阉黧w驗(yàn),為百度賴以起家的搜索業(yè)務(wù)帶來(lái)新的合作模式、盈利模式,打開(kāi)新的增長(zhǎng)通道。
二是百度智能云。近幾個(gè)季度,百度智能云營(yíng)收增長(zhǎng)強(qiáng)勁、持續(xù)盈利,正是與大模型綁定的結(jié)果。因?yàn)榇竽P,解決了企業(yè)客戶在AI時(shí)代的需求,帶動(dòng)了模型構(gòu)建、算力消耗、接口調(diào)用等需求,并幫助企業(yè)客戶催生了AI原生應(yīng)用。
最初,云服務(wù)是解決企業(yè)客戶信息化、數(shù)字化的成本問(wèn)題、效率問(wèn)題,更多屬于CTO決策的范疇。后來(lái),各個(gè)云服務(wù)廠商增加了行業(yè)解決方案,將云服務(wù)深入到企業(yè)經(jīng)營(yíng)管理各方面,涵蓋了生產(chǎn)、銷售、服務(wù)、管理等多個(gè)環(huán)節(jié),幫助CEO解決問(wèn)題。
在AI原生時(shí)代,企業(yè)客戶迫切需要借助大模型工具,實(shí)現(xiàn)自身業(yè)務(wù)的重構(gòu)。文心大模型與百度智能云結(jié)合,讓企業(yè)客戶應(yīng)用AI、大模型的門(mén)檻降低,不僅僅是成本,還包括人員組織等多維度。
為實(shí)現(xiàn)這一步,百度在文心大模型旗艦版的3.5和4.0版本基礎(chǔ)上,推出了5款輕量級(jí)/特定模型、AI原生應(yīng)用開(kāi)發(fā)工具AppBuilder等,幫助企業(yè)更低門(mén)檻、更高性價(jià)比的進(jìn)入AI原生時(shí)代。
目前。百度智能云千帆大模型平臺(tái)已幫助客戶精調(diào)了3.3萬(wàn)個(gè)模型、開(kāi)發(fā)了77萬(wàn)個(gè)企業(yè)應(yīng)用。百度智能云也成為中國(guó)最大的大模型產(chǎn)業(yè)落地云,60%以上的央企,以及大量的民營(yíng)企業(yè),都在聯(lián)合百度智能云進(jìn)行AI創(chuàng)新。
三是自動(dòng)駕駛。自動(dòng)駕駛是百度面向未來(lái),需要長(zhǎng)期培養(yǎng)的增長(zhǎng)點(diǎn)。在大模型的加持下,百度自動(dòng)駕駛技術(shù)迭代更快,商業(yè)空間更大。今年,百度Apollo發(fā)布了支持L4級(jí)自動(dòng)駕駛的大模型Apollo ADFM(Autonomous Driving Foundation Model),可以兼顧技術(shù)的安全性和泛化性,做到安全性高于人類駕駛員10倍以上,實(shí)現(xiàn)城市級(jí)全域復(fù)雜場(chǎng)景落地。
門(mén)檻越低,商業(yè)版圖越大
縱觀百度大模型近兩年發(fā)展,明顯朝著“上天”“入地”兩個(gè)方向發(fā)展。
“上天”是不斷優(yōu)化大模型技術(shù),持續(xù)迭代,提高競(jìng)爭(zhēng)壁壘。不論從專利數(shù)量還是應(yīng)用規(guī)模,百度在大模型領(lǐng)域都走在全球第一梯隊(duì)。前不久,沙利文發(fā)布的《2024年全球AI生態(tài)全景概覽》中,百度與谷歌、OpenAI等位于AI-Native Giant(AI巨頭)同一序列。
“入地”是百度在不斷降低大模型應(yīng)用成本和門(mén)檻,讓更多人觸手可及。除了各種開(kāi)放平臺(tái)、開(kāi)發(fā)工具,百度還親自下場(chǎng),為高校、企業(yè)培養(yǎng)了數(shù)百萬(wàn)的AI人才,讓AI普及的速度越來(lái)越快。
本次百度世界大會(huì)再次體現(xiàn)了這兩點(diǎn)。李彥宏在會(huì)上發(fā)布了兩項(xiàng)新技術(shù)。
一是iRAG技術(shù);仡欉^(guò)去兩年,李彥宏認(rèn)為,文字層面的RAG(檢索增強(qiáng)生產(chǎn))已經(jīng)做得很好基本讓大模型消除了幻覺(jué),即用戶跟大模型一問(wèn)一答,大概率能得到用戶想要的答案。
但在圖像等多模態(tài)方面,還存在較大幻覺(jué),比如讓大模型生成一張某歷史人物在某景點(diǎn)的照片,還是存在“一眼假”的情況。要么是事實(shí)性錯(cuò)誤,如人物張冠李戴,要么是畫(huà)質(zhì)“機(jī)器味兒”太重,缺乏真實(shí)感。
針對(duì)于此,百度開(kāi)發(fā)了檢索增強(qiáng)的文生圖技術(shù)iRAG(image based RAG),將百度搜索的億級(jí)圖片資源跟基礎(chǔ)模型能力相結(jié)合,可生成超真實(shí)的圖片。這項(xiàng)技術(shù)擁有廣泛應(yīng)用場(chǎng)景,比如過(guò)往汽車品牌要拍一組海報(bào)大片,動(dòng)輒要大幾十萬(wàn),應(yīng)用百度iRAG,可立刻生成,且成本幾乎等于零。
這是百度不斷“上天”,向技術(shù)高峰攀爬的行動(dòng)。當(dāng)天,李彥宏還重點(diǎn)介紹了計(jì)劃明年一季度上線的無(wú)代碼工具“秒噠”,是百度不斷降低大模型門(mén)檻,“入地”的體現(xiàn)。
“秒噠”可以說(shuō),滿足了大多數(shù)人對(duì)于大模型和生成式AI應(yīng)用的想象,即不需要懂編程,只需要說(shuō)出想法,AI就能實(shí)現(xiàn)和生產(chǎn)所需要的應(yīng)用。
具體如何實(shí)現(xiàn)?用戶只需對(duì)準(zhǔn)秒噠用中文描述需求,如需要搭建一場(chǎng)活動(dòng)的在線報(bào)名系統(tǒng),并上傳活動(dòng)時(shí)間、地點(diǎn)等信息。之后,秒噠會(huì)自動(dòng)調(diào)取多個(gè)智能體、多個(gè)工具,實(shí)現(xiàn)程序的開(kāi)發(fā)、BUG檢查、視覺(jué)設(shè)計(jì)等工作,完成報(bào)名系統(tǒng)的開(kāi)發(fā)。也就是說(shuō),只要有想法,你就可以心想事成,這也將迎來(lái)一個(gè)前所未有的只靠想法就能賺錢的時(shí)代點(diǎn)子時(shí)代。
當(dāng)一個(gè)復(fù)雜的事務(wù)變得簡(jiǎn)單化,將是其走向千家萬(wàn)戶,占領(lǐng)大眾市場(chǎng)的開(kāi)始。比如微軟的可視化桌面系統(tǒng)取代Dos系統(tǒng),讓普通人可以使用原本復(fù)雜的計(jì)算機(jī)。而“秒噠”的落地,意味著將開(kāi)啟一個(gè)全新的點(diǎn)子時(shí)代,這才是AI真正的價(jià)值所在。
“秒噠”正是這樣一個(gè)工具,讓每個(gè)人都變成程序員,將極大提高AI原生應(yīng)用的生成效率,帶來(lái)更多智能體,進(jìn)一步繁榮AI生態(tài)。而百度作為這一生態(tài)的主要?jiǎng)?chuàng)建者,未來(lái)的獲益無(wú)需多言。
【結(jié)束語(yǔ)】作為全世界最成功的快消品之一,可口可樂(lè)的成功有其獨(dú)特配方、成功的營(yíng)銷,還有重要的一條,即建立了全球最大的飲料分銷系統(tǒng)。2019年其已在200多個(gè)國(guó)家建立超30000萬(wàn)個(gè)銷售網(wǎng)點(diǎn),覆蓋了全球約60%的零售店。這樣的結(jié)局是,世界各地的人們觸手可得可口可樂(lè)。當(dāng)前的百度正在做類似的事情,將大模型和生成式AI送到普通人手里,讓大模型觸手可得。AI的普及和商業(yè)化自此打開(kāi),百度更廣闊的未來(lái)世界也被打開(kāi)。冷眼旁觀 麻辣點(diǎn)評(píng) 深入分析