劃重點
01百度智能云的曦靈數(shù)字人產(chǎn)品迎來4.0升級,降低制作成本和門檻,使更多企業(yè)能夠利用數(shù)字人實現(xiàn)提效增收。
02曦靈數(shù)字人4.0解決了傳統(tǒng)2D數(shù)字人動作僵硬的問題,提升對話互動自然程度,支持多種語言切換。
03除此之外,數(shù)字人正化身千行百業(yè)數(shù)字員工,在金融、文旅等領(lǐng)域得到廣泛應(yīng)用,提升業(yè)務(wù)處理效率與客戶體驗。
04隨著數(shù)字人技術(shù)的持續(xù)演進(jìn),百度智能云曦靈數(shù)字人在更多場景落地應(yīng)用,推動產(chǎn)業(yè)落地先鋒的發(fā)展。
05IDC預(yù)計到2026年中國AI數(shù)字人市場規(guī)模將達(dá)到102.4億元人民幣,百度智能云曦靈等產(chǎn)品團(tuán)隊正努力推進(jìn)標(biāo)準(zhǔn)化SaaS產(chǎn)品和行業(yè)客戶的項目簽約。
以上內(nèi)容由騰訊混元大模型生成,僅供參考
3D數(shù)字人的價格已經(jīng)從過去的幾萬元,降到現(xiàn)在的199元。
文|徐鑫
編|任曉漁
你可能不知道,自己正在接觸的是數(shù)字人。
許多人對數(shù)字人的印象還停留在形象展示階段。線下大屏上,一個真人形象向大眾介紹產(chǎn)品或者互動,體驗不佳,表現(xiàn)也略顯僵硬,且制作成本高昂。
但過去一年多的時間里,大模型的出現(xiàn),為數(shù)字人產(chǎn)業(yè)帶去了更多可能性。一些廠商把數(shù)字人列為大模型應(yīng)用落地的前沿陣地,國內(nèi)的數(shù)字人賽道先鋒企業(yè)產(chǎn)品也在以季為單位加速迭代。
數(shù)字人的技術(shù)不斷升級。一方面,數(shù)字人在人像、聲音和語言上的表現(xiàn)力一步步在提升。另一方面,數(shù)字人的制作成本和門檻在大幅降低,效率快速提高。
以百度智能云的曦靈數(shù)字人為例,百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖介紹,基于百舸和千帆兩大業(yè)界領(lǐng)先技術(shù)的支撐,“客戶只需用過去百分之一的成本,分鐘級就能輕松創(chuàng)作出屬于自己的數(shù)字人作品。”
技術(shù)進(jìn)步帶來普惠紅利,更多企業(yè)級場景正解鎖數(shù)字人。沈抖介紹,目前,曦靈數(shù)字人平臺已經(jīng)有形象成熟、種類豐富的各類數(shù)字人,覆蓋文旅、電商、金融等各大行業(yè)場景。越來越多企業(yè)利用數(shù)字人實現(xiàn)提效增收,收獲業(yè)務(wù)價值。
而隨著企業(yè)應(yīng)用數(shù)字人的深入,不同企業(yè)對數(shù)字人的需求模式也在分層,廠商們圍繞著數(shù)字人產(chǎn)品的商業(yè)模式和打法策略也在更新。百度智能云的曦靈數(shù)字人團(tuán)隊介紹,今年他們將重點推進(jìn)公有云平臺的數(shù)字人調(diào)用,而標(biāo)準(zhǔn)化SaaS產(chǎn)品和行業(yè)客戶的項目簽約有望形成良性循環(huán)。
01
以季為單位上新,持續(xù)降低數(shù)字人落地門檻
數(shù)字人正在成為大模型落地的最熱門場景之一。
去年下半年以來廠商們在加速探索大模型落地行業(yè)的路徑,數(shù)字人被不少廠商視作了先鋒場景。進(jìn)入今年,多家平臺廠商展示大模型與垂直行業(yè)結(jié)合案例時數(shù)字人都被列為了重點應(yīng)用。
國內(nèi)最早發(fā)布大模型并開啟行業(yè)應(yīng)用探索的百度,也在這一領(lǐng)域傾注了大量資源。今天舉辦的百度云智大會上,曦靈數(shù)字人迎來4.0升級,這也是這款產(chǎn)品今年以來的第三次發(fā)布更新。
這次更新主要圍繞著能力提升、制作門檻下降、效率和成本優(yōu)化三大維度進(jìn)行。
在能力升級上,沈抖介紹,曦靈4.0解決了傳統(tǒng)2D數(shù)字人動作僵硬的問題,可以實現(xiàn)人物在不同角度、形體、表情的高度一致,即使是面部微表情也非常逼真、自然。
為此,曦靈團(tuán)隊進(jìn)行了專項開發(fā),百度智能云數(shù)字人產(chǎn)品部總經(jīng)理張裕翔介紹,他們獨創(chuàng)口型匹配算法,使得數(shù)字人講話時口型更契合表達(dá)內(nèi)容。為提升對話互動自然程度,它們引入了聆聽?wèi)B(tài)設(shè)計,并通過前置小模型在對話間隙智能插入引導(dǎo)詞,顯著提升了回復(fù)的即時性與互動性。
在制作門檻上,曦靈數(shù)字人4.0也進(jìn)一步簡化對用戶輸入素材的要求。以3D數(shù)字人為例,現(xiàn)在用戶只需輸入一段簡單的文字描述,就可以快速生成不同妝造、不同行業(yè)特色的3D數(shù)字人形象和視頻。
在制作效率與成本優(yōu)化層面,數(shù)字人的生成時長現(xiàn)在降低到了分鐘級水平。行業(yè)觀察到,6月的那次更新升級,曦靈2D數(shù)字人的生成時長就已經(jīng)從3~7天降到小時級。
而成本層面,企業(yè)獲得數(shù)字人的價格也在下降。6月曦靈數(shù)字人更新發(fā)布時,將3D超寫實數(shù)字人的價格門檻從十萬級別降到萬元水平。今天升級后,3D超寫實數(shù)字人的價格從萬元繼續(xù)下探,大幅降價至199元,達(dá)到業(yè)內(nèi)最低價。這對數(shù)字人行業(yè)無疑又是一顆重磅炸彈。
業(yè)界觀察到,今年以來,曦靈數(shù)字人以季為單位快速迭代更新,重點圍繞著長期困擾數(shù)字人行業(yè)落地的幾大難題展開。本次4.0版本更新也延續(xù)了百度曦靈數(shù)字人“高可用,高性價比”的核心理念,意在進(jìn)一步降低數(shù)字人的使用門檻與成本。
實際上這也是此前行業(yè)的共同發(fā)力方向。IDC告訴數(shù)智前線,AI數(shù)字人技術(shù)使用的平民化正成為市場關(guān)注的重點,如何通過相關(guān)技術(shù)降低產(chǎn)品的使用和成本門檻將成為未來競爭的關(guān)鍵因素之一。
作為國內(nèi)數(shù)字人賽道里的老玩家,百度智能云的曦靈團(tuán)隊對數(shù)字人的理解是要能夠替代真人,并在一些領(lǐng)域超過真人。百度智能云數(shù)字人產(chǎn)品部總經(jīng)理張裕翔解釋稱,只有性能表現(xiàn)上超過真人,數(shù)字人才能解鎖更多的行業(yè)場景,被更廣泛地用起來。
他介紹,得益于過去6年,百度在數(shù)字人領(lǐng)域持續(xù)深耕,積累了海量、高質(zhì)量數(shù)據(jù),目前曦靈數(shù)字人在人像、聲音和語言能力多個維度,已經(jīng)能做到真人無法做到的事。
比如,以人像為例,真人依賴當(dāng)前環(huán)境里的燈光、妝造,而基于曦靈數(shù)字人平臺,在去還原真人時,可以在視頻里給形象做一些提升,類似直播的修圖瘦臉功能。
在聲音方面,普通人日常口語表達(dá)中有非常多的頓挫和卡頓,但數(shù)字人卻可以做到流暢自然、語調(diào)平穩(wěn)且有抑揚頓挫感。而在語言表達(dá)能力上,數(shù)字人的多語言切換能力也突破了真人的能力限制,能輕松解鎖多國語言。
“2D數(shù)字人能打破真人的時間、空間和能力局限性,替代真人出鏡,效果表現(xiàn)全面超越真人,這是接下來在2D數(shù)字人領(lǐng)域,大家共同努力的方向。”張裕翔說。
02
企業(yè)應(yīng)用數(shù)字人的方式,正在發(fā)生變化
經(jīng)過一年多的發(fā)展,大模型技術(shù)賦能數(shù)字人,也給數(shù)字人市場帶來了新的可能性。
首先是,隨著數(shù)字人能力升級,數(shù)字人正在解鎖更多的應(yīng)用場景。
“在人像和聲音之外,大模型給數(shù)字人帶來的語言能力,幫我們帶來了更多可能。”張裕翔所帶領(lǐng)的曦靈團(tuán)隊在數(shù)字人賽道的落地經(jīng)驗超過五年,觀察了上千家企業(yè)客戶的應(yīng)用情況。他看到,大模型賦能下,許多原來不可想象的場景里,數(shù)字人有了很廣泛應(yīng)用。
典型的是直播場景,大模型能力加持,可以生成數(shù)字人的直播腳本,數(shù)字人能夠基于商品的內(nèi)容信息實時講解,也能完成對商品信息的實時問答,同時7x24小時,穩(wěn)定且高效。又比如多語言能力的加持,數(shù)字人可以靈活切換語種,可以一套內(nèi)容面向全球的媒體和客戶發(fā)布,給跨境電商、外貿(mào)業(yè)務(wù)增添便利。“一個能力點的突破之后它就能開啟更多可能”,張裕翔說。
其次,隨著技術(shù)進(jìn)步、可獲得門檻的降低,數(shù)字人進(jìn)入到更多行業(yè),不同的企業(yè)對數(shù)字人能力的需求點出現(xiàn)了分化。
“千行百業(yè)對數(shù)字人技術(shù)的應(yīng)用要求各有不同”,張裕翔他們收到了非常多樣化的客戶反潰比如,一位傳媒行業(yè)人士感興趣的是,數(shù)字人平臺能不能高清晰的克隆本人聲音,可以輸出高清晰的視頻;而在教育場景,數(shù)字人老師是否能基于學(xué)生的學(xué)習(xí)能力和此前的知識點掌握程度,給出不一樣的答案和講解。
這也是在呼喚數(shù)字人技術(shù)服務(wù)商能夠系統(tǒng)梳理各項能力,將不同的能力板塊解耦,從而適應(yīng)和滿足市場的多樣化需求。一些先鋒企業(yè)也順應(yīng)市場,將數(shù)字人能力沉淀到開放平臺,實現(xiàn)靈活的組件式調(diào)用。
以百度智能云的曦靈數(shù)字人為例,今年7月,曦靈數(shù)字人開放平臺上架,將標(biāo)準(zhǔn)化的能力分拆為靈活的組件,供行業(yè)用戶調(diào)用。比如人像的定制克壟聲音定制克壟對話交互場景、在各個端的渲染能力、數(shù)字人視頻的制作和直播等能力都能方便被調(diào)用。
這一開放平臺的能力也受到了市場的熱烈歡迎。“上線后,每周都有上百家客戶的試用,對于數(shù)字人的應(yīng)用場景也遠(yuǎn)超預(yù)期”,張裕翔認(rèn)為,這反映出數(shù)字人企業(yè)級應(yīng)用市場的多樣化蓬勃需求,也意味著企業(yè)應(yīng)用數(shù)字人正在逐步深入。
由此,數(shù)字人市場的服務(wù)模式也隨之演進(jìn)更新。幾年前行業(yè)里數(shù)字人服務(wù)以大型定制項目為主,隨著數(shù)字人技術(shù)的規(guī);瘡(fù)制能力提升,平臺們開始將數(shù)字人能力沉淀為標(biāo)準(zhǔn)化的SaaS產(chǎn)品。而隨著越來越多行業(yè)用起來,企業(yè)的需求分化,又多了靈活的組件式調(diào)用方式。
而開箱即用的SaaS平臺、高效易集成的組件平臺,以及為頭部客戶量身定制的行業(yè)級解決方案,也是目前百度曦靈數(shù)字人服務(wù)行業(yè)客戶的三種形態(tài)。
“組件式合作更適合行業(yè)用戶,它們能通過這些易集成的組件,把數(shù)字人能力接入到自己的系統(tǒng)和應(yīng)用里。目前行業(yè)主流調(diào)用模式以組件式為主,SaaS能夠覆蓋的場景更偏于通用場景。"張裕翔介紹其中的差別。
他認(rèn)為,數(shù)字人是表現(xiàn)層,進(jìn)入行業(yè)能用好還需要與行業(yè)的垂直領(lǐng)域去結(jié)合,涉及到行業(yè)know-how和深度的場景知識。
比如,在教育場景里,老師在線上課的時候,可能有個數(shù)字人入口,哪里不明白了,戳一下,數(shù)字人老師能基于知識點和學(xué)生的情況,一對一溝通和互動。
要實現(xiàn)這一點,就需要調(diào)用數(shù)字人開放平臺能力,與教育行業(yè)的伙伴共建,把數(shù)字人能力與企業(yè)現(xiàn)有的課程系統(tǒng)和學(xué)生管理系統(tǒng)聯(lián)通起來。這又涉及到產(chǎn)業(yè)分工,需要與教育行業(yè)的伙伴共建,才能把數(shù)字人能力真正在場景里用好。
03
數(shù)字人正化身千行百業(yè)數(shù)字員工
隨著數(shù)字人能力持續(xù)升級,應(yīng)用門檻持續(xù)降低,企業(yè)獲得數(shù)字人服務(wù)的方式變得更加靈活,百度智能云的曦靈數(shù)字人也加速在更多場景里落地應(yīng)用。
“原來的數(shù)字人項目周期特別長,現(xiàn)在從試用到真正運轉(zhuǎn)起來,一兩天就搞定了。企業(yè)編程力強(qiáng)一點的話,半天就上手看到效果。”張裕翔觀察,許多企業(yè)能利用曦靈更方便看清數(shù)字人的效果和業(yè)務(wù)價值。
IDC中國研究經(jīng)理程蔭也告訴數(shù)智前線,當(dāng)下,企業(yè)對于AI數(shù)字人的應(yīng)用主要出于創(chuàng)新業(yè)務(wù)和幫助企業(yè)提效增收考量。數(shù)字人價值最明顯的領(lǐng)域在直播帶貨、數(shù)字人客服、虛擬主播等場景,ROI較好測算,其他場景下帶來的價值不好測算是技術(shù)落地面臨的挑戰(zhàn)之一。
張裕翔則認(rèn)為,要更全面看待數(shù)字人的價值,ROI指標(biāo)更偏向用于一些投放和廣告營銷場景里的數(shù)字人效果指標(biāo)測算,關(guān)鍵要看這項技術(shù)在企業(yè)里有沒有真正被用起來。
目前,在投放和廣告營銷場景等場景里,百度智能云的曦靈數(shù)字人正在扮演導(dǎo)購角色,增強(qiáng)內(nèi)容的吸引力與互動性,顯著加速了營銷視頻的創(chuàng)作流程和降低成本。生成效率層面,曦靈數(shù)字人將傳統(tǒng)2.5天的制作周期銳減至0.5天,這為商家贏得了寶貴的市場先機(jī)。同時數(shù)字人還能大大降低了拍攝成本,在一線城市里,真人演員的單日花費最低也要1500~2000元。
用戶上傳的素材還能用于批量生成多條視頻,平攤到每一條成本變得更低。“一些銷售場景,廣告素材的生產(chǎn)成本大概降低到了1/3水平。”
除了廣告營銷場景,數(shù)字人扮演的數(shù)字員工,也在金融行業(yè)里有大量落地。數(shù)智前線獲悉,不少頭部銀行正在利用百度曦靈數(shù)字人入駐營業(yè)廳,高效接管許多傳統(tǒng)依賴于線下網(wǎng)點營業(yè)員的工作任務(wù),極大地提升了業(yè)務(wù)處理效率與客戶體驗。線下網(wǎng)點就不用配備更多的網(wǎng)點營業(yè)員,算上全國的網(wǎng)點數(shù)量,節(jié)省的成本數(shù)額非?捎^。
“銀行場景下數(shù)字人技術(shù)驅(qū)動的數(shù)字員工運營平臺,能真正提供數(shù)字員工運營能力,大幅解放員工的精力。”張裕翔說,在這個場景里數(shù)字人已經(jīng)真正被深入用起來了。目前,曦靈數(shù)字人在18家頭部銀行覆蓋率達(dá)50%,“產(chǎn)品復(fù)購率高,很多客戶都已經(jīng)做到三四期甚至五期階段,每年都在迭代產(chǎn)品”。
也有些場景不適合用ROI測算,典型的有文旅領(lǐng)域。一些地區(qū)在利用百度數(shù)字人打造的地方歷史名人,以生成的IP形式再現(xiàn),在文旅景點與游客互動,扮演電子導(dǎo)覽的角色。但業(yè)界認(rèn)為,不應(yīng)單純從數(shù)字上來衡量其產(chǎn)生的價值。它能帶來更豐富的旅游體驗,讓歷史文化以更加親近大眾、互動性更好的方式得到傳承。未來隨著數(shù)字人能力持續(xù)演進(jìn),它發(fā)揮的作用將進(jìn)一步呈現(xiàn)和釋放。
可以說,隨著數(shù)字人在越來越多企業(yè)級場景里扮演數(shù)字員工,算得清ROI和業(yè)務(wù)價值賬的場景越來越多,數(shù)字人應(yīng)用市場也在逐步打開。IDC預(yù)計,到2026年中國AI數(shù)字人市場規(guī)模將達(dá)到102.4億元人民幣。
市場從起步走向成熟,百度智能云曦靈這樣的產(chǎn)品團(tuán)隊已經(jīng)開始沉淀體系化的打法。
張裕翔介紹,此前公有云產(chǎn)品收入在曦靈數(shù)字人的整體營收里比重不高,占大頭的是政企頭部企業(yè)的合作項目,現(xiàn)在,他們開始更加重視公有云上的營收增長。
“以前能力都沉淀在項目里的,今年我們要把它全面產(chǎn)品化。能力和技術(shù)水平做到領(lǐng)先的,再跟進(jìn)應(yīng)用產(chǎn)品的功能場景覆蓋。”張裕翔說。
這里面,不同的產(chǎn)品模式,正有望形成良性的聯(lián)動過去的項目沉淀積累的收入,正支撐公有云標(biāo)準(zhǔn)化產(chǎn)品的發(fā)展,而從公有云發(fā)展帶來的能力,又能更好推進(jìn)項目的簽約。
04
產(chǎn)業(yè)落地先鋒如何煉成
目前,百度智能的云曦靈數(shù)字人作為大模型落地產(chǎn)業(yè)的典型應(yīng)用場景,已經(jīng)在文旅、電商、金融等各大行業(yè)場景里得到了落地應(yīng)用,并且應(yīng)用廣度和深度都在往前邁進(jìn)。這也是百度的大模型技術(shù)進(jìn)入產(chǎn)業(yè)現(xiàn)場的縮影。
過去一年,大模型正加速從技術(shù)變革推進(jìn)產(chǎn)業(yè)變革。數(shù)據(jù)顯示,今年1~8月,國內(nèi)大模型中標(biāo)項目數(shù)量已經(jīng)達(dá)到2023年全年數(shù)量的5倍,中標(biāo)金額達(dá)到去年全年的2倍。這里面頭部大模型廠商的角色依然很突出,百度在大模型中標(biāo)項目數(shù)量、中標(biāo)金額、覆蓋行業(yè)以及覆蓋央國企數(shù)量,四個關(guān)鍵指標(biāo)上排名第一。
產(chǎn)業(yè)落地的快速推進(jìn)離不開新一代基礎(chǔ)設(shè)施的支撐。圍繞著大模型的產(chǎn)業(yè)落地,百度智能云正在形成全棧的基礎(chǔ)設(shè)施底座。
算力層面,大模型龐大的訓(xùn)練需求下,需要的集群規(guī)模越來越大,如何實現(xiàn)對GPU高效穩(wěn)定的管理,從而降低大模型的訓(xùn)練和推理成本,備受行業(yè)關(guān)注。今天的云智大會上,百度智能云推出了百舸4.0版本升級。升級后的百舸,圍繞落地大模型全旅程的算力需求,在集群創(chuàng)建、開發(fā)實驗、模型訓(xùn)練、模型推理四大方面,為企業(yè)提供“多、快、穩(wěn)、省”的AI基礎(chǔ)設(shè)施。
大模型應(yīng)用的爆發(fā),離不開便捷、高效的大模型工具鏈和應(yīng)用開發(fā)平臺。為滿足企業(yè)在大模型產(chǎn)業(yè)落地的需求,今天,千帆大模型平臺也在模型開發(fā)層、模型服務(wù)層、應(yīng)用開發(fā)層上全面升級。
升級后的千帆3.0,正進(jìn)一步降低企業(yè)級應(yīng)用開發(fā)門檻,同時提供更豐富的大小模型覆蓋更多行業(yè)場景,同時提供更完善的大模型工具鏈,幫助企業(yè)實現(xiàn)一站式的大、小模型開發(fā)服務(wù)。
在今天召開的百度云智大會上,百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖對曦靈數(shù)字人、智能客服“客悅”和文心快碼三款產(chǎn)品進(jìn)行重磅升級,面向企業(yè),這也是百度基于基礎(chǔ)設(shè)施上搭建的AI產(chǎn)品樣板間,他認(rèn)為,只有親自走過用戶要走的路,才能設(shè)計出更懂用戶的產(chǎn)品。
大模型進(jìn)入千行百業(yè)是一個龐大系統(tǒng)工程,圍繞著算力基礎(chǔ)設(shè)施、算法訓(xùn)練和優(yōu)化、行業(yè)場景、數(shù)據(jù)準(zhǔn)備和治理以及落地部署等方方面面的工作,模型廠商和應(yīng)用企業(yè)及模型生態(tài)服務(wù)企業(yè)在持續(xù)發(fā)力,為產(chǎn)業(yè)應(yīng)用加速。
而本次云智大會的一系列重磅產(chǎn)品升級更新,無疑也是這股浪潮里的一個重要注腳。