所幸仍有人愿意埋頭做些“臟活、苦活、累活”,讓一項新興技術普惠真正大眾的時間,來得更早了一些。
2024年9月,整個大模型產業(yè),來到了一個微妙的時間窗口。
一方面,是海外AI明星項目的接連“換血”與“賣身”。
Runway深陷“刪庫跑路”風波;Stability AI在管理層大換血后再傳資金鏈斷裂消息;Character.AI以縮水50%的估值賣身谷歌;Inflection與Adept相繼被微軟與亞馬遜收入囊中;Reka AI則仍在尋找買家。
可另一方面,卻是AI大模型應用的探索全面鋪開。
在C端,以內容創(chuàng)作、辦公助理、圖像生成為首的To C應用席卷市場,AI會議、AI音樂、AI短劇、AI PPT等新興應用層出不窮,Sora的火熱更是催生了一大批AI視頻應用緊鑼密鼓地集中亮相。
在B端,“百模大戰(zhàn)”與“Token價格戰(zhàn)”連番上演,實打實地沖開了一片廣袤的市場;兩年前,GPT 3.5每百萬Token的價格約為60美元,而今天,Gemini Flash只需要0.05美元。在企業(yè)降本增效的永恒需求下,AI大模型在智能客服、智能營銷、知識問答等場景中的應用開始看到可量化的效果。
在同程旅行上,大模型為用戶解答關于酒店預定、退改、查詢等問題,很大程度上降低了客詢轉人工率;
在易車APP上,AI解讀、AI對比問答和AI搜索3D等能力正在提升用戶獲取信息的效率。這背后,是大模型加速訓練技術支撐,讓模型迭代周期加快了30%;
在邁瑞醫(yī)療產品的臨床應用中,大模型能夠讓重癥科醫(yī)生病情應答快至5秒,大幅提升醫(yī)療效率,真正做到“從病魔的手里搶時間”;
在工業(yè)富聯的產線上,大模型開始參與工業(yè)質檢、企業(yè)知識管理、產線助手、安全質量檢測、生產效率分析;
在中信百信銀行,大模型技術開始落地到風險管控中,提升風控的質量和效率。
甚至在“打工人”高頻使用的騰訊會議APP中,AI都能自動生成文字轉錄、會議紀要、待辦事項。
就在今天,騰訊宣布,已經有超過700款產品接入了騰訊混元大模型。
700款產品是什么概念?
在2023年9月,這一數字大約為,50款。
這是毫無疑問的大模型場景應用爆發(fā)。
在2024騰訊全球數字生態(tài)大會上,騰訊發(fā)布了最新版的騰訊混元大模型Hunyuan-Turbo。相較于上一代混元Pro MoE大模型,Turbo模型自研了萬億級分層異構MoE結構,不僅模型效果大幅提升,其訓練推理效率也提升了超過100%,并帶來了50%的推理部署成本下降。而Turbo版本的混元大模型,定價僅為前一代Pro版本的一半。
性能更強、價格更低,這是大模型是深入落地場景的前提。
走進場景的第一步:找到場景解決問題的第一步是,定義問題,而落地場景的第一步是,明確場景。
大模型的核心是NLP(自然語言處理)技術的突破,其對于大規(guī)模文本知識處理有著天然的優(yōu)勢;同時,在億級規(guī)模參數的密集訓練下,模型能夠捕捉到語言的復雜性和細微差別,也能通過融合知識圖譜等外部知識進行知識增強。另外,大模型擁有較強的泛化能力,可以通過自監(jiān)督學習的方法在大量無標注數據上進行訓練,也可以通過少量的任務特定數據進行微調。最后,以Stable Diffusion為首的技術突破也使得大模型在多模態(tài)內容創(chuàng)作生成上表現極佳。
抽取一下關鍵詞:知識密集、自然語言、泛化與小樣本、多模態(tài)內容創(chuàng)作。
順著大模型技術能力往下匹配,場景呼之欲出:知識管理、智能客服、研發(fā)提效、智能營銷、內容生成……
首先是智能客服與知識管理場景,由于大模型天生的NLP與知識密集屬性,使其能夠在處理大量自然語言場景時顯著提升復雜問題的解決效率,提升回答質量尤其在涉及高專業(yè)度、多復雜知識的領域。
以汽車售后服務為例,與一般的商品售后溝通不同,汽車售后客服是一個典型的高專業(yè)度場景,需要客服人員擁有復雜的汽車知識儲備,并能夠處理說明書、圖片、表格等眾多形式的客戶信息輸入,傳統(tǒng)客服機器人根本無法滿足客戶需求。
一個典型的案例是長安汽車,騰訊云告訴36氪,通過與長安汽車共創(chuàng),雙方利用大模型知識引擎整合汽車使用手冊等資料,有效解決了客戶在車輛使用和維護中的疑問,顯著提升了客戶服務體驗。
這是大模型知識管理能力在企業(yè)中“對外”的展現,其實“對內”亦然。
比如,在知識壁壘同樣極高的法律領域,曠真律所將4萬多份員工編撰的內部知識文檔導入到騰訊樂享中,形成了律所專屬的AI知識庫,員工能夠隨時通過樂享AI助手的分析與自然語言生成能力進行問答,根據員工調研顯示,對典型問答的AI回答滿意度高達93分,端到端問題準確率達91%。
早在今年5月,騰訊云就將大模型的這項技術沉淀下來,作為PaaS類產品大模型知識引擎發(fā)布。通過知識引擎,企業(yè)5分鐘就能開發(fā)出一款專用客服營銷、企業(yè)知識社區(qū)類知識服務應用。
騰訊云大模型知識引擎采用的是目前主流的RAG(檢索增強生成)技術架構為基礎,不僅整合了OCR文檔解析、向量檢索、多模態(tài)大模型等技術,更能讓企業(yè)通過模塊化的應用模板快速開發(fā)落地。除了上文提到的汽車、法律等領域,騰訊云大模型知識引擎還在金融、教育等多個行業(yè)落地。
除了知識管理、智能客服外,在大模型AIGC的“老本行”內容創(chuàng)作領域,智能營銷、內容生成等同樣是大模型的適宜落地場景。
在市場營銷領域,Campaign廣告素材生產效率、營銷互動趣味性等都是核心的關注參數在消費周期短、需要頻繁購買的快消品領域更是如此。例如,奶業(yè)巨頭蒙牛通過與騰訊云合作,用圖生圖能力,將用戶上傳的全家福轉化生成為特制的卡通畫風,使得小程序活躍度相對于去年同期提升80%,極大地提升了提升用戶的參與度。
而在制作周期更長、成本更高的視頻內容創(chuàng)作領域,大模型的降本增效能力則更為凸顯。過去,視頻內容需要一幀幀進行設計和制作,制作周期短則數天,長則數月。而人民日報、新華社等媒體如今則能夠通過混元大模型的文生視頻能力,通過一段文字或幾張圖片,在幾分鐘內就能快速生成優(yōu)質視頻內容,極大提升了內容創(chuàng)作效率。
此外,強泛化能力與zero-shot/few-shot能力則能讓大模型在小樣本場景下表現出色。比如,在風險管控、質量檢查等領域,大量企業(yè)只擁有少量異常樣本,使用傳統(tǒng)方式建模的時間長、精度也不夠。而大模型則能夠通過打包豐富的反欺詐知識,實現“小樣本”訓練,快速構建契合業(yè)務需求的風控模型體系。
根據騰訊云數據,在東風日產汽車金融的大模型合作中,雙方能夠只基于少量提示樣本就完成了適配業(yè)務場景的風控模型定制,相比于傳統(tǒng)的建模方式,模型KS性能提升超過20%,跨場景泛化性測試性能提升了高達53%。
此外,還有研發(fā)提效、辦公協(xié)同等等場景,不一而足。
此外,AI大模型作為一項新興技術,整個配套設施都要從0開始打造。除了上述面向場景的PaaS產品,在整個AI大模型的AI infra基建層,騰訊也一直在“埋頭鋪路”。
為了幫助企業(yè)更好地訓練大模型,騰訊云推出了集算存網一體的高性能智算底座“騰訊云智算”。目前,騰訊云智算的集群千卡單日故障數已經刷新到0.16,是行業(yè)水平的1/3;1分鐘就能完成萬卡Checkpoint寫入,數據讀寫效率是業(yè)界10倍;千卡集群的通信時間縮短到6%,是業(yè)界一半。騰訊云智算集群從機器上架到開始訓練可以做到只需1天,相比業(yè)界以月為單位大為縮短。
當前,大模型還達不到“開箱即用”的地步,IaaS、PaaS、SaaS層都需要一點點“往下磕”。騰訊在底層做好基建、中層做好工具、上層理解場景,三管齊下,如今已經能看到不少落地的成效。
長期、優(yōu)質、多元、獨到在大模型的所有應用場景中,醫(yī)療場景十分特殊。而在所有醫(yī)療場景中,重癥無疑是醫(yī)療場景中最值得關注的。
當前,能夠承擔重癥治療的醫(yī)護人員極為緊缺,而重癥患者又通常伴隨大量復雜的生理和生化指標和輔助檢查,涉及的藥品、機器使用頻繁且情況復雜。同時,重癥患者病情又普遍都相對嚴重,對治療及時性要求極高。
為了解決這些問題,在重癥醫(yī)療領域,騰訊云與醫(yī)療器械廠商邁瑞醫(yī)療合作,著力打造一套完整的、適配醫(yī)療場景數據、醫(yī)院環(huán)境使用需求的重癥大模型解決方案。
然而,想要模型真正落地,首先需要解決的是醫(yī)院真實使用場景中出現的問題。
當前,醫(yī)學能力可對標開源大模型尺寸高達70B,對于終端醫(yī)院來說幾乎無法真正落地,為了適配醫(yī)療場景數據并充分考慮醫(yī)院環(huán)境的使用需求,騰訊云與邁瑞醫(yī)療的重癥大模型在保持效果的前提下模型尺寸更精巧,推理、部署成本更優(yōu)。
同時,通過構建知識圖譜,錄入全量重癥知識、預制檢驗檢查指標、藥品等信息的映射關系,大模型在知識錄入階段,就會將知識進行整理,拆分,結構化,再轉化到特征空間,并通過生成式訓練保證大模型對重癥醫(yī)學的理解能力和表述的專業(yè)性。
此外,基于騰訊云醫(yī)學行業(yè)大模型,結合知識引擎、知識圖譜等相關產品技術,以及邁瑞在重癥醫(yī)學領域的完整的解決方案和對臨床場景的深刻理解,重癥大模型能夠將重癥治療中沉淀出的海量醫(yī)生經驗與高質量醫(yī)學文獻結合,通過迅速預測病情演進幫助醫(yī)生輔助決策,還能輔助病歷撰寫、患者信息檢索、重癥知識檢索等環(huán)節(jié),將醫(yī)生從繁瑣的機械性工作中解放出來,“把醫(yī)生的時間留給患者”。當前,這項解決方案能夠讓重癥科醫(yī)生的病情應答速度快至5秒,大幅提升了醫(yī)療效率。
“要實現AI大模型應用,需要結合不同層面的技術,包括基礎設施、模型、agent與工具、還有應用場景,每一層都需要考慮到,才能在合適的行業(yè)場景中,找到業(yè)務落地機會。”在此前的采訪中,騰訊集團高級執(zhí)行副總裁、云與智慧產業(yè)事業(yè)群CEO湯道生曾經這樣告訴36氪。
“(跟之前相比)客戶選擇云服務不只是看一次的價格,而是看你有沒有實力支撐長期的、更優(yōu)質的服務。我們的很多客戶,之所以選擇騰訊云,就是看重了我們的一些多元化、獨有的能力。”湯道生說。
此外,在工業(yè)制造領域,工業(yè)富聯也與騰訊云聯手探索工業(yè)大語言模型和工業(yè)多模態(tài)大模型在制造場景中的落地。
例如,為了解決數據孤島問題,在大模型建設的前期,工業(yè)富聯與騰訊云需要先共同搭建一個統(tǒng)一的數據存儲平臺,實現不同廠區(qū)、產線、質檢工位的數據采集和管理,再通過接入騰訊的TI平臺,實現高效的數據集成與標準化處理。
基于騰訊云的數據生成和異常檢測算法,工業(yè)富聯只需要提供少量正常圖像數據進行訓練,就能讓系統(tǒng)自主生成缺陷樣例,解決工業(yè)場景訓練數據量少的問題。
而上文提到的知識引擎方案,則能夠將分散于生產線上各個系統(tǒng)中,“幾十年老師傅沉淀的經驗”,各類復雜的文檔與非結構化數據融合搭建,構建出一套專屬于工業(yè)富聯的知識庫。在此之上,工業(yè)富聯便能夠利用大模型為員工提供更為精準和智能的知識服務,盤活了大量知識資產。
醫(yī)療、制造、法律、金融、消費……不知不覺間,大模型已經悄然走進我們生活的方方面面。
半年之前,大模型產業(yè)內曾經掀起了一場轟轟烈烈的口水戰(zhàn),圍繞著“信仰”與否,辯論雙方各執(zhí)一詞,爭得不亦樂乎。
今天,終于沒人再提了。
經過近兩年的市場教育,當前,人們開始逐漸對大模型的概念祛魅,在行業(yè)的狂熱逐漸回歸冷靜的今天,從業(yè)者的關注重心從榜單、參數、模型大小逐漸轉移,大模型終于從投資的熱潮里走了出來,開始回歸其本來的意義在真實場景中,創(chuàng)造價值。
跟歷史上每一輪技術革命必經的Gartner周期一樣,AI大模型也將走過它命中注定的跌宕曲線:技術萌芽、期望膨脹、泡沫破滅、穩(wěn)步爬升、生產成熟……
所幸,資本熱潮與技術落地之間永遠存在著真實的差距,無論是工業(yè)制造、醫(yī)療護理,還是智能營銷、知識管理等眾多應用場景中,企業(yè)的真實痛點既不會隨著行業(yè)熱度而盲目高漲,也不會隨著資本退潮而突然消失。
在“燒錢”與“泡沫”的聲量減弱,在盲目跟風的熱潮退去前,所幸仍有人愿意埋頭做些“臟活、苦活、累活”,讓一項新興技術普惠真正大眾的時間,來得更早了一些。