(圖片來源:Unsplash)
與此前幾周的人工智能(AI)相關會議情況類似,2023全球數字經濟大會人工智能高峰論壇上,企業(yè)家、學術界紛紛探討大模型、生成式 AI 技術對于社會和產業(yè)界的影響。
“前幾個月大家都在討論OpenAI和中國什么時候能夠做出自己的大模型,這幾個月大模型層出不窮,我看到很多投資人開始急了。”360公司董事長周鴻在論壇演講中表示,大模型真正的機會在中國,尤其是企業(yè)級市場,包括政府和城市,而中國做大模型最應該抓住產業(yè)互聯網發(fā)展的機會。
曠視科技聯合創(chuàng)始人唐文斌,智譜AI CEO張鵬,銜遠科技創(chuàng)始人、清華大學惠妍講席教授周伯文等嘉賓也在現場表示認同這一看法,他們普遍認為,大模型不應該再消耗大量資金做ChatGPT這類千億級參數的通用大模型,而是應該打造十億級行業(yè)大模型,深入To B行業(yè)解決方案,解決垂直領域的實際問題。
事實上,隨著ChatGPT掀起中國 AI 大模型的投資、產業(yè)發(fā)展熱潮,企業(yè)紛紛效仿ChatGPT爭做“中國版OpenAI”,現在已有超過80個大模型公開內測。
但問題在于,“卷”了七個月后很多投資人、企業(yè)家發(fā)現,大模型技術門檻并不高,同時算力價格持續(xù)攀升,成本高居不下,企業(yè)急需盈利,需要尋找大模型的商業(yè)化方案,而ChatGPT的“每月20美元”Plus會員服務在國內只能變“免費”,OpenAI那種持續(xù)性 AI 技術投入在國內行不通。
最終發(fā)現,能給“大模型”買單的只有政務、金融、醫(yī)療等幾個垂直領域客戶。
鈦媒體App編輯統計國內AI大模型數據最新信息
企業(yè)不再拼AI大模型技術,而是回歸商業(yè)化
過去半年多時間,以ChatGPT、GPT-4為代表的大模型技術,引領了新一輪全球 AI 創(chuàng)新熱潮。國內外大模型科研高速迭代,各類模型層出不窮,模型性能不斷提升。
在國內,從百度文心一言、阿里通義千問、華為盤古大模型,再到360智慧大腦、智譜AIChatGLM等,各行各業(yè)都在打造大模型。據北京市經濟和信息化局局長姜廣智最新透露,迄今中國已有80余個大模型公開發(fā)布,其中北京約占一半(超40個)。
“我們好像爬了很長時間的山,終于見到了新的高峰、見到了新的曙光。”姜廣智在致辭時表示,過去二十多年,經歷了互聯網、智能手機、云計算、大數據、物聯網這一系列IT技術的重大變化,深刻地改變了我們的生產生活等各個方面,現在我們又迎來了通用 AI 的新時代。
不過,相比ChatGPT這類消費級平臺的付費模式,中國 AI 大模型普遍免費內測使用,用戶只要在平臺申請內測就能得到使用許可。不僅如此,“百模大戰(zhàn)”下人人都做大模型,很難形成企業(yè)自身和產業(yè)壁壘,加上 AI 算力成本高昂,大模型的商業(yè)化沒有想象當中那么容易。
簡單來說,國內 AI 大模型與OpenAI的商業(yè)模式、技術成本相距甚遠。OpenAI 能投入數億美元的算力訓練成本,國內中小 AI 公司無法達到,尤其大部分都集中于應用端。
“參數量其實是一個辯證的問題。千億萬億參數只是代表你最高的能力,但高參數意味著思維能力要求更高、算力高,而客戶場景不一定需要這么高的算力要求,因為不是所有場景都能接受千億參數量成本。”第四范式創(chuàng)始人、CEO戴文淵今年5月對鈦媒體App表示,在各種條件制約以及企業(yè)尋找盈利下,To B客戶均開始選擇成本可控的垂直 AI 大模型。
在2023全球數字經濟大會人工智能高峰論壇上,周鴻、張鵬、周伯文等嘉賓都普遍提到大模型的“行業(yè)化”、“垂直化”,深入政務、金融、文創(chuàng)、醫(yī)療等行業(yè)拓展,同時也圍繞模型安全、可信、可控進行討論。
周鴻認為,大模型真正的機會在企業(yè)級市場,中國做大模型,最應該抓住產業(yè)發(fā)展的機會。但目前的公有大模型用在政府、城市、行業(yè)等企業(yè)級場景時,存在四點不足,包括缺乏行業(yè)深度、數據安全隱患、無法保障內容可信、訓練和部署成本過高等。
“公有大模型存在很多數據安全隱患。每個企業(yè)自己內部的Know-how是核心資產,肯定不會訓練到公域大模型;公有大模型使用會有數據泄露的問題,因為很多想法和計劃都要告訴它,它才能寫出一篇好的文章;公有大模型是生成式AI,本身算法的特點就是會胡說八道,而且是一本正經、理直氣壯地胡說八道,這個特點用來做小說、寫劇本,作為聊天機器人逗悶子效果很不錯,但放在企業(yè)級場景問題就很大,要是真的拿醫(yī)療大模型開的藥方,你敢不敢相信、敢不敢吃;公有大模型無法實現成本可控,因為大模型成本之高也被渲染得很厲害,訓練一次要一千萬美金,需要多少算力、多少顯卡,企業(yè)內部做垂直大模型不用追求知識的全面,也不用追求能力面面俱到,百億模型可能就足夠了,千億到百億看起來參數做小了十倍,節(jié)省的訓練和部署成本可遠遠不止十倍。”
周鴻直言,未來企業(yè)級市場真正需要的大模型要符合行業(yè)化、企業(yè)化、垂直化、小型化、專有化等特點。不僅如此,在他看來,構建企業(yè)級大模型要堅持以下三個原則:
1、安全:首先是安全原則,大模型存在網絡安全、數據安全、算法安全等風險,特別在生成內容安全方面,目前已經有人利用AIGC生成各種以假亂真的內容用于詐騙,且治理起來比搜索引擎要復雜很多。因此人工智能安全的問題需要從現在開始著手研究。
2、可信:其次是可信原則,可通過企業(yè)知識庫和搜索的校正解決大模型的“幻覺”問題,以及知識不能及時更新問題。“如何解決輸出內容準確的問題?現在可以通過向量數據庫、企業(yè)搜索和外部知識庫進行校正。”
3、可控:最后是可控原則,周鴻認為,大模型目前還有點不靠譜的情況下,建議企業(yè)和政府使用大模型時,一開始步子可以小一點,不要向它開放API、插件和函數模式,還是要堅持它是一個助手,最后人是在決策的“回路”上。他在PPT中提到,要采取監(jiān)控審計手段,把大型“關在籠子里”。
對于企業(yè)如何使用大模型,周鴻強調,企業(yè)大模型首先要用好通用能力,充分發(fā)揮大模型最擅長、最成熟的能力;著眼企業(yè)痛點和剛需,小切口,大縱深,比如信息分析和決策、企業(yè)知識搜索和管理、辦公協作和智能客服等辦公場景,都是最合適的切入點。
同時,周鴻還建議企業(yè)在使用大模型時先開啟“助手”和“副駕駛”模式,讓大模型與現有的業(yè)務系統保持相對獨立,保持隔離度,對企業(yè)來說也更安全可控。此外,企業(yè)大模型應當領導、員工都能用,做到AI普惠。
“老是有人渲染應用大模型就要大裁員,搞得很多員工對大模型很抵觸。我堅決反對這個觀點,大模型目前想獨立完成一項工作還是很難的,更多的定位是人類很好的工具、知識的助手,所以大模型的發(fā)展要以人為本。”周鴻提到,易用好用是大模型發(fā)展的第一原則。
周鴻判斷,數字人將成為企業(yè)級大模型的重要入口和承載形式。此前360智腦發(fā)布的“有靈魂”的數字助理,可解決大模型的易用性難題。此次現場,周鴻還展示了定制化的“北京客服問不倒”和“北京城市招商寶”,為北京市訓練的兩個大模型數字人,解決一些政企領域的核心需求。
不僅是周鴻,智譜 AI CEO張鵬提到,從商業(yè)落地角度來說,智譜 AI 提出MaaS(Model As A Service)大模型服務理念,是希望讓千億級、高精度的大模型被更多個人和企業(yè)使用,享受AI賦能。
“我們有三個版本,一是有端到端模型訓練服務,已經在自建算力平臺上幫助大家完成若干模型遷移訓練;二是提供模型搭建服務,提供License;三是和云計算廠商合作,提出API調用以及Model Instance服務,幫助大家能夠快速構建強大的基礎設施能力。”張鵬表示。
鈦媒體App了解到,智譜AI正在研發(fā)新的ChatGLM2大模型產品,參數量減少但數據質量提升,相比于初代模型,ChatGLM2-6B在數理邏輯、知識推理、長文檔理解等多個維度的能力上,都取得了巨大的提升。在多個評測中,ChatGLM2得分要超過GPT-4和ChatGPT。
銜遠科技創(chuàng)始人、清華大學惠妍講席教授周伯文則表示,Al能否與業(yè)務充分結合,是決定Al能否實現經濟價值的關鍵因素。只有緊貼業(yè)務的Al戰(zhàn)路設計、完善的配套架構、充足的Al人才,以及健全的內部培養(yǎng)機制,才能使AI與業(yè)務發(fā)展需求充分融合,最大化經濟收益。
昆侖萬維CEO方漢則認為,目前來看大模型處于B端降本,C端增效狀態(tài)。
他認為,中國的B端服務企業(yè),可以看到很難有一家企業(yè)能夠壟斷整個B端服務。由于大模型對行業(yè)數據的需求,B端必然會出現每家大模型企業(yè)都能夠在一兩個行業(yè)中取得先發(fā)成功,沒有一家企業(yè)能夠在所有行業(yè)取得成功,而且很難有企業(yè)能拿到全行業(yè)的數據;而C端必然碎片化,由于中國市場的付費習慣,其實同海外有非常大的差別,中國用戶的免費習慣是非常明顯的,所有給C端用戶提供服務的企業(yè)必然是以免費模式為主,VIP模式為輔。
“大潮將起,落地為王。我們希望這一波通用人工智能的創(chuàng)業(yè)浪潮、投資浪潮能夠和上一波不太一樣,可以更快地落地、產生用戶和收入。”方漢的理論依然偏向大模型的商業(yè)化。他提到,昆侖萬維研發(fā)的AI 生成音樂產品已經落地文旅場景,今年4月與北京東城區(qū)簽署協議。
中國電信集團大數據和AI中心副總經理張鑫,則在現場公布了其研發(fā)的TeleChat大模型,支持輸出代碼、寫演講稿等。張鑫提到,電信數科公司研發(fā)目標是打造萬級AI算法艙,以成為百億級AI服務商,產品涵蓋AI算法、平臺、應用、硬件、大模型等。
這是中國電信首次對外公布其大模型產品。張鑫還稱,相對于其他大模型,TeleChat產品使用的大部分是國內中文大數據,數據90%都是國內為主,而且基于中國電信天翼云和云網融合底座,TeleChat做模型訓練參數的時候,能力能夠達到47%,而且模型訓練的效率、模型算法能力還在不斷提升。
在應用場景中,中國電信的TeleChat大模型已經開始廠商智能化,解決一些語音接線員的人才緊缺和覆蓋不足問題。通過AI技術提升,實現社會治理能力的現代化,減少成本消耗。
云知聲創(chuàng)新事業(yè)部副總裁郭凡曾提到,由云知聲和北京友誼醫(yī)院共同開發(fā)的基于山海大模型的門診病歷生成系統示范應用,在智慧醫(yī)療領域,基于云知聲700億參數規(guī)模的自研“山海”大模型,結合前端聲音信號處理、聲紋識別、語音識別、語音合成等全棧式智能語音交互技術,預計可提升醫(yī)生的電子病歷錄入效率超過400%,節(jié)約單個患者問診時間超過40%,提升醫(yī)生門診效率超過66%。
實際上,大模型是典型贏家通吃領域。需要更多的錢,需要更多的算力,以及更優(yōu)秀人才。因為更好的算力意味著更多人用,更多人用意味著更多數據,更多數據意味著更好的算力結果。大模型必然是巨頭必爭之地,巨頭有錢,有技術,更重要是有數據。
而創(chuàng)業(yè)公司項目太多,資金過于分散,尤其在企業(yè)端最終都變成了消耗資金買英偉達 A100卡、買云服務,沒有一個量化的企業(yè)發(fā)展流程。尤其在AI 公司、SaaS公司普遍盈利難、造血難之下,初創(chuàng)公司需要進行大模型商業(yè)化、盈利化。
所以,目前國內 AI 大模型正在形成的是以阿里、騰訊、百度、華為、商湯等大公司建立的通用大模型基座以及算力中心,以及包括毫末智行、天眼查、云知聲、中科聞歌、曠視等公司建立的垂直或行業(yè)領域大模型,只專注于一兩個領域解決核心問題。
政府支撐大模型場景落地
本次論壇上,北京市經信局再次公布了北京市通用人工智能產業(yè)創(chuàng)新伙伴計劃第二批成員,有63家企業(yè)入眩
據了解,截至6月30日,共有416家京內外大模型研發(fā)和應用企業(yè)申請加入第二批“伙伴計劃”。最終,包括北京百度網訊科技有限公司、中電數據服務有限公司、北京集智未來人工智能產業(yè)創(chuàng)新基地有限公司等63家企業(yè)入選并公布。其中,算力伙伴10家,數據伙伴10家,模型伙伴10家,應用伙伴24家、投資伙伴9家。此外,評估出模型觀察員30家。
據鈦媒體App估算,截至目前已經有超過80家公司和機構,入選到了北京市通用人工智能產業(yè)創(chuàng)新伙伴計劃當中。
目前,北京正快速推進 AI 大模型建設和產業(yè)布局工作。
5月21日,北京市人民政府印發(fā)《北京市加快建設具有全球影響力的人工智能創(chuàng)新策源地實施方案(2023-2025年)》的通知,到2025年,北京人工智能技術創(chuàng)新與產業(yè)發(fā)展進入新階段,基礎理論研究取得突破,原始創(chuàng)新成果影響力不斷提升,而且人工智能產業(yè)規(guī)模持續(xù)提升,形成具有國際競爭力和技術主導權的產業(yè)集群。
5月23日,北京市人民政府辦公廳印發(fā)《北京市促進通用人工智能創(chuàng)新發(fā)展的若干措施》的通知,要求充分發(fā)揮政府引導作用和創(chuàng)新平臺催化作用,整合創(chuàng)新資源,加強要素配置,營造創(chuàng)新生態(tài),重視風險防范,推動北京市通用人工智能實現創(chuàng)新引領和理性健康發(fā)展。
鈦媒體App在現場注意到,關于 AI 大模型在政務領域的落地案例和企業(yè)參與者越來越多,阿里、華為、汽車之家、值得買科技等公司均在參與。
北京市政務服務管理局一位負責人在現場演講中提到,為了支撐平臺“京策”建設,政府需要在場景領域進行通用大模型技術落地,從而提升政策規(guī)范管理和精準服務能力。“對海量市民訴求數據進行深度挖掘分析,為領導決策、基層治理、城市治理提供更有力支撐。”
上述負責人提到,場景推進方面,先期會使用開放的小接口模式,后續(xù)會開展私有化的深度應用。長期來看,他們將在數據安全可控的條件下,通過建立數字保護機制和技術評價,來開放高質量可信的政務數據集。
中科聞歌交付中心負責人王璋盛在和鈦媒體App交流中提到,政府類客戶對于 AI 大模型的訴求是很高的,該領域在大模型應用中也需要數據安全、數據治理等條件,尤其進行高質量數據訓練,從而更好解決該領域的實際應用問題。
蜜度CTO劉益東對鈦媒體App表示,公司去年開始使用華為云基礎設施產品展開政務、媒體等領域的業(yè)務落地,如今該公司即將發(fā)布專注于網絡輿論的垂直行業(yè)大模型產品。
“政府開始買單‘大模型’,一方面是政策引導和實際應用場景訴求,另一方面是企業(yè)自身需要通過大模型來解決成本問題、商業(yè)化問題。”一位行業(yè)人士向鈦媒體App分析,國內大模型行業(yè)正在回到 AI 企業(yè)與政府結合形成商業(yè)化、拿政府補助的時期。
姜廣智表示,當前,北京正加快推進國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)和國家人工智能創(chuàng)新應用先導區(qū)建設,打造具有全球影響力的人工智能創(chuàng)新策源地,具體措施包括以下三點:
一是加強政策創(chuàng)新和標準引領。解決數據數量相對匱乏、質量難以保證、采集標注成本高及合規(guī)使用等問題;I劃出臺“算力券”政策,支持基于落地應用場景的中小企業(yè)獲取多元化、低成本優(yōu)質算力,支持本市人工智能企業(yè)與相關行業(yè)組織在人工智能國家標準、行業(yè)標準、地方標準制定中發(fā)揮引領作用,參與模型性能、數據安全、隱私保護等方面的技術標準制定。
二是加大場景開放力度、率先落地標桿應用。推動本市政府機關、事業(yè)單位、國有企業(yè)等具有管理公共事務職能的組織積極采購和使用安全、可靠的大模型相關產品和服務,在政務服務、智慧城市等領域率先落地應用,提升城市治理能力現代化水平。
三是推動伙伴計劃走深走實。目前伙伴計劃中,有10余家算力伙伴計劃提供不少于4000P低成本優(yōu)質算力,供北京市人工智能中小企業(yè)開展大模型訓練和推理。10個數據伙伴開放18個、近500T高質量數據集供大模型企業(yè)訓練使用。同時,也將加快推動大模型行業(yè)應用落地,深入發(fā)揮伙伴計劃這一市場化對接合作平臺的作用,營造北京市大模型創(chuàng)新合作、應用落地的良好生態(tài)。
姜廣智強調,北京市經信局將不斷加強優(yōu)質資源要素配置,有效整合創(chuàng)新資源,積極營造創(chuàng)新生態(tài),夯實人工智能產業(yè)發(fā)展基矗
“大模型不是一家企業(yè)能夠做出來的,最好是大家在算力、模型、數據這些層面形成幾個大的生態(tài),尤其是在政府部門的指導下,企業(yè)能夠在生態(tài)中形成伙伴關系,這樣大家更多是合作而不是競爭。未來,大模型可能會形成有生態(tài),有伙伴,大家一起共贏的關系。”君聯資本執(zhí)行董事紀海泉表示。
(本文首發(fā)鈦媒體App,作者|林志佳)