IT時報記者 郝俊慧
連續(xù)七屆參加世界人工智能大會的騰訊,再次將表達的重點放到“大模型行業(yè)和應用”上。
經歷了一年半“技術狂飆”后,國產大模型的數量已經超過200個,2024年也被稱為“大模型落地元年”。但作為國內互聯網頭部大廠,騰訊始終走得不疾不徐。
“大模型的打造只是起點,把技術落地到產業(yè)場景,創(chuàng)造價值才是目標”,2024WAIC騰訊論壇上,騰訊云副總裁、騰訊云智能負責人、騰訊優(yōu)圖實驗室負責人吳運聲表示,大模型的研發(fā)、應用必須關注、解決具體業(yè)務場景,以及可用性和性價比。
自2023年9月首次亮相以來,經過多次迭代升級,騰訊混元大模型在國內率先采用MoE架構,實現了性能大幅提升。據騰訊集團副總裁蔣杰介紹,截至目前,混元整體參數量已達到萬億,Tokens數量超過7萬億,居國內大模型第一梯隊。
智能體“最火”
WAIC展覽期間,騰訊展區(qū)始終人頭攢動。在騰訊元寶片區(qū),現場觀眾可以通過互動裝置,生成個人多風格專屬頭像。
元寶是一款基于騰訊混元大模型開發(fā)的AI原生應用,擁有看、聽、說等多模態(tài)交互能力,提供AI搜索、AI總結、AI寫作一站式服務,可支持單文檔最長1000萬字的超長文處理,能夠一次性解析最多50個文件,支持上傳和解析包括 pdf、doc、txt、xlsx、pptx 在內的多種文件格式。
從形式上看,騰訊元寶覆蓋工作提效、生活娛樂兩大場景,除了和文字相關的核心功能,元寶還可以提供創(chuàng)意繪畫、口語陪練、百變AI頭像等有趣好玩的特色應用,以及更多用戶創(chuàng)建的智能體。
智能體是今年WAIC上的新晉“網紅”。在“騰訊元器”展區(qū),參會嘉賓可以通過添加提示詞、插件、知識庫等自由創(chuàng)建智能體,也可以在智能體商店選擇、使用智能體,以滿足不同場景下的需求。
目前,騰訊在大模型領域已經構建了一套全鏈路產品矩陣,涵蓋從底層豐富基礎設施到頂層多元智能應用。包括自研通用大模型、模型開發(fā)平臺、智能體開發(fā)平臺,以及針對不同場景定制的智能應用解決方案等。通過這些產品和方案,致力于助力企業(yè)客戶高效地將大模型技術應用到實際業(yè)務場景中,實現快速部署和價值創(chuàng)造。
做離產業(yè)最近的AI
自從進入大模型賽道以來,騰訊始終堅持“產業(yè)實用”的核心戰(zhàn)略,構建離產業(yè)最近的AI。
去年6月,騰訊云對外發(fā)布行業(yè)大模型解決方案,通過TI平臺打造全新模型精選商店,為客戶提供MaaS一站式服務,涵蓋模型預訓練、模型精調、智能應用開發(fā)等,大大降低模型應用及落地成本。
吳運聲認為,大模型的打造只是起點,把技術落地到產業(yè)場景、創(chuàng)造價值才是目標。他特別強調了大模型知識引擎在智能客服、營銷等多場景的落地應用,比如在客服場景,知識引擎可以融入到客服系統(tǒng),讓客服人員更準確、更高效率地解答客戶的問題;在產品營銷場景,知識引擎可以整合到騰訊企點營銷SCRM中,提供更優(yōu)質的服務,提升客戶轉化率;在人才培訓場景,知識引擎可以結合騰訊樂享知識學習平臺,把員工的智慧聚集成企業(yè)知識庫,促進內部知識分享和傳播。
作為支撐AI大模型的重要基礎設施,向量數據庫能突破大模型在時間和空間上的限制,加速大模型落地行業(yè)場景。
今年大會上,騰訊秀出了“肌肉”:騰訊云向量數據庫可支持千億級向量規(guī)模、五百萬QPS及毫秒級查詢延遲,專用于在搜索/推薦和AIGC場景中提供文檔、圖片、音視頻等非結構化數據檢索服務。
從科技向善到AI普惠
大模型技術正在往多模態(tài)、零樣本學習、3D和視頻生成等方向快速演進,增強技術融合、簡化模型訓練流程、提供更加沉浸式體驗等方式,正在加速AI技術的普惠。
論壇當天,由安陽師范學院甲骨文信息處理教育部實驗室、騰訊SSV數字文化實驗室、騰訊優(yōu)圖實驗室、中國社會科學院甲骨學殷商史研究中心等單位共同發(fā)起建立的“數字甲骨共創(chuàng)中心”宣布,將全球最大的甲骨文多模態(tài)數據集正式開源。該數據集包含一萬片甲骨的拓片、摹本,以及甲骨單字對應位置、對應字頭、對應隸定字以及辭例分組、釋讀順序等數據;谠摂祿,研究人員可開發(fā)甲骨文檢測、識別、摹本生成、字形匹配以及釋讀等方向的智能算法,助推甲骨文研究加速數字化和智能化。
近年來,隨著AI技術的快速發(fā)展,探索AI與甲骨文研究相結合,成為了研究人員的解題思路。但高質量的AI算法非常依賴高質量的甲骨文數據集。
此次開源的甲骨文多模態(tài)數據集集合了甲骨文數字化研究的最新成果。它吸收了當前業(yè)界最先進的甲骨文研究資料,包括劍橋大學博士秦培超發(fā)布的鏡元甲骨文字庫,該字庫考慮了人工智能標注需求的字庫進行了細粒度的異體字標識;以及清華大學黃天樹教授發(fā)布的《摹本大系》,得益于其具有大量甲骨片清晰字形,降低了標注的難度。
AI相關技術的應用也為數據集的信息豐富提供了支撐。比如由騰訊優(yōu)圖實驗室聯合安陽團隊開發(fā)的甲骨字檢測模型,可以對甲骨片上的字進行一個初步的標注;字形降噪與匹配模型,為檢索提供了最直接的方法;甲骨校重算法,可以實現拓片與大系摹本的配準,使得大系摹本可以直接輔助拓片的標注;同時雙方聯合打造的協(xié)同創(chuàng)新平臺,也大大提升了數據標注的效率。
中國社會科學院學部委員宋鎮(zhèn)豪表示,甲骨文是中華文明的重要瑰寶,甲骨文研究不僅有助于揭示中國上古信史,還能為現代漢字由來和漢語研究提供標志性依據。通過AI技術的應用,有望加快甲骨文探析進程,解決長期困擾學界的疑難問題。希望更多的科研機構和專家學者加入到這一偉大事業(yè)中,共同拓展甲骨文研究工作新天地。
此外,在天文領域,“探星計劃”在“云+AI”的輔助下,整體探星信號處理效率提升1800倍,目前已發(fā)現41顆脈沖星,助力中國天文取得更多成果;以“AI+公益”為方向的Light技術公益平臺,開放騰訊云上300余項AI原子能力,以多種社會熱點議題為方向,號召各界人士共同打造技術公益解決方案。