大模型向下扎根深入行業(yè),必須要破解高質(zhì)量數(shù)據(jù)供給的挑戰(zhàn)。7月5日,2024年世界人工智能大會進入第二天,作為數(shù)據(jù)要素領(lǐng)域的主要技術(shù)服務(wù)商,螞蟻集團發(fā)布“隱語Cloud”大模型密算平臺,通過軟硬件結(jié)合的可信隱私計算技術(shù),在大模型托管和大模型推理等環(huán)節(jié)實現(xiàn)數(shù)據(jù)密態(tài)流轉(zhuǎn),保護模型資產(chǎn)、數(shù)據(jù)安全和用戶隱私。
當下,高質(zhì)量數(shù)據(jù)供給和安全流通,成為大模型進入垂直產(chǎn)業(yè)應(yīng)用的首要挑戰(zhàn)。其一,行業(yè)大模型要獲得解決專業(yè)問題的能力,首先要經(jīng)過數(shù)量充足、質(zhì)量高的專業(yè)數(shù)據(jù)訓練。然而,專業(yè)數(shù)據(jù)往往分散在不同的機構(gòu)、企業(yè)中,并且由于價值大、保密要求高,難以流動。此外,在企業(yè)、大模型廠商和用戶之間存在信任壁壘,企業(yè)擔心數(shù)據(jù)對外泄露,大模型廠商擔心模型資產(chǎn)安全,用戶擔心個人數(shù)據(jù)和隱私風險。
在發(fā)布會現(xiàn)場,螞蟻密算CEO王磊介紹,“隱語Cloud”大模型密算平臺首批推出兩大服務(wù),分別為大模型密態(tài)托管和大模型密態(tài)推理。大模型密態(tài)托管,指模型提供方可以將模型加密后托管在平臺上,一鍵完成云上密態(tài)部署,保護模型資產(chǎn)不被泄漏和盜用;大模型密態(tài)推理,是指數(shù)據(jù)以密態(tài)形式完成推理,保護用戶交互時的數(shù)據(jù)安全、商業(yè)機密等。
此外,該平臺支持GPU在可信執(zhí)行環(huán)境下進行計算,使得大模型推理在密態(tài)形式下的響應(yīng)時間和使用效率與明文大模型接近,實現(xiàn)大規(guī)模商業(yè)可用。在安全保障上,該產(chǎn)品利用內(nèi)存、磁盤加密等方法,實現(xiàn)用戶訪問的端到端加密和托管模型的跨域訪問控制。在易用性上,產(chǎn)品支持輕量化遠程認證,用戶在網(wǎng)頁訪問時就可以完成遠程認證,不需要額外的操作步驟。
當下,大模型在垂直行業(yè)應(yīng)用時,許多企業(yè)通過私有化部署來應(yīng)對數(shù)據(jù)安全挑戰(zhàn),這不僅增加企業(yè)的運維和服務(wù)成本,也影響對外服務(wù)的效率和質(zhì)量。對行業(yè)的發(fā)展來說,私有化方案不利于多方數(shù)據(jù)跨領(lǐng)域、跨行業(yè)高效融合,無法進一步激發(fā)大模型的能力。
據(jù)介紹,隱語Cloud”大模型密算平臺提供公有云和專有云交付方案,支持市面上主流的通用大模型。以公有云為例,無論用戶重新構(gòu)建新的垂直大模型,或者將已有的大模型重新部署在該平臺,只需一鍵部署和接入,比如10分鐘即可完成高可用推理服務(wù)的發(fā)布。在使用過程中,用戶按需獲取密態(tài)算力,即開即得。
王磊透露,隱語Cloud大模型密算平臺的服務(wù),將逐步覆蓋到垂直大模型從構(gòu)建到對外服務(wù)的全鏈路數(shù)據(jù)安全!敖酉聛,我們將為垂直大模型從預(yù)訓練、微調(diào)、評測、推理到用戶交互的全程提供密態(tài)計算服務(wù),在大模型提供方、數(shù)據(jù)提供方、大模型使用方等之間實現(xiàn)數(shù)據(jù)可信安全流轉(zhuǎn)。平臺還將提供密態(tài)大模型開發(fā)所需的全鏈路工具,提供的服務(wù)包括密態(tài)檢索增強生成、密態(tài)提示詞、Agent流程編排等!
螞蟻集團副總裁兼首席技術(shù)安全官、螞蟻密算董事長韋韜認為,數(shù)據(jù)供給決定了大模型應(yīng)用能力的上限,而隱私計算技術(shù)決定了數(shù)據(jù)跨域供給的上限。當大模型從通用走向?qū)I(yè)應(yīng)用,從技術(shù)想象力走向產(chǎn)業(yè)的生產(chǎn)力,必須要解決高質(zhì)量數(shù)據(jù)集稀缺與專業(yè)數(shù)據(jù)阻滯的挑戰(zhàn),否則大模型作為“智力引擎”,只會陷入空轉(zhuǎn)。今后,高價值數(shù)據(jù)要深度融合,一定需要以密態(tài)方式進行安全流轉(zhuǎn)。
韋韜表示,螞蟻集團從2016年開始探索隱私計算技術(shù),能力涵蓋了全?尚偶夹g(shù)、多方安全計算、聯(lián)邦學習、同態(tài)加密、差分隱私、機密計算等隱私計算全譜技術(shù)域!拔覀兿M(lián)合產(chǎn)業(yè)合作伙伴,把螞蟻集團多年來在密態(tài)計算技術(shù)上的探索和創(chuàng)新,以開源和產(chǎn)品化的形式對外開放,助力推動產(chǎn)業(yè)向前發(fā)展,為實體經(jīng)濟和中小微企業(yè)創(chuàng)造新的價值,讓數(shù)據(jù)價值的流動像自來水一樣即開即用。”
目前,螞蟻可信隱私計算的核心技術(shù)已全部開源,包括“隱語”可信隱私計算框架、“星綻”可信執(zhí)行環(huán)境操作系統(tǒng)Occlum等。此外,參與制定了60多項國內(nèi)外隱私計算技術(shù)標準,其中主導(dǎo)了9項國際標準。螞蟻還與超過50所國內(nèi)外高校緊密合作,并且與中國計算機學會聯(lián)合設(shè)立了“隱私計算專項科研基金”。
今年5月底,螞蟻集團對外公布了以人工智能和數(shù)據(jù)要素技術(shù)為核心的科技戰(zhàn)略,隨后成立了獨立運營的密態(tài)計算公司浙江螞蟻密算科技有限公司,將提供密算相關(guān)的產(chǎn)品和服務(wù),包括一套端到端的數(shù)據(jù)安全保障、一套軟硬件結(jié)合的計算加速解決方案和一個隱私計算云服務(wù)平臺,推動數(shù)據(jù)安全可信的跨云跨端低成本流通。