近日,在中國信息通信研究院(以下簡稱“信通院”)組織的首批“面向大模型的增強(qiáng)型可信執(zhí)行環(huán)境基礎(chǔ)能力專項測試”中,螞蟻數(shù)科順利完成全部測試內(nèi)容,成為首批通過此項測評的廠商。據(jù)了解,這也是信通院今年首次開設(shè)的全新資質(zhì)測評方向,首批共有3家廠商通過。
《面向大模型訓(xùn)練與推理數(shù)據(jù)保護(hù)的可信執(zhí)行環(huán)境技術(shù)要求》是信通院云計算與大數(shù)據(jù)研究所依托中國通信標(biāo)準(zhǔn)化協(xié)會大數(shù)據(jù)技術(shù)標(biāo)準(zhǔn)推進(jìn)委員會(CCSA TC601),聯(lián)合30余家企業(yè)的專家共同編制,旨在為可信執(zhí)行環(huán)境產(chǎn)品/集群在面向大模型場景時的研發(fā)、測試、評估和驗收提供參考和指引。
據(jù)此標(biāo)準(zhǔn)形成的測試方法共覆蓋數(shù)據(jù)工程、模型訓(xùn)練支持、模型推理支持、硬件加速、安全要求五大能力域,包含數(shù)據(jù)增強(qiáng)、模型管理、環(huán)境安全和數(shù)據(jù)安全等16個子能力域,共計57個測試項。
當(dāng)前,通用人工智能正在加速從“以模型為中心”向“以數(shù)據(jù)為中心”轉(zhuǎn)變,高質(zhì)量、大規(guī)模數(shù)據(jù)集愈加重要。然而,高質(zhì)量數(shù)據(jù)集普遍以孤島形式存在,限制了大模型在產(chǎn)業(yè)應(yīng)用中落地。為實現(xiàn)可信的多方聯(lián)合訓(xùn)練與推理,以可信執(zhí)行環(huán)境、聯(lián)邦學(xué)習(xí)為代表的隱私計算是可行的技術(shù)解法。
大模型在訓(xùn)練和推理過程中,都可能會導(dǎo)致用戶個人隱私及企業(yè)核心數(shù)據(jù)等重要敏感信息泄露,對大模型落地應(yīng)用的安全性提出了更高要求。螞蟻數(shù)科自主研發(fā)的摩斯安全計算平臺通過差分隱私、聯(lián)邦大模型拆分和跨域微調(diào)、模型混淆、可信硬件等多種隱私計算技術(shù)相結(jié)合的獨創(chuàng)性方案,能在各方原始數(shù)據(jù)不出域的情況下,實現(xiàn)大模型的數(shù)據(jù)輸入、微調(diào)、推理全鏈路數(shù)據(jù)安全和模型隱私保護(hù)。
據(jù)了解,在軟件層面,摩斯大模型隱私保護(hù)產(chǎn)品,在原有大模型使用鏈路上疊加隱私計算能力,進(jìn)行數(shù)據(jù)和模型雙重保護(hù),并支持大模型隱私微調(diào)和安全推理,可實現(xiàn)微調(diào)精度損失可控、隱私推理性能提升、密文吞吐量有效提升、算力可擴(kuò)展,并支持云部署、一體機(jī)、自有算力等多種部署方式。在硬件層面,結(jié)合適配于可信執(zhí)行環(huán)境的加速硬件,可實現(xiàn)隱私推理性能和密文吞吐量進(jìn)一步提升。并主要基于Intel SGX和TDX、AMD SEV、海光CSV、NVIDIA CC等可信計算硬件及螞蟻自研的機(jī)密計算底座構(gòu)建起隱私計算大模型系統(tǒng),滿足多場景中的安全性需求。
公開信息顯示,螞蟻數(shù)科持續(xù)深耕區(qū)塊鏈、隱私計算及AI技術(shù),其持有的隱私計算專利數(shù)連續(xù)多年排名全球第一。在全球頂尖賽事iDASH國際隱私計算大賽中,螞蟻數(shù)科累計獲得六項冠軍,覆蓋多方安全計算、機(jī)密計算、聯(lián)邦學(xué)習(xí)等賽道。據(jù)IDC發(fā)布的《2022中國隱私計算平臺市場份額》報告,螞蟻數(shù)科以36.9%的市場份額位居第一。