機(jī)器之心原創(chuàng)
作者:姜菁玲
隨著數(shù)字經(jīng)濟(jì)的不斷深入,數(shù)據(jù)作為一種全新的生產(chǎn)要素成為影響市場(chǎng)的重要因素。在當(dāng)下最火熱的大模型創(chuàng)業(yè)潮之中,優(yōu)質(zhì)的數(shù)據(jù)是影響大模型訓(xùn)練效果關(guān)鍵之一,以往積累的稀缺行業(yè)數(shù)據(jù)甚至構(gòu)成了部分公司的強(qiáng)有力壁壘。
2023世界人工智能大會(huì)“數(shù)據(jù)要素與隱私計(jì)算高峰論壇”期間,螞蟻集團(tuán)副總裁、首席技術(shù)安全官韋韜在機(jī)器之心專訪中談到,在正規(guī)的數(shù)據(jù)交易鏈條中,通常為加強(qiáng)交易雙方的技術(shù)信任,數(shù)據(jù)持有方會(huì)采用可信隱私計(jì)算的技術(shù)來(lái)對(duì)數(shù)據(jù)實(shí)現(xiàn)“可用不可見(jiàn)”,在讓數(shù)據(jù)產(chǎn)生價(jià)值的同時(shí)規(guī)避信息泄露等問(wèn)題。數(shù)據(jù)流通整個(gè)行業(yè)正在邁向數(shù)據(jù)密態(tài)時(shí)代。
2023世界人工智能大會(huì)“數(shù)據(jù)要素與隱私計(jì)算高峰論壇”,韋韜發(fā)表主題演講
正是由于數(shù)據(jù)的復(fù)制成本極低,過(guò)去在各類安全標(biāo)準(zhǔn)未完全完善的情況下,數(shù)據(jù)交易中出現(xiàn)信息泄露以及其他合規(guī)風(fēng)險(xiǎn)的可能性較大,產(chǎn)業(yè)鏈相關(guān)方“不敢流通”、“不會(huì)流通”、“流通不起”,大大抑制了數(shù)據(jù)要素的流通性。
而如果要實(shí)現(xiàn)數(shù)據(jù)要素自由流通、最大化發(fā)揮數(shù)據(jù)要素的價(jià)值這樣的愿景,數(shù)據(jù)需要密態(tài)流轉(zhuǎn)。邁向數(shù)據(jù)密態(tài)時(shí)代,數(shù)據(jù)與數(shù)據(jù)間應(yīng)當(dāng)在一個(gè)足夠安全的流轉(zhuǎn)網(wǎng)絡(luò)中流通,在能保證多方數(shù)據(jù)安全的前提下,實(shí)現(xiàn)相對(duì)低成本低門檻的數(shù)據(jù)價(jià)值合作。
韋韜在專訪中向機(jī)器之心介紹了“密態(tài)天空計(jì)算”的概念,這個(gè)概念從加州大學(xué)伯克利分校的兩位計(jì)算機(jī)科學(xué)教授Ion Stoica和Scott Shenker提出的“天空計(jì)算(Sky Computing)”發(fā)展而來(lái)。
From cloud computing to sky computing.Ion Stoica,Scott ShenkerHotOS, 2021
“密態(tài)天空計(jì)算”是指基于技術(shù)信任的數(shù)據(jù)跨云互聯(lián),提供數(shù)據(jù)的跨云密態(tài)流轉(zhuǎn)和計(jì)算服務(wù),其目標(biāo)是允許基于數(shù)據(jù)密態(tài)的應(yīng)用能跨多個(gè)云廠商運(yùn)行。簡(jiǎn)單來(lái)說(shuō),在密態(tài)天空計(jì)算技術(shù)的支持下,可以構(gòu)建起一個(gè)在多云環(huán)境下安全可信的互聯(lián)互通的數(shù)據(jù)密態(tài)流轉(zhuǎn)網(wǎng)絡(luò),網(wǎng)絡(luò)上各個(gè)節(jié)點(diǎn)方能夠通過(guò)密態(tài)計(jì)算因子便捷、安全地進(jìn)行數(shù)據(jù)流通融合。
韋韜提到,隨著互聯(lián)互通的密態(tài)天空計(jì)算網(wǎng)絡(luò)逐步建設(shè)完善,數(shù)據(jù)要素流通就可以逐漸突破“不敢用、不會(huì)用、用不起”的局限,可信隱私計(jì)算將變得更加平等普惠,更多的數(shù)據(jù)可以參與流通,創(chuàng)造更大的價(jià)值。
明文數(shù)據(jù)交易的失敗
在銀行風(fēng)控場(chǎng)景,如果多家銀行能夠合規(guī)共享數(shù)據(jù),那么一個(gè)人在多家銀行的信用和風(fēng)險(xiǎn)數(shù)據(jù)就可以被精確融合分析,針對(duì)這個(gè)人的信貸和風(fēng)控策略就更準(zhǔn)確。這就是數(shù)據(jù)流通的價(jià)值。
在傳統(tǒng)的數(shù)據(jù)交易方式下,雙方之間通常用明文數(shù)據(jù)流通,“直接拷貝一份或者接個(gè)API”,也就是用裸露的明文數(shù)據(jù)去共同計(jì)算、合作。這種方式數(shù)據(jù)價(jià)值全面且成本低,但是容易被二次拷貝,數(shù)據(jù)濫用和泄露的風(fēng)險(xiǎn)極高。
2021年《數(shù)據(jù)安全法》與《個(gè)人信息保護(hù)法》正式實(shí)施以后,企業(yè)如何獲娶使用數(shù)據(jù)、處理個(gè)人信息的邊界被明確規(guī)定。其中,《個(gè)人信息保護(hù)法》提到,個(gè)人信息是以電子或者其他方式記錄的與已識(shí)別或者可識(shí)別的自然人有關(guān)的各種信息,不包括匿名化處理后的信息。
這也意味著,交易含有未被合法授權(quán)卻能夠?qū)?yīng)識(shí)別到自然人相關(guān)身份信息的明文數(shù)據(jù),變成一個(gè)違法操作。如果說(shuō)在法律出臺(tái)以前,仍有灰色地帶,在2021年之后,合規(guī)數(shù)據(jù)交易的邊界變得更加清晰了。
韋韜對(duì)機(jī)器之心表示,整體上數(shù)據(jù)交易行業(yè)的困難在于難以確權(quán)以及難以定價(jià)。而明文數(shù)據(jù)的交易方式除了有較大的合規(guī)風(fēng)險(xiǎn),另一個(gè)致命問(wèn)題在于容易失控。
“數(shù)據(jù)本身的復(fù)制成本非常低,很容易造成二次分發(fā),一旦分享出去就容易失控”。數(shù)據(jù)在脫離自身控制后,對(duì)方是否會(huì)任意復(fù)制、是否會(huì)交給第三方、是否會(huì)將這些數(shù)據(jù)用于違法犯罪,這些問(wèn)題變成了一個(gè)未知。
另外,由于合作雙方可通過(guò)明文數(shù)據(jù)推演出對(duì)方數(shù)據(jù)資產(chǎn)狀態(tài),獲得客戶觸達(dá)方式和敏感隱私數(shù)據(jù)甚至攫取對(duì)方流量資產(chǎn),由此引發(fā)的敵意、不信任、不放心會(huì)極大影響數(shù)據(jù)交互雙方合作意愿,進(jìn)而影響了數(shù)據(jù)要素的流通與價(jià)值的盤活。
更重要的是,“數(shù)據(jù)變成了你有我有大家有,因此數(shù)據(jù)的價(jià)值系統(tǒng)也會(huì)紊亂”。數(shù)據(jù)的價(jià)值在于稀缺的信息,但是明文流通且可以隨意復(fù)制,讓數(shù)據(jù)的定價(jià)變得更加失序。
在可能“違規(guī)”、“泄密”、“價(jià)值被破壞”的風(fēng)險(xiǎn)下,明文數(shù)據(jù)的交易方式一定程度上抑制了數(shù)據(jù)交易市場(chǎng)的發(fā)展。更多的數(shù)據(jù)持有方變得更加謹(jǐn)慎,不愿流通、不敢流通。
密態(tài)計(jì)算成為迫切需要
那么,有沒(méi)有辦法可以在保證合規(guī)的基礎(chǔ)上,實(shí)現(xiàn)數(shù)據(jù)流通?
對(duì)于想要共享數(shù)據(jù)獲得更精準(zhǔn)用戶特征的銀行來(lái)說(shuō),怎樣才能保證共同訓(xùn)練的過(guò)程中,不會(huì)泄露用戶的個(gè)人身份信息,同時(shí)保證自己的數(shù)據(jù)在跨主體流轉(zhuǎn)融合后,仍然能在傳播中不失控,最終仍然可以通過(guò)計(jì)算得到自己想要的結(jié)果?
韋韜稱,目前解決這一挑戰(zhàn)的主要方向是利用可信隱私計(jì)算技術(shù),實(shí)現(xiàn)數(shù)據(jù)密態(tài)流轉(zhuǎn),做到數(shù)據(jù)“可用不可見(jiàn),可控可計(jì)量”。
與數(shù)據(jù)的明文傳播做對(duì)比,可信隱私計(jì)算技術(shù)能夠支持?jǐn)?shù)據(jù)加密流轉(zhuǎn)。數(shù)據(jù)密態(tài)即在數(shù)據(jù)進(jìn)入流轉(zhuǎn)進(jìn)行共享、計(jì)算直到銷毀的完整傳播鏈路中,保持?jǐn)?shù)據(jù)處于加密狀態(tài),不出現(xiàn)明文數(shù)據(jù)失控,將數(shù)據(jù)持有權(quán)與使用權(quán)分離,實(shí)現(xiàn)數(shù)據(jù)使用權(quán)的跨域管控,以確保數(shù)據(jù)流轉(zhuǎn)的全程安全可控。
本質(zhì)上,可信隱私計(jì)算是以技術(shù)的方式幫助數(shù)據(jù)交易雙方實(shí)現(xiàn)信任;谶@樣的技術(shù)信任機(jī)制,可信隱私計(jì)算能夠?qū)崿F(xiàn)數(shù)據(jù)的跨域管控。當(dāng)數(shù)據(jù)流轉(zhuǎn)到其他域中,依然可以對(duì)它進(jìn)行管控,使得持有權(quán)不失控。因此,數(shù)據(jù)要素的提供方以及相關(guān)加工處理方均能得到收益。
隨著數(shù)據(jù)要素在國(guó)家戰(zhàn)略層面上受到越來(lái)越多的重視,過(guò)去兩年,數(shù)據(jù)要素市場(chǎng)的相關(guān)政策加速出臺(tái),為數(shù)據(jù)要素行業(yè)厘清了更多邊界
2022年,中共中央、國(guó)務(wù)院印發(fā)《關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見(jiàn)》(簡(jiǎn)稱“數(shù)據(jù)二十條”),明確提出要“建立合規(guī)高效、場(chǎng)內(nèi)外結(jié)合的數(shù)據(jù)要素流通和交易制度”,創(chuàng)造性提出建立數(shù)據(jù)資源持有權(quán)、數(shù)據(jù)加工使用權(quán)和數(shù)據(jù)產(chǎn)品經(jīng)營(yíng)權(quán)“三權(quán)分置”的數(shù)據(jù)產(chǎn)權(quán)制度框架,構(gòu)建中國(guó)特色數(shù)據(jù)產(chǎn)權(quán)制度體系。
在法律以及行業(yè)標(biāo)準(zhǔn)逐漸清晰的基礎(chǔ)上,密態(tài)計(jì)算技術(shù)的市場(chǎng)需求開(kāi)始爆發(fā)。螞蟻隱私計(jì)算專家霍傳冰發(fā)現(xiàn),相比于2021年,“2022年后來(lái)到公司咨詢的客戶轉(zhuǎn)化率(從線索到銷售)同比增長(zhǎng)了10%”,為實(shí)際需求買單的客戶越來(lái)越多了,螞蟻可信隱私計(jì)算業(yè)務(wù)的落單量同比迎來(lái)了大幅提升。
另外,可信隱私計(jì)算技術(shù)的逐步成熟也增強(qiáng)了市場(chǎng)上數(shù)據(jù)持有方的信心。在可信隱私計(jì)算技術(shù)的加持下,一些高價(jià)值的數(shù)據(jù),比如醫(yī)療、金融、保險(xiǎn)、政務(wù)等行業(yè),開(kāi)始逐步釋放自己數(shù)據(jù)的價(jià)值。
國(guó)家工業(yè)信息安全發(fā)展研究中心測(cè)算數(shù)據(jù)顯示,2023年國(guó)內(nèi)數(shù)據(jù)要素市場(chǎng)規(guī)模將破千億,2025年市場(chǎng)規(guī)模將達(dá)到1749億元,“十四五”期間市場(chǎng)規(guī)模復(fù)合增速將達(dá)到26.3%,整體進(jìn)入高速發(fā)展階段。
未來(lái)的技術(shù)基礎(chǔ)設(shè)施
在韋韜看來(lái),整個(gè)數(shù)據(jù)密態(tài)化時(shí)代的發(fā)展,將經(jīng)歷計(jì)算密態(tài)化、大數(shù)據(jù)密態(tài)化、數(shù)據(jù)要素密態(tài)化三個(gè)階段:
首先是計(jì)算密態(tài)化時(shí)期,聯(lián)邦學(xué)習(xí)、MPC等隱私保護(hù)計(jì)算技術(shù)快速發(fā)展,將明文數(shù)據(jù)流轉(zhuǎn)變成了密態(tài)數(shù)據(jù)流轉(zhuǎn),保證安全合規(guī)以及試點(diǎn)驗(yàn)證。
其次是大數(shù)據(jù)密態(tài)化時(shí)期,大數(shù)據(jù)平臺(tái)從明文計(jì)算邁進(jìn)密文計(jì)算,豐富的中間結(jié)果以密態(tài)形式存在,數(shù)據(jù)持有權(quán)與使用權(quán)分離,行業(yè)發(fā)展的重點(diǎn)是實(shí)現(xiàn)可信隱私計(jì)算技術(shù)的可用易用,降低門檻。
最后是數(shù)據(jù)要素密態(tài)化時(shí)期,全行業(yè)數(shù)據(jù)密態(tài)流通,多方異構(gòu)互聯(lián),中長(zhǎng)尾流通的難題被解救,密態(tài)天空網(wǎng)絡(luò)搭建成功,做到使用成本降低,廣域普惠。
韋韜判斷稱,當(dāng)下我們正處于從第一階段向第二階段邁進(jìn)的時(shí)期,在該階段,各個(gè)機(jī)構(gòu)開(kāi)始全面使用密態(tài)計(jì)算獲得收益,無(wú)論是要處理的數(shù)據(jù)規(guī)模還是復(fù)雜程度將遠(yuǎn)高于第一階段。
“更具體的,是要解決大數(shù)據(jù)技術(shù)生態(tài)和AI技術(shù)生態(tài)的密態(tài)化技術(shù)升級(jí)問(wèn)題,特別是如何讓現(xiàn)有的廣大的一線大數(shù)據(jù)和AI工程師們能夠便捷的用上密態(tài)化技術(shù)能力?如果只能依靠少數(shù)同時(shí)精通隱私計(jì)算和大數(shù)據(jù)技術(shù)的行業(yè)專才重人力投入的話,那么是無(wú)法支持全行業(yè)數(shù)據(jù)要素轉(zhuǎn)型的迫切需求的。”
經(jīng)過(guò)推演,韋韜認(rèn)為在下一個(gè)階段的重要任務(wù)是需要通過(guò)密態(tài)即服務(wù)(Cryptographic Computing as a Service,即CaaS)、技術(shù)開(kāi)源等方式,降低技術(shù)門檻,推動(dòng)大數(shù)據(jù)和AI技術(shù)密態(tài)化。
“因?yàn)橐婚_(kāi)始密態(tài)化轉(zhuǎn)型的技術(shù)難度非常高,行業(yè)這方面的專才非常稀缺,因此只有少數(shù)頭部企業(yè)在高價(jià)值數(shù)據(jù)的場(chǎng)景下才能有足夠的人才和資金去投入”。韋韜表示。
在一線負(fù)責(zé)產(chǎn)品的螞蟻隱私計(jì)算專家霍傳冰則表示,以銀行的多方聯(lián)合風(fēng)控場(chǎng)景舉例,目前的合作基本是在兩方和三方之間,如果說(shuō)要針對(duì)樣本數(shù)據(jù)做一些縱向拓展以加入更多維度的信息的話,“技術(shù)的性能衰減開(kāi)始非常厲害,目前只能支持5方的計(jì)算。而如果采用保密程度更高的密碼學(xué)方案,則最多只能支持到3方的運(yùn)算。3方之后,整體的性能將迎來(lái)斷崖式下跌,而成本則是指數(shù)級(jí)增長(zhǎng),市場(chǎng)是無(wú)法接受的”。
而在缺乏密態(tài)計(jì)算基礎(chǔ)設(shè)施的情況下,數(shù)據(jù)融合參與方發(fā)生變化、數(shù)據(jù)部署發(fā)生變化,都需要在可信隱私計(jì)算協(xié)議上做專業(yè)化的安全評(píng)估和性能優(yōu)化,這樣的技術(shù)難度和使用門檻更不是普通行業(yè)用戶能夠承擔(dān)的。
隱私計(jì)算的技術(shù)門檻和性能問(wèn)題成為其規(guī)模化限制的最重要影響因素之一。這意味著,以如今的隱私計(jì)算高昂的成本,只有前20%的中大型企業(yè)才能負(fù)擔(dān)得起隱私計(jì)算的成本。剩下80%中長(zhǎng)尾需求則無(wú)法被滿足。在技術(shù)人才方面,中小企業(yè)也缺乏專門的人才來(lái)支撐。也意味著,在整個(gè)數(shù)據(jù)交易市場(chǎng),只有少部分的高價(jià)值數(shù)據(jù)如消費(fèi)、行為相關(guān)的數(shù)據(jù)才能順利得在市場(chǎng)上流通。
而韋韜此次介紹的“密態(tài)天空計(jì)算”或許是這一問(wèn)題的解法之一。“密態(tài)天空計(jì)算”指的是數(shù)據(jù)的跨云密態(tài)流轉(zhuǎn)和計(jì)算服務(wù),它能夠支持多方儲(chǔ)存在不同云服務(wù)上的數(shù)據(jù)進(jìn)行密態(tài)計(jì)算以及流轉(zhuǎn)。
根據(jù)韋韜的解釋,在云計(jì)算越來(lái)越普遍的當(dāng)下,多云之間的數(shù)據(jù)流轉(zhuǎn)需求也越來(lái)越多的開(kāi)始涌現(xiàn)。但是當(dāng)多個(gè)需求方開(kāi)始數(shù)據(jù)流通的時(shí)候,就需要對(duì)接不同的隱私計(jì)算廠商,對(duì)于小微企業(yè)來(lái)說(shuō)很難負(fù)擔(dān)。所以大家產(chǎn)生了很強(qiáng)的互聯(lián)互通需求。在這樣一種需求下,推動(dòng)了底層的這種共同標(biāo)準(zhǔn)的出現(xiàn)。
在密態(tài)天空計(jì)算技術(shù)的支持下,多方跨云實(shí)現(xiàn)數(shù)據(jù)的互聯(lián)互通,隱私計(jì)算從點(diǎn)對(duì)點(diǎn)變成了網(wǎng)狀流通。韋韜稱,彼時(shí),各個(gè)網(wǎng)絡(luò)上的節(jié)點(diǎn)統(tǒng)一遵循一致的底層標(biāo)準(zhǔn)后,全行業(yè)就能開(kāi)始取得規(guī);(yīng),邊際成本將大幅降低。
“到時(shí)候,它(密態(tài)天空計(jì)算)的成本可能會(huì)從如今的千倍甚至萬(wàn)倍以上,降到十倍到百倍之間,讓數(shù)據(jù)安全可控規(guī)模化流轉(zhuǎn)成為可能。”
組織成的密態(tài)天空計(jì)算網(wǎng)絡(luò)將會(huì)是全行業(yè)數(shù)據(jù)密態(tài)流轉(zhuǎn)的技術(shù)基礎(chǔ)設(shè)施。在向這個(gè)階段邁進(jìn)的過(guò)程中,隱私計(jì)算技術(shù)將會(huì)不斷變得普惠平等易用。
韋韜稱,在密態(tài)天空計(jì)算網(wǎng)絡(luò)之中,未來(lái)螞蟻會(huì)與行業(yè)伙伴們協(xié)力推出密態(tài)即服務(wù)(CaaS)的產(chǎn)品與服務(wù),讓更多的云上數(shù)據(jù)密態(tài)流轉(zhuǎn)變成基于技術(shù)信任的可信流轉(zhuǎn),并通過(guò)支持標(biāo)準(zhǔn)化密態(tài)協(xié)議實(shí)現(xiàn)互聯(lián)互通,從而實(shí)現(xiàn)一個(gè)支持全行業(yè)數(shù)據(jù)密態(tài)流轉(zhuǎn)的技術(shù)基礎(chǔ)設(shè)施。
整體上看,韋韜認(rèn)為,過(guò)去五年大致是在計(jì)算密態(tài)化時(shí)期;未來(lái)三到五年,可以逐漸實(shí)現(xiàn)第二階段大數(shù)據(jù)密態(tài)化。在這個(gè)階段需要不斷修建“密態(tài)樞紐”,并通過(guò)互聯(lián)互通慢慢建立起小規(guī)模的密態(tài)天空計(jì)算網(wǎng)絡(luò)。
“希望在5至10年的時(shí)間里,看行業(yè)的發(fā)展慢慢擴(kuò)大。屆時(shí),性能和成本的限制將會(huì)減少,十幾方的聯(lián)合計(jì)算也將可以支持,企業(yè)外循環(huán)數(shù)據(jù)流動(dòng)將會(huì)變得易用自由,更多的數(shù)據(jù)價(jià)值將會(huì)被釋放。”