文|張婧怡
編輯|蘇建勛
9月3日,2022世界人工智能大會(huì)進(jìn)入尾聲。當(dāng)天的可信隱私計(jì)算高峰論壇上,螞蟻集團(tuán)發(fā)布可信隱私計(jì)算“隱語(yǔ)開(kāi)放平臺(tái)”,并與中國(guó)信通院云計(jì)算與大數(shù)據(jù)研究所、隱私計(jì)算聯(lián)盟共同發(fā)布業(yè)內(nèi)首份《可信密態(tài)白皮書(shū)》,為新興隱私計(jì)算可信密態(tài)計(jì)算(TECC)提供技術(shù)策略。
2021年12月,螞蟻集團(tuán)與隱私計(jì)算聯(lián)盟共同提出“邁向密態(tài)時(shí)代,擁抱隱私計(jì)算”,半年過(guò)去,螞蟻集團(tuán)副總裁、首席技術(shù)安全官韋韜提到,“整個(gè)行業(yè)已經(jīng)逐步形成共識(shí)。”
螞蟻集團(tuán)副總裁、首席技術(shù)安全官韋韜
什么是數(shù)據(jù)密態(tài)時(shí)代?據(jù)介紹,數(shù)據(jù)密態(tài)是數(shù)據(jù)以密態(tài)形式流通,保障其流轉(zhuǎn)、計(jì)算、融合、制造、銷(xiāo)毀的全鏈路安全可控。
韋韜表示,在數(shù)據(jù)密態(tài)時(shí)代非;镜囊稽c(diǎn)是,未來(lái)全行業(yè)數(shù)據(jù)流通會(huì)是以數(shù)據(jù)密態(tài)形式來(lái)流通“但是前提是一定要有技術(shù)支撐能力和相關(guān)基礎(chǔ)技術(shù)設(shè)施,否則數(shù)據(jù)是沒(méi)有辦法以任何方式流通的。所以一定要有全新的技術(shù)支撐能力和相關(guān)的基礎(chǔ)技術(shù)設(shè)施。”
為此,螞蟻集團(tuán)曾在今年7月宣布面向全球開(kāi)發(fā)者正式開(kāi)源可信隱私計(jì)算框架“隱語(yǔ)”,此次大會(huì)上又發(fā)布了一項(xiàng)開(kāi)放、易用的隱語(yǔ)開(kāi)放平臺(tái),開(kāi)發(fā)者無(wú)需調(diào)用和開(kāi)發(fā)代碼,就可以直接使用的產(chǎn)品功能。
韋韜用Facebook劍橋分析數(shù)據(jù)門(mén)的案例,詳細(xì)介紹了當(dāng)前數(shù)據(jù)行業(yè)的衍生問(wèn)題。2019年,F(xiàn)acebook被罰款50億美金,起因是一家名為劍橋分析的數(shù)據(jù)公司泄露了Facebook上超過(guò)五千萬(wàn)的用戶數(shù)據(jù),并推斷用戶的智力、性取向或政治觀點(diǎn),再運(yùn)用算法技術(shù)向這些用戶發(fā)送定向廣告,從而影響美國(guó)大眩
然而事實(shí)上,扎克伯格早在2014年就不再允許第三方獲取數(shù)據(jù),2015年的時(shí)候已經(jīng)要求他們刪除用戶數(shù)據(jù),提供了刪除證明,但直至數(shù)據(jù)門(mén)事件發(fā)生,F(xiàn)acebook仍然難以驗(yàn)證這些數(shù)據(jù)是不是真的被刪除了。
“為什么這樣?整個(gè)數(shù)據(jù)是明文流轉(zhuǎn)的,流出主體是徹底失控的,所以帶來(lái)了這么嚴(yán)重的問(wèn)題。”韋韜表示,這本質(zhì)上是數(shù)據(jù)濫用的問(wèn)題,“在一些合法合理使用場(chǎng)景之下,數(shù)據(jù)鏈路非常漫長(zhǎng),數(shù)據(jù)供應(yīng)鏈的復(fù)雜程度往往超乎想象。數(shù)據(jù)互信難,明文方式流轉(zhuǎn)另外一家主體就會(huì)失控,就會(huì)導(dǎo)致一系列問(wèn)題。”
而如果數(shù)據(jù)以密態(tài)勢(shì)流動(dòng),就能夠保護(hù)數(shù)據(jù)持有權(quán),不會(huì)因?yàn)槊魑牧鲃?dòng)、明文失控使數(shù)據(jù)持有權(quán)喪失,導(dǎo)致用戶隱私泄漏類(lèi)的問(wèn)題。
基于這樣的情況,韋韜和更多合作伙伴明確提出,數(shù)據(jù)的流轉(zhuǎn)形式在數(shù)據(jù)要素發(fā)展的時(shí)候以密態(tài)勢(shì)流動(dòng)。而密態(tài)數(shù)據(jù)的技術(shù)基礎(chǔ)包括密碼學(xué)、可信硬件、系統(tǒng)安全等等,這些底層技術(shù),共同形成了可信隱私計(jì)算,能夠支撐整個(gè)數(shù)據(jù)密態(tài)方向流轉(zhuǎn),保障持有權(quán)不會(huì)喪失,使用權(quán)和經(jīng)營(yíng)權(quán)不會(huì)讓渡。
韋韜認(rèn)為,當(dāng)前的數(shù)據(jù)要素應(yīng)用已經(jīng)完全走進(jìn)數(shù)據(jù)密態(tài)時(shí)代。因而在可信隱私計(jì)算技術(shù)上,也面臨著三大挑戰(zhàn)。
首先是安全性。密態(tài)事態(tài)下的各種隱私計(jì)算技術(shù)承載著非常重要的使命保護(hù)數(shù)據(jù)安全,保護(hù)個(gè)人隱私。但技術(shù)自身安全性也非常重要。隱私計(jì)算不能成為沙灘上的城堡,但是今天已經(jīng)有了這樣的苗頭。
因?yàn)橄到y(tǒng)太復(fù)雜,涉及域太廣,包括密碼學(xué)、系統(tǒng)安全、可信硬件、機(jī)器學(xué)習(xí)、大數(shù)據(jù)分析,領(lǐng)域非常寬廣,每個(gè)領(lǐng)域都有可能產(chǎn)生安全問(wèn)題,都有可能導(dǎo)致數(shù)據(jù)泄漏。隱私計(jì)算技術(shù)非常多,導(dǎo)致安全標(biāo)準(zhǔn)非常多,現(xiàn)在多方安全計(jì)算、聯(lián)邦學(xué)習(xí)、可信執(zhí)行環(huán)境技術(shù)融合,接下來(lái)該如何做評(píng)判和標(biāo)準(zhǔn)、付出巨大成本以后收益如何衡量,都非常關(guān)鍵,也是下一步要解決的問(wèn)題。
韋韜舉例到,聯(lián)邦學(xué)習(xí)有一些線上泄漏,到底是否應(yīng)該被允許?從實(shí)戰(zhàn)的角度來(lái)看,假如聯(lián)邦學(xué)習(xí)類(lèi)似的技術(shù)泄漏風(fēng)險(xiǎn)用戶是可以接受的,能夠引起大幅度的性能提升,這完全是一個(gè)合理訴求。問(wèn)題是對(duì)于線上泄漏識(shí)別和度量要把控住,不能因?yàn)橛龅骄上泄漏就無(wú)限泄漏,無(wú)限泄漏就會(huì)導(dǎo)致數(shù)據(jù)安全性被破壞,這件事情是不可接受的。安全是實(shí)際攻防結(jié)果,不是理論假設(shè)結(jié)果,這要通過(guò)專(zhuān)業(yè)團(tuán)隊(duì)檢驗(yàn)出來(lái)真的能達(dá)到安全效果,背對(duì)背做相關(guān)測(cè)試,提供足夠強(qiáng)的安全保障。
其次是性能。性能面對(duì)的挑戰(zhàn)其實(shí)非常大,當(dāng)前普遍使用的LR模型還是統(tǒng)計(jì)方法,不是機(jī)器學(xué)習(xí),能夠做的事情相對(duì)有限。而行業(yè)里的機(jī)器學(xué)習(xí)是叫GBDT的樹(shù)模型或者是XGB的樹(shù)模型。今天GBDT在隱私計(jì)算環(huán)境下屬于可用源,一般來(lái)說(shuō)是30萬(wàn)樣本30M專(zhuān)線8小時(shí)左右,這對(duì)于目前的應(yīng)用還是非常大的挑戰(zhàn),迭代非常慢。再往下,深度學(xué)習(xí)模型。深度學(xué)習(xí)模型比GBDT模型迭代更慢,還面臨著跨公網(wǎng)做交互、做專(zhuān)線、帶寬和時(shí)延等計(jì)算瓶頸,
為此,韋韜和團(tuán)隊(duì)做了一個(gè)探索,把可信執(zhí)行環(huán)境、多方計(jì)算和聯(lián)邦學(xué)習(xí)融合在一起,發(fā)現(xiàn)這樣產(chǎn)生的好處是可以通過(guò)可信執(zhí)行環(huán)境計(jì)算大幅度降低密碼學(xué)的成本,能夠消除跨網(wǎng)通信的時(shí)延帶寬瓶頸約束,最后可以通過(guò)密碼學(xué)技術(shù)大幅度增強(qiáng)TEE環(huán)境里面固有的安全問(wèn)題,可以看到,融合技術(shù)是未來(lái)非常重要的方向。
最后是普適性。普適是行業(yè)應(yīng)用最大的挑戰(zhàn)。今天,數(shù)據(jù)主要在計(jì)算密態(tài)化環(huán)節(jié)向大數(shù)據(jù)密態(tài)化環(huán)節(jié)邁步,總體計(jì)算比較簡(jiǎn)單,從原始數(shù)據(jù)到結(jié)果環(huán)節(jié)比較少。但是,大數(shù)據(jù)生態(tài)非常復(fù)雜,里面有豐富復(fù)雜的結(jié)果需要使用,需要多種數(shù)據(jù)分割共同支撐使用,整個(gè)行業(yè)正在向計(jì)算密態(tài)化到大數(shù)據(jù)密態(tài)化跨越。
提及數(shù)據(jù)密態(tài)的未來(lái),韋韜認(rèn)為有兩條路徑。
一是做可信隱私計(jì)算原生生態(tài)。“計(jì)算生態(tài)很多是API決定的,擁有API就綁定在這個(gè)生態(tài)里面。舉個(gè)隱語(yǔ)的例子,隱語(yǔ)從自由管理層到調(diào)度層、算法層、用戶界面層都做了非常多的工作,整個(gè)生態(tài)可以從更靈活的安全性保障做隱私計(jì)算未來(lái)大數(shù)據(jù)支撐,未來(lái)做數(shù)據(jù)要素流轉(zhuǎn)支撐的生態(tài)發(fā)展路徑。”
二是做傳統(tǒng)的大數(shù)據(jù)Spark生態(tài)。這一生態(tài)已經(jīng)支撐了整個(gè)行業(yè)的發(fā)展,從傳統(tǒng)大數(shù)據(jù)生態(tài)走向密態(tài)化的路徑。韋韜認(rèn)為,兩個(gè)路徑在未來(lái)幾年也會(huì)共同往前發(fā)展,核心是要滿足安全性和性能保障下的互聯(lián)互通,最后走向普適。
“我們相信整個(gè)密態(tài)事態(tài)、可信隱私計(jì)算生態(tài)體系一定是大家共建的,我們非常愿意在頂層上面跟大家有更多合作,無(wú)論是安全性、性能還是普適性上非常繁雜,我們也相信這個(gè)生態(tài)會(huì)徹底改變數(shù)字化行業(yè)領(lǐng)域。”韋韜提到,“工作是極其巨大的,需要各行各業(yè)共同參與進(jìn)來(lái),這個(gè)領(lǐng)域有非常好的時(shí)機(jī),未來(lái)發(fā)展會(huì)從計(jì)算密態(tài)化到大數(shù)據(jù)密態(tài)化大數(shù)據(jù)要素密態(tài)化綜合實(shí)現(xiàn),最后支撐整個(gè)數(shù)據(jù)要素行業(yè)高質(zhì)量安全地發(fā)展。”
此外,面對(duì)當(dāng)前人工智能時(shí)代的隱私安全問(wèn)題,韋韜也分享了在隱私計(jì)算領(lǐng)域的相關(guān)實(shí)踐和思考。
當(dāng)前,人工智能進(jìn)入快速發(fā)展期,未知的挑戰(zhàn)也隨之而來(lái)。純粹靠數(shù)據(jù)學(xué)習(xí)生成的人工智能并不可控,提升AI安全能力是從業(yè)者的必答題。
人工智能的發(fā)展程度有很多衡量的標(biāo)準(zhǔn),但從安全維度評(píng)估,它還處于初級(jí)階段。新一代人工智能的發(fā)展和大規(guī)模應(yīng)用不僅要解決數(shù)據(jù)驅(qū)動(dòng)的問(wèn)題,還要解決安全可靠問(wèn)題。
據(jù)韋韜舉例,安全風(fēng)控領(lǐng)域是天然的開(kāi)放空間強(qiáng)對(duì)抗博弈場(chǎng)景,需要與全球最狡詐的黑色產(chǎn)業(yè)團(tuán)伙做高強(qiáng)度對(duì)抗。在這個(gè)領(lǐng)域中,目前單純基于數(shù)據(jù)驅(qū)動(dòng)的智能體系是無(wú)法與之有效應(yīng)對(duì)的。
一方面,需要深入研究機(jī)器智能與專(zhuān)家智能高效協(xié)同的融合對(duì)抗智能;另一方面需要加強(qiáng)AI的可信保障機(jī)制,包括可解釋性、魯棒性、公平性及隱私保護(hù)能力--由此可見(jiàn),人工智能應(yīng)用的時(shí)代下,“智能化”背后的風(fēng)險(xiǎn)挑戰(zhàn)不容忽視,需要一系列的技術(shù)保障。
韋韜認(rèn)為,人工智能的大規(guī)模應(yīng)用步伐正在提速,產(chǎn)業(yè)的大規(guī)模應(yīng)用落地,亟需解決安全可信、協(xié)作共識(shí)、復(fù)雜關(guān)聯(lián)分析、存儲(chǔ)計(jì)算規(guī)模爆炸、降低耗能等問(wèn)題。
簡(jiǎn)單來(lái)說(shuō),當(dāng)前AI時(shí)代的五大挑戰(zhàn)分別是:大規(guī)模數(shù)據(jù)流轉(zhuǎn)及AI應(yīng)用中,如何捍衛(wèi)用戶隱私和數(shù)據(jù)安全?產(chǎn)業(yè)協(xié)同中,如何建立信任機(jī)制,促進(jìn)價(jià)值創(chuàng)造? 大型實(shí)體及數(shù)據(jù)關(guān)系中,如何解決結(jié)構(gòu)復(fù)雜關(guān)聯(lián)問(wèn)題? 數(shù)據(jù)量幾何式爆炸增長(zhǎng),如何解決存儲(chǔ)計(jì)算的性能和成本瓶頸?數(shù)據(jù)爆炸增長(zhǎng),如何降低計(jì)算耗能、更好保護(hù)環(huán)境?
據(jù)了解,螞蟻集團(tuán)也在持續(xù)攻堅(jiān)這五大技術(shù)領(lǐng)域。“要解決AI安全問(wèn)題,就要抓住根源技術(shù),要在隱私計(jì)算、區(qū)塊鏈、圖計(jì)算、分布式數(shù)據(jù)庫(kù)及計(jì)算基礎(chǔ)設(shè)施、綠色計(jì)算等AI大規(guī)模應(yīng)用的“根技術(shù)”上深耕探索。”韋韜表示。
2016年,螞蟻集團(tuán)就開(kāi)始進(jìn)行隱私計(jì)算技術(shù)研發(fā)及規(guī);瘧(yīng)用,打造可信隱私計(jì)算隱語(yǔ)技術(shù)體系,可信隱私計(jì)算框架“隱語(yǔ)”已于今年7月正式開(kāi)源;螞蟻鏈則助力解決供應(yīng)鏈、版權(quán)保護(hù)、跨境貿(mào)易等多個(gè)產(chǎn)業(yè)協(xié)作數(shù)字化的實(shí)際問(wèn)題;螞蟻大規(guī)模圖智能計(jì)算系統(tǒng)TuGraph,是螞蟻集團(tuán)金融風(fēng)控能力的重要基礎(chǔ)設(shè)施,應(yīng)用于能源、電信等行業(yè)。
“只有人工智能技術(shù)的發(fā)展和安全達(dá)到有機(jī)融合,才能以高水平安全助力高質(zhì)量發(fā)展。從螞蟻的實(shí)踐來(lái)看,推動(dòng)AI智能+專(zhuān)家智能的融合協(xié)同,是實(shí)現(xiàn)人工智能在高安全對(duì)抗領(lǐng)域?qū)崿F(xiàn)安全可信的關(guān)鍵路徑。”韋韜說(shuō)。