7月5日,中國科學(xué)院院士梅宏出席2023全球數(shù)字經(jīng)濟(jì)大會主論壇并發(fā)表主旨演講。梅宏認(rèn)為,數(shù)字經(jīng)濟(jì)時代正在開啟,這是在農(nóng)業(yè)經(jīng)濟(jì)、工業(yè)經(jīng)濟(jì)之后的一種新經(jīng)濟(jì)形態(tài)。數(shù)據(jù)技術(shù)體系、數(shù)字治理體系以及數(shù)據(jù)要素市場構(gòu)成了數(shù)字經(jīng)濟(jì)發(fā)展的三大基石,數(shù)據(jù)成為生產(chǎn)要素將是這個時代的重要特征之一。
梅宏從五個方面提出了大數(shù)據(jù)技術(shù)發(fā)展面臨的一系列挑戰(zhàn),從管理、處理、分析、治理四個維度分析了大數(shù)據(jù)技術(shù)未來發(fā)展趨勢。
第一,如何構(gòu)建以數(shù)據(jù)為中心的計算體系?梅宏表示,線性增長的數(shù)據(jù)處理能力與指數(shù)膨脹的數(shù)據(jù)處理需求存在剪刀差,迫切需要尋找新的性能提升驅(qū)動力,新硬件技術(shù)、人工智能技術(shù)為大數(shù)據(jù)計算體系帶來新的機遇和挑戰(zhàn)。同時,超大規(guī)模數(shù)據(jù)的能耗占比大、增速快,現(xiàn)有計算體系偏重性能,能效不高,可持續(xù)發(fā)展能力有限,帶來了能效方面的挑戰(zhàn)。
第二,如何管理超大規(guī)模的數(shù)據(jù)要素?在梅宏看來,越來越多的數(shù)據(jù)資源正以數(shù)據(jù)要素的形態(tài)獨立存在于不同空間、組織和信任域,并參與數(shù)字經(jīng)濟(jì)活動的全過程,需要對大規(guī)模、跨域的數(shù)據(jù)進(jìn)行高效的組織和管理。數(shù)據(jù)價值最大化要求數(shù)據(jù)組織管理的范圍從傳統(tǒng)的單域模式到跨域模式,帶來跨域管理挑戰(zhàn)。數(shù)據(jù)管理是大數(shù)據(jù)產(chǎn)業(yè)的基礎(chǔ),可用性也是一大挑戰(zhàn)。大數(shù)據(jù)規(guī)模呈指數(shù)級高速增長,大數(shù)據(jù)管理系統(tǒng)往往規(guī)模極大,因此各類錯誤發(fā)生概率不斷提升。另外,還可能存在惡意節(jié)點引發(fā)虛假消息或數(shù)據(jù)篡改等嚴(yán)重問題。
第三,如何滿足大數(shù)據(jù)高效處理的需求?梅宏認(rèn)為,新型數(shù)據(jù)處理需求對現(xiàn)有大數(shù)據(jù)處理系統(tǒng)與架構(gòu)提出多種技術(shù)挑戰(zhàn)。具體來看,實時數(shù)據(jù)的特征是動態(tài)傾斜、稀疏關(guān)聯(lián)、超大容量,需要應(yīng)對資源效率低、時空開銷大、擴(kuò)展困難等技術(shù)挑戰(zhàn);圖數(shù)據(jù)的特征是不規(guī)則訪問,計算訪存比孝依賴關(guān)系復(fù)雜,需要應(yīng)對并行流水效率低、訪存局部性低、內(nèi)外存通道利用率低等問題。
第四,如何實現(xiàn)多源異構(gòu)大數(shù)據(jù)的多模態(tài)融合分析與可解釋性分析?梅宏提出了兩方面挑戰(zhàn):一方面,異構(gòu)多模態(tài)數(shù)據(jù)的融合分析從小規(guī)模、單模態(tài)轉(zhuǎn)變到大規(guī)模、多模態(tài);另一方面,模型在可解釋性、穩(wěn)定性、公平性、可回溯性這四個方面也需要更高的性能和要求。
第五,如何形成系統(tǒng)化大數(shù)據(jù)治理框架與關(guān)鍵技術(shù)?梅宏指出,數(shù)據(jù)要素化需要有效高效的大數(shù)據(jù)治理技術(shù)體系支撐,涉及數(shù)據(jù)匯聚融合、質(zhì)量保證、安全與隱私保護(hù)、開放流通、標(biāo)準(zhǔn)化與生態(tài)系統(tǒng)建設(shè)等多個方面。
關(guān)于大數(shù)據(jù)技術(shù)的未來發(fā)展趨勢,梅宏認(rèn)為,從總體來看,數(shù)據(jù)與應(yīng)用將進(jìn)一步分離,以促進(jìn)數(shù)據(jù)要素化。盡管歷史上數(shù)據(jù)庫技術(shù)的出現(xiàn)帶來了數(shù)據(jù)與應(yīng)用的第一次分離,但這種分離仍不夠,數(shù)據(jù)要作為資源和要素進(jìn)一步獨立于應(yīng)用,真正成為一個獨立存在的實體。高能效大數(shù)據(jù)技術(shù)棧的構(gòu)成是可持續(xù)發(fā)展的關(guān)鍵,特別是在雙碳背景之下,要形成低碳高效、可持續(xù)發(fā)展的路線。要在資源共享、節(jié)能高效的云數(shù)據(jù)中心基礎(chǔ)上,布局全國一體化高能效大數(shù)據(jù)中心,形成低碳發(fā)展新格局。數(shù)據(jù)相關(guān)技術(shù)需要形成大數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范,積極推進(jìn)開源社區(qū)的建設(shè)。
在數(shù)據(jù)管理上,從單域到跨域的數(shù)據(jù)管理需要促進(jìn)數(shù)據(jù)要素的共享與協(xié)同。數(shù)據(jù)管理正在從面向和限定于單域的孤立服務(wù),發(fā)展到跨越空間域、信任域和管轄域的數(shù)據(jù)共享與協(xié)同服務(wù)的新階段,要打破“數(shù)據(jù)孤島”,促進(jìn)數(shù)據(jù)價值的最大化。
在數(shù)據(jù)處理上,近數(shù)處理成為突破性能瓶頸的重要途徑,包括存儲上移、算力下移以及分布式計算模式轉(zhuǎn)變;系統(tǒng)設(shè)計要從擴(kuò)展性優(yōu)先走向性能優(yōu)先,需要擁有性能優(yōu)先的系統(tǒng)設(shè)計、領(lǐng)域?qū)S密浻布托屡d處理方法。
在數(shù)據(jù)分析上,從單域單模態(tài)分析到多域多模態(tài)融合,要實現(xiàn)廣譜關(guān)聯(lián)計算;從聚焦關(guān)聯(lián)到探究因果,要實現(xiàn)分析結(jié)果可解釋。
在數(shù)據(jù)治理上,數(shù)聯(lián)網(wǎng)將成為數(shù)字化時代的新型信息基礎(chǔ)設(shè)施,需要形成一套完整的數(shù)聯(lián)網(wǎng)基礎(chǔ)軟件理論、系統(tǒng)軟件架構(gòu)、關(guān)鍵技術(shù)體系,以數(shù)據(jù)驅(qū)動為手段,研究數(shù)聯(lián)網(wǎng)環(huán)境下保障服務(wù)質(zhì)量與保護(hù)質(zhì)量的原理、機制與方法。
作者丨蔣安昊 趙晨
編輯丨張心怡
美編丨馬利亞
監(jiān)制丨連曉東