近些年,隨著大數據和人工智能的快速發(fā)展,數據已成為推動社會經濟發(fā)展的創(chuàng)新動力、產業(yè)創(chuàng)新發(fā)展的關鍵驅動,更成為組織發(fā)展的戰(zhàn)略資源和資產。雖然我國是互聯(lián)網和數據大國,但是高質量數據集還較少,數據流通和共享程度較低,數據資源開發(fā)利用面臨諸多問題,如企業(yè)或行業(yè)內數據孤島現(xiàn)象較為普遍,數據開發(fā)利用率低、數據侵權問題突出等。這些問題導致數據持有者“不愿共享、不敢共享”,嚴重制約了我國數據要素市場和數字經濟的發(fā)展。
2023 年,我國數據生產總量約為32.85澤字節(jié)(ZB),但僅有2.9%的數據被保存,企業(yè)超過一年未使用的數據占比近四成,大量數據處于“沉睡”狀態(tài),數據要素價值尚未充分釋放。究其原因,客觀上數據要素“供給—流通—應用”的市場化循環(huán)體系不暢通是關鍵癥結。
▲ 國際數據空間數據資源的概念表示
數據主權是國際數據空間的核心價值取向之一,其定義為自然人或公司實體對自身數據擁有完全自決的能力。具體而言,數據主權是指國家在其主權管轄范圍內,對個人、企業(yè)和政府在數據生產、流通、利用、管理等各環(huán)節(jié)享有至高無上的排他性權力。數據空間的核心功能可以概括為數據發(fā)現(xiàn)和數據共享兩個方面。數據共享一直以來都是人們的美好愿望,也是數據的本質屬性之一。數據共享是指讓不同地方,使用不同計算機、不同軟件的用戶能夠讀取他人數據并進行各種操作、運算和分析。顯然,數據主權和數據共享是一對矛盾體。然而,當今社會數據已經成為生產要素、資產,以及企業(yè)創(chuàng)新發(fā)展的關鍵動力。而且,數據只有通過使用才能實現(xiàn)其價值。因此,如何在確保數據持有者的權益得到合理保護的條件下,促進數據的高度共享,實現(xiàn)數據價值的最大化,是數字經濟時代的重要論題。
在此背景下,2024 年11 月21 日,國家數據局印發(fā)《可信數據空間發(fā)展行動計劃(2024—2028年)》(國數資源〔2024〕119 號),多地陸續(xù)也印發(fā)相關工作計劃。一時間,“可信數據空間”成為熱詞。那么,什么是可信數據空間?為何要建設可信數據空間?可信數據空間與我國數字經濟建設、數據要素市場建設有何關系?如何建設可信數據空間?“可信”具體又指什么?一系列問題亟待解答。
我是幸運的。2006~2011年期間,我在國家圖書館研究院任職,作為數據資源建設領域的首席專家,親身參與了中國數字圖書館的建設,并組織開展了“國家圖書館發(fā)展戰(zhàn)略研究”。中國數字圖書館本質上就是一個基于互聯(lián)網的“文獻信息資源共享利用空間”,其目標是為全球用戶提供優(yōu)質的中文知識資源,同時也為我國讀者提供豐富的外文資源。在我看來,這便是數據空間的雛形。
作為一名學者,當看到國家出臺一系列發(fā)展數字經濟、建設數據要素市場的政策時,內心難掩激動。2024年春天,我便萌生了撰寫一本關于數據資源開發(fā)利用學術著作的想法。尤其是2024年11月21日,國家數據局印發(fā)《可信數據空間發(fā)展行動計劃(2024—2028 年)》,我如獲至寶,反復研讀。數據空間建設涉及信息資源管理學科的理論與方法,如數據集成、數據語義互操作、元數據代理、數據聯(lián)合目錄等,我從中看到了學科發(fā)展的新機遇,也更加堅定了撰寫本書的信念,遂將書名定為《可信數據空間建設理論與方法》。
索傳軍
2025年春于中國人民大學
可信數據空間建設理論與方法
索傳軍著
北京 : 科學出版社, 2025.6
ISBN 978-7-03-082107-2
《 》正是為了回答上述問題而撰寫,從數據空間的基本概念入手,分析和探討了數據空間的定義、類型、特征、功能、架構、組件和關鍵技術,以及數據空間與數據要素市場的關系等基礎理論問題;同時,結合具體實例,從多學科視角對數據空間內數據安全與信任體系構建、數據連接器與參與者認證、數據集成與互操作方法、信息模型與詞匯表設計、數據生態(tài)體系建設等重要問題進行了深入且系統(tǒng)的論述。全書由四部分組成。
▋第Ⅰ部分是可信數據空間概論,包括可信數據空間概述(第1 章)、可信數據空間的架構(第2 章)、數據空間關鍵技術和組件(第3 章)。從整體上對數據空間是什么,具有什么特征和功能,其體系架構(業(yè)務架構、功能架構和系統(tǒng)架構)如何,以及數據空間涉及哪些關鍵技術和核心組件等進行論述。目的是讓讀者對數據空間有一個整體認識。
▲ 數據空間的功能構件
▋第Ⅱ部分是數據空間信任體系構建,包括可信數據空間信任體系建設(第4章)、可信數字身份與參與者信任網絡構建(第5 章)、數據空間認證機制與認證框架(第6 章)。主要對信任體系是什么,以及如何構建數據空間信任體系等進行論述。信任是數據空間數據流通和交易的前提和基礎。在國際數據空間內,信任包括靜態(tài)信任和動態(tài)信任。對數據空間參與者(包括數據提供者和消費者等)、核心組件和應用程序運行環(huán)境等的認證屬于靜態(tài)信任。本書將密碼學的信任網絡理論應用于數據空間,建立參與者信任網絡,屬于動態(tài)信任。同時,本書提出三層架構的“信任體系”。一是不同區(qū)域、不同國別數據空間,在文化制度、價值觀等方面能夠相互包容和理解;二是數據空間參與者之間的信任;三是數據空間提供的數據集和數據服務,以及交易活動是真實的、可信的、高質量的。
▋第Ⅲ部分是數據互操作與共享生態(tài)建設,包括數據連接器(第7 章)、數據空間信息模型與詞匯表(第8 章)、數據集成與語義互操作(第9 章)。互操作是數據共享的基礎。該部分主要論述如何解決數據空間內數據的互操作問題?!稓W洲互操作法案》定義了一種適用于所有數字公共服務的互操作性模型,包括法律、組織、語義和技術四個層面。在數據空間內通常涉及技術互操作和語義互操作兩個方面。第7 章主要論述數據空間的關鍵組件——數據連接器和基于協(xié)議的技術互操作,第8 章和第9 章主要論述數據語義互操作的相關問題。
▲ 數據集成實例:汽車導航數據集成架構
當前,國際數據空間采用務實的、以工作流為導向的數據集成方法,這種方法已在數據倉庫等場景和其他集成方案中得到成功應用。在國際數據空間中,數據集成通過連接器利用語法分析框架作為路由機制,實現(xiàn)工作流數據的集成。圖中展示了一個汽車導航的數據集成架構。
▋第Ⅳ部分是數據生態(tài)體系建設,包括數據空間參與者角色及主要業(yè)務活動(第10 章)、數據空間內數據資產管理(第11 章)、數據空間治理(第12 章)。數據空間的核心功能是通過營造“安全、可信、可控”的數據流通和交易環(huán)境,使所有參與者實現(xiàn)價值共創(chuàng)?;蛘哒f,數據空間的最終目標就是構建支撐數據要素市場健康發(fā)展的數據生態(tài)。參與者是數據活動的主體,第10 章論述數據空間參與者的類型及其主要承擔的角色,以及數據空間開展的主要業(yè)務活動。數據空間內的數據資產是數據交易的客體,數據消費者如何發(fā)現(xiàn)和找到自己所需的數據是關鍵問題,第11 章主要論述元數據代理和統(tǒng)一數據目錄體系建設等問題。第12 章在國際數據空間治理框架的基礎上,論述數據空間治理的主要內容和方法。
▲ 數據空間參考架構模型的三個維度
數據空間建設涉及計算機科學、數據科學、信息資源管理和市場學等學科的理論和方法,是一個典型的多學科研究領域。因此,可以從不同角度去思考、理解和定義它。但無論如何理解和定義,其目標是一致的,都是為了促進數據的安全可信、高效流通、交易和共享,進而實現(xiàn)數據的價值,實現(xiàn)多元主體價值共創(chuàng)。需要明確的是,數據空間是一個功能性框架,任何數據空間都需要依據特定目標和需求進行規(guī)劃、設計和開發(fā)。另外,數據空間建設不僅僅是技術問題,還涉及法律、經濟、管理和治理等多方面的問題。
在本書的編寫和相關問題的研究過程中,得到了鄭州大學“雙一流”建設新興交叉學科培育項目“數據要素治理”,以及鄭州航空工業(yè)管理學院信息管理學院的支持。多位老師參與了數據要素市場治理與數據空間內數據資產管理等方面問題的討論和研究,其中,鄭州大學的楊瑞仙和金燕教授編寫了第11 章,鄭州航空工業(yè)管理學院的李偉超教授編寫了第12 章。
本文摘編自《可信數據空間建設理論與方法》(索傳軍著. 北京 : 科學出版社, 2025.6)一書“前言”“后記”,有刪減修改,標題為編者所加。
ISBN 978-7-03-082107-2
責任編輯:孫力維 趙艷春
本書從數據空間的基本概念入手,分析和探討了數據空間的定義、類型、特征、功能、架構、組件和關鍵技術,以及數據空間與數據要素市場的關系等基礎理論問題;同時,結合具體實例,從多學科視角對數據空間內數據安全與信任體系構建、數據連接器與參與者認證、數據集成與互操作方法、信息模型與詞匯表設計、數據生態(tài)體系建設等重要問題進行了深入且系統(tǒng)的論述。
本書對從事數據空間建設的相關專家、技術人員,以及高校和科研院所中從事相關問題研究的人員具有重要的參考價值。
(本文編輯:劉四旦)
專業(yè)品質 學術價值
原創(chuàng)好讀 科學品位
一起閱讀科學
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.