※  信息社会政策探究的思想库  ※
※  信息通信技术前沿的风向标  ※
作者简介
张峰
浪潮软件科技有限公司总经理,数字中国研究院政府数据治理中心主任,主要研究方向为数据共享开放、一体化政务大数据体系、数字政府等。
李照川 
浪潮软件科技有限公司副总经理,主要研究方向为一体化政务大数据体系、知识图谱、隐私计算、“互联网+”政务服务、社会治理、政府数字化转型等。
王冠军   
浪潮软件科技有限公司技术总监,主要研究方向为政府数字化转型、数据共享开放、一体化政务大数据体系等。
林一伟   
通信作者。浪潮软件科技有限公司大数据架构师,金融数学与金融工程博士,主要研究方向为隐私计算、风险管理、大数据分析等。
孙源   
浪潮软件科技有限公司行业应用研发部研发负责人,主要研究方向为政府业务数据治理、数字化运营、低代码开发等。
论文引用格式:
张峰, 李照川, 王冠军, 等. 公共数据确权的探索与实践[J]. 信息通信技术与政策, 2023,49(4):34-41.
公共数据确权的探索与实践
张峰  李照川  王冠军  林一伟  孙源
(浪潮软件科技有限公司,济南 250000)
摘要数据要素的权属问题是数据要素市场培育的基础性问题,关系到数据要素高效流通和价值实现。通过对公共数据要素市场进行特性分析,总结提出公共数据确权存在的三个难点。基于数据资源持有权、数据加工使用权、数据产品经营权的产权运行机制,并结合公共数据流通的五个环节,构建公共数据资源目录、数据分类分级、数据产权登记相结合的“三管齐下”式确权方案。
关键词:数据要素;公共数据确权;数据资源目录;数据分类分级;数据产权登记
0  引言
当前,全球经济正经历着从工业经济时代到数字经济时代的转型。数据作为经济数字化转型过程中的一项新型关键生产要素,对于生产效率的提升具有明显乘数效用。《中共中央 国务院关于新时代加快完善社会主义市场经济体制的意见》(简称《意见》)提出,要“加快培育发展数据要素市场,建立数据资源清单管理机制,完善数据权属界定、开放共享、交易流通等标准和措施,发挥社会数据资源价值”[1]。《意见》在指明我国数据要素市场培育方向的同时,也体现出数据权属界定在数据要素整个流通过程中的基础地位。
《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》(简称“数据二十条”)明确提出,要“建立公共数据、企业数据、个人数据的分类分级确权授权制度”[2],进一步为我国全方位培育数据要素市场,最大化释放数据要素价值提出了最新指引。现阶段,我国90%的可用数据为公共数据[3]。因此,探索公共数据确权方案,不仅能够促进公共数据开放流通,激发公共数据价值释放,同时对企业数据和个人数据的确权具有重要的参考意义,有益于推动整个数据要素市场的建设与发展。
本文通过对公共数据要素市场进行特性分析,总结归纳出公共数据确权存在的三个难点。在此基础上,基于“数据二十条”提出的数据资源持有权、数据加工使用权、数据产品经营权“三权分置”的产权运行机制,结合公共数据流通各环节,构建公共数据资源目录、数据分类分级、数据产权登记相结合的“三管齐下”式确权方案。
1  公共数据要素市场特性分析
公共数据要素市场是各参与方通过投入劳动和其他生产要素,推动公共数据要素依照数据形态链有序流动,提高公共数据要素配置效率的场所。公共数据要素市场的主体可以分为数据来源者和数据处理者,客体是公共数据要素。数据来源者和数据处理者可以凭借各自在公共数据要素市场投入的劳动和其他要素贡献获得合理回报。
1.1  公共数据要素市场客体分析
1.1.1  数据要素
数据要素是指根据特定生产需求汇聚、整理、加工而成的计算机数据及其衍生形态[4]。从数据要素的定义可以看出,数据要素形态可以分为数据资源和数据产品两个阶段。数据要素形态链如图1所示。
图1   数据要素形态链
原始数据主要源自于个人、企业与公共服务机构等在日常生活和生产经营活动中形成的电子化记录,并且未经过加工处理,通常不能直接流通。原始数据积累到一定规模,经过必要的清洗和预处理形成的标准化数据集,被称为数据资源,在这个阶段,数据已经具备了潜在的使用价值。数据资源进一步经过分析、处理、加工后,就转化为可流通、可交易的数据产品。通常来说,数据产品包括数据库、数据模型、数据查询接口、数据核验接口等产品和服务。
传统的生产要素,例如土地、劳动力、资本、技术等,通常拥有清晰的、可分割的客体和明确的、独占性的主体。而数据要素与传统的生产要素相比,则有非常明显的区别。首先,数据要素作为依附于信息系统的电子记录,具有明显的虚拟性。其次,数据要素的主体具有多元性。数据的来源者、处理者都是数据要素产生过程中的参与主体,甚至一条数据可能包含了不同数据来源者的信息,凝结了不同数据处理者的劳动,主体比较繁杂。最后,数据要素还具有鲜明的非竞争性和潜在的非排他性。数据要素的非竞争性体现在同一数据可以被不同的主体使用,并且使用过程中数据不会发生任何损耗或折旧,非排他性则体现在对于开放数据,一个主体使用的同时,不会影响或阻止其他主体使用。在这一点上,传统的生产要素通常都具有明显的竞争性和排他性。数据要素与传统的生产要素之间的区别使得数据要素难以直接沿用传统的生产要素的规则体系进行确权管理。
1.1.2  公共数据
在“数据二十条”出台之前,多地政府发布过关于公共数据的管理办法,其中对于公共数据的定义基本都涵盖了以下共同关键词:公共管理和服务机构、依法履行职责、提供公共服务。“数据二十条”对公共数据给出了更加清晰明确的定义,即“各级党政机关、企事业单位依法履职或提供公共服务过程中产生的数据”,这个定义体现出公共数据在拥有数据要素共性的同时还兼具公共性特性。
公共数据的公共性主要体现在三个方面:首先,公共数据产生主体具有公共性,除各级党政机关外,定义中提到的提供公共服务的企事业单位,通常包括教育、卫生健康、供水、供电、供气、供热、环境保护、公共交通等领域的公共企事业单位。其次,公共数据产生过程具有公共性,公共数据是在依法履职或者公共服务过程中产生,整个过程的出发点是提升公共部门的公共服务效率和水平。最后,相较于其他类型数据要素,公共数据具有鲜明的开放共享特征。公共数据的开放共享是各级党政机关和企事业单位为享有数据权利,应承担的一项义务。公共数据的开放共享旨在为全社会提供可机读、可复用的数据要素,进而促进生产效率的提升。“数据二十条”明确指出应当加强公共数据的汇聚共享和开放开发。在此之前,深圳、上海、山东等地政府也先后通过出台数据开放办法或数据条例,明确公共数据以开放共享为原则,不开放共享为例外[5-7]
1.2  公共数据要素市场主体分析
“数据二十条”将公共数据要素市场各参与方分为数据来源者和数据处理者。其中,公共数据来源者包括自然人、法人和非法人组织等,公共数据处理者包括各级党政机关、企事业单位及依法取得授权的公共数据运营服务商等,主要参与数据的采集、加工、交易等活动。双方在公共数据要素市场扮演的角色如图2所示。
图2   公共数据要素市场主体关系
公共数据来源者通过向数据处理者提供数据或者让渡数据权利来获取公共服务,公共数据处理者采集原始数据,并进行数据清洗、整理,形成数据资源,进一步通过脱密脱敏、数据建模、加工分析等生产活动,将数据资源以模型、接口、核验等数据产品形式向社会提供,从而实现公共数据的开放共享和流通交易。
2  公共数据确权难点分析
2.1  数据权利分类问题
数据确权的第一个难点在于数据相关权利分类的界定。目前,不管是学术界还是各地政府,都对数据相关权利分类做出了不同程度的学术探讨或政策实践。
肖冬梅等[8]认为数据权利是一种兼具人格权和财产权双重属性的权利,并进一步将数据人格权细分为知情同意权、修改权、被遗忘权,将数据财产权细分为采集权、可携带权、使用权和收益权。申卫星等[9]提出构建数据所有权和数据用益权的二元权利结构。武长海等[10]认为应当对数据所有权进行分类,并就数据安全制度设立自主选择权、被遗忘权。
在政策实践方面,西安、石家庄、鄂州等地政府先后通过出台管理办法等方式,明确数据权利内容。其中,西安、石家庄在规制政务数据时,指出政务数据资源权利包括所有权、采集权、管理权、使用权和收益权[11-12],鄂州将数据权利性质明确分为数据人身权和数据财产权[13]
2.2  数据权利归属问题
数据确权的第二个难点在于数据权利的归属问题。公共数据大体上可以分为两类,一类是无身份标识数据,如国土空间用途、土地、矿产、环境、气象等自然资源和空间地理基础数据,不存在数据来源者;另一类是有身份标识数据,通常包含了自然人、法人或非法人组织等的身份信息,可以通过数据对个体进行识别。前者排除了多元数据主体的约束,所以在合法性原则下,这类数据可以被认为归国家或政府所有。对于有身份标识公共数据的权利归属问题,有学者从尊重数据权利源泉的角度出发,认为应当赋予数据来源者对该公共数据的所有权[9],也有学者从公共数据的公共资源属性或国家公权力角度出发,认为应该归国家或政府所有[14-15]
在数据权属方面,一个值得借鉴的对象是数据保护起步较早的欧盟委员会。欧盟委员会通过出台《通用数据保护条例》等政策,全面保护数据主体的绝对控制权[16]。对于任何可识别的“个人数据”,其权利严格归属于自然人;对于个人数据以外的充分匿名、不可识别的“非个人数据”,数据控制者和数据处理者享有非绝对的“数据生产者权”。不过,这种区分在实践中往往具有很大的争议和较高的成本,使得数据控制者和数据处理者的数据使用权受到极大限制,造成整个欧洲的数字经济落后于中国、美国等国家的局面。
目前,我国尚未在国家立法层面确立公共数据的所有权。不过,自2016年以来,先后有福建、广东、重庆、长沙等地政府出台相应管理办法,指出政务数据归国家或政府所有。
2.3  数据流通环节问题
数据确权的第三个难点源自数据流通环节的复杂多样。公共数据从数据产生到价值释放的流通过程大致可分为数据采集、数据开放、数据共享、数据加工、数据交易五个环节(见图3)。公共原始数据经过这五个不同环节,完成到公共数据资源及公共数据产品的转变。整个过程涉及数据来源者和数据处理者等不同数据主体之间的权利平衡。因此,公共数据确权在每个流通环节中都面临着数据主体多元、数据权利交错等难题,需要根据不同确权场景进行细致梳理,从而实现公共数据的合理确权。
图3   公共数据流通环节
3  公共数据确权方案
3.1  “数据二十条”构建公共数据要素市场顶层设计
“数据二十条”明确提出“建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制”,为破解数据权利分类问题指明了方向。
3.1.1  数据资源持有权
基于公共数据的非排他性和非竞争性,“数据二十条”淡化所有权,突出数据主体依法依规获得的数据资源持有权。依据“数据二十条”中“合理保护数据处理者对依法依规持有的数据进行自主管控的权益”,可以认为数据资源持有权主要包含:自主管理权,即持有者可自主决策对数据的保存、更新和使用等行为;自主控制权,即持有者拥有数据资源的排他性和竞争性权益,可以同意或拒绝他人获取自身持有的数据。
3.1.2  数据加工使用权
“数据二十条”指出,“在保护公共利益、数据安全、数据来源者合法权益的前提下,承认和保护依照法律规定或合同约定获取的数据加工使用权”,这意味着数据处理者在取得数据加工使用权时,应该满足两个前提:一是对数据的加工使用应该保护公共利益、数据安全和数据来源者的合法权益;二是应当符合法律规定或者得到数据资源持有者的授权。
3.1.3  数据产品经营权
数据产品经营权的权利主体通常是数据处理者,权利客体是数据资源经过分析、处理、加工后形成的数据产品。这项权利旨在保护数据处理者依据投入的劳动和其他要素贡献获得合理回报,推动数据要素收益向数据价值和使用价值的创造者合理倾斜,强化基于数据价值创造和价值实现的激励导向。
3.2  “三管齐下”式确权思路
综合借鉴学术界的积极探索,可以发现单一的确权制度结构难以有效解决数据权属问题,需要在实行公共数据资源目录统一管理的基础上,综合运用分类分级和产权登记工具,利用差异性制度“三管齐下”式进行确权。公共数据确权方案如图4所示。
图4   公共数据确权方案
(1)编制公共数据资源目录,实行“一数一源”。各级党政机关和企事业单位依据政府定机构、定职能、定编制“三定”方案规定的职能职责,按照一项数据有且只有一个数源部门的原则,编制本单位的公共数据资源清单。各单位依据统一的技术标准和编制规范在法定职权范围内采集、核准与提供本单位全部公共数据,并汇总形成公共数据资源目录。将公共数据资源目录作为公共数据资源持有权的确认依据。
(2)依据相关法律法规,制定数据分类分级制度。按照《中华人民共和国数据安全法》提出的分类分级原则,细分数据来源、数据主体、敏感程度、使用环节等场景,制定公共数据资源的分类分级制度,并以此作为公共数据开放和共享的基础。
将公共数据按照开放类型分为无条件开放、有条件开放和非开放三类。涉及依法依规予以保密或者承载个体信息的,列入非开放类。持有这类公共数据原则上不再具备数据加工使用权和数据产品经营权,依法进行脱密脱敏处理,或者相关权利人同意开放的除外。用于公共管理、公益事业的公共数据,采取有条件无偿开放;用于产业发展、行业发展的公共数据采取有条件有偿开放。有条件开放本质上是体现了“谁投入、谁贡献、谁受益”的原则。其他公共数据列入无条件开放类,公众可以共享这部分数据的权益。
(3)进行数据产权登记。结合公共数据流通的五个环节进行数据产权登记,依据数据要素形态链中数据的不同形态,将产权登记分为数据资源登记和数据产品登记,重点突出数据权利主体、数据权利范畴和数据权利变更等内容,保护公共数据流通过程中各参与方的合法权利。在原始数据经采集变为数据资源的阶段,依据公共数据资源目录进行数据资源持有权登记。在数据资源经加工变为数据产品阶段,依据公共数据分类分级制度,明确公共数据的开放共享类别,在此基础上登记以开放、共享、交易等方式实现的数据加工使用权变更。对数据处理者通过投入劳动和其他要素贡献获得的数据产品进行数据产品经营权登记。
4  案例分析
为进一步说明公共数据确权方案实践逻辑,揭示公共数据资源目录、数据分类分级、数据产权登记的相互作用机制,选取某市某单位数据治理实施案例进行分析。本案例中,基于本文提出的公共数据确权方案,开展数据治理工作,实现了数据汇集互联和共享应用,更好发挥了数据要素在相关业务中的支撑和辅助决策作用。
4.1  数据治理实施路径框架
根据“促进数据融合应用,提升责任业务效能”的数据治理总体目标,将数据治理实施路径划分为数据治理能力建设、数据共享建设、数据应用建设三个阶段。其中,数据治理能力建设阶段主要完成数据资源目录的编制工作,数据共享建设阶段完成数据分类分级等安全管理工作,并以此为依据开展数据共享交换,数据应用建设阶段开展数据指标和数据分析模型的设计、开发和应用部署等工作。本案例中并未涉及到公共数据的交易环节,因此相关数据产权登记工作并未进行着重考虑。图5为数据治理实施路径框架。
图5   数据治理实施路径
4.2  数据治理实施路径说明
4.2.1  数据治理能力建设
(1)现状调研和规划
开展数据治理能力调研,全面了解各处室数据治理现状,对数据治理现状进行评估,并研究规划数据治理体系。
(2)数据资源梳理和编目
通过问卷调研和分析,了解信息系统建设情况、业务流程建设情况,以及数据资源管理和应用情况,摸清数据家底。设计规范数据资源目录的业务框架,完成元数据的人工和自动化采集入库,并按照业务主题、来源方、系统等多维度,实现数据资源的编目管理。
(3)制定业务数据标准规范
根据各处室数据标准化需求,梳理业务分类树,制定统一的数据标准,包括信息项的业务定义、业务规则、统计口径、制定依据、数据类型、数据长度、取值范围、归属部门等属性,规范数据的定义和使用(见图6)。制定数据标准管理规范,促进数据标准的落地执行,确保业务系统的数据资产在交换和使用过程中的一致性和准确性。
图6   数据标准体系
4.2.2  数据共享建设
数据共享建设阶段清理整合分散、独立的业务信息系统,明确各处室信息系统互联互通范围,规划分层次的数据共享模式,制定数据交换标准,建设数据共享平台,形成覆盖全部业务的数据共享体系,合理打通信息孤岛,满足体系内部数据共享和面向外部机构的数据开放需求(见图7)。
图7   数据共享体系架构
(1)数据采集汇聚
利用通用数据采集工具,对业务数据等内部数据及从第三方获取的外部数据实施采集,将其传输、归集至数据湖。
(2)数据加工处理
采集汇聚的内外部数据来自多个数据源,数据类型多样,数据质量也存在差异,需要进行全面的数据融合治理,对数据进行清洗、标准化和质量问题处理,形成标准化、高质量的业务数据。
(3)数据仓库建设
以前期数据采集汇聚、加工处理为基础,进一步构建数据组织,建立业务数据仓库,采用特征标签、归一集成等多种手段实现不同来源数据资源关联融合,围绕财务管理、资产管理等核心数据形成主题库、专题库、标签库等,实现为上层服务和共享应用提供有组织的数据集合,提升数据价值,满足数据共享应用要求。
(4)数据安全管理
数据安全管理提供数据分类分级、敏感数据发现、数据脱敏、数据溯源、资产风险分析、资产安全报表、安全管理与审计、监控运维、隐私保护等功能,为数据全生命周期提供安全保障。
(5)数据共享交换
通过数据集交换和API接口等方式,支撑数据共享交换、互联互通,实现内外部跨层级、跨系统、跨部门的数据共享和业务协同。根据当前的业务主题和组织架构,通过统一的数据管理和使用门户,将组织好的内容进行数据交换。建立多层次数据共享模式,实现多层次数据共享管理。
4.2.3  数据应用建设
(1)数据分析
设计和开发数据指标和数据分析模型,如风险预警分析模型、项目管理分析模型等,实现对业务对象的多维度、多角度分析,实时掌握业务整体情况,实现对业务对象精细化管理和分析决策支持。对分析的结果,利用多维分析工具,例如电子表格、数据图表、个性化仪表盘等,分别在电脑端和移动端进行展示。
(2)数据应用场景
围绕业务要求,设计和开发数据应用场景,如资产管理、风险预警、稳增长促发展等。
(3)数据可视化
针对提出的业务模式智能化、业务方式可视化的新要求,基于数据共享体系建设,以业务对象画像为重点,建立可视化指标体系,构建动态、协同、可视化的数字服务新模式。
巩固提升数据应用能力,定期对数据建模分析、数据应用场景建设、数据可视化等能力和成效进行评价和改进提升。
5  结束语
从首次增列数据作为生产要素以来,国家不断提出要加快培育发展数据要素市场,构建数据产权、流通交易、收益分配、安全治理制度规则,统筹推进数据要素市场体系;并进一步指出,构建全国统一大市场,深化要素市场化改革,建设高标准市场体系。“数据二十条”更是全方位构建了数据要素市场的顶层设计,为我国今后一段时期内数据要素发展指明方向。本文构建的公共数据资源目录、数据分类分级、数据产权登记相结合的“三管齐下”式公共数据确权方案,是对数据确权问题,基于“数据二十条”做出的一次有益尝试。相信未来随着数据基础制度体系的不断完善和优化,我国数据要素市场一定能够蓬勃发展,实现全体人民共享数字经济发展红利。
An exploration and practice of public data property rights confirmation
ZHANG Feng, LI Zhaochuan, WANG Guanjun, LIN Yiwei, SUN Yuan
(Inspur Software Technology Co.,Ltd., Jinan 250000, China)
Abstract: The property right of data factor is a basic issue in the development of data factor market, which is related to the efficient circulation and value realization of data factor. By analyzing characteristics of the public data factor market, three problems in the public data property rights confirmation are summarized. Based on the operation mechanism of separating ownership of data resources, data processing and use rights, and data product management rights, a three-pronged scheme for data property rights confirmation is constructed by combining with the five links of public data circulation. This scheme combines the catalog of public data resources, data classification, and registration of data property rights.
Keywords: data factor; public data property rights confirmation; catalog of data resources; data classification; registration of data property rights
本文刊于《信息通信技术与政策》2023年 第4期
主办:中国信息通信研究院
《信息通信技术与政策》是工业和信息化部主管、中国信息通信研究院主办的专业学术期刊。本刊定位于“信息通信技术前沿的风向标,信息社会政策探究的思想库”,聚焦信息通信领域技术趋势、公共政策、国家/产业/企业战略,发布前沿研究成果、焦点问题分析、热点政策解读等,推动5G、工业互联网、数字经济、人工智能、区块链、大数据、云计算等技术产业的创新与发展,引导国家技术战略选择与产业政策制定,搭建产、学、研、用的高端学术交流平台。
《信息通信技术与政策》投稿指南
为进一步提高期刊信息化建设水平,为广大学者提供更优质的服务,我刊官方网站已正式投入运行,欢迎投稿!
推荐阅读
专题丨开放与运营:公共数据价值实现的双路径
专题丨数据要素市场建设的关键突破口:公共数据授权运营
专题丨数据要素标准体系建设研究
专题丨我国数据要素研究热点及发展趋势分析
专题丨我国数据要素市场培育进展与趋势
专题导读:数据要素
《信息通信技术与政策》2023年第49卷第4期目次及摘要
“在看”我吗?
继续阅读
阅读原文