随着《国家安全法》、《网络安全法》、《数据安全法》及《个人信息保护法》等国家层面的上位法规相继推出,全国各省市陆续跟进推出地方性的数据立法,例如将于2022年1月1日起施行的《上海市数据条例》、今年6月29日表决通过的《深圳经济特区数据条例》等。
其中深圳和上海出台的数据条例中均提到了公共数据开放问题。 
那么,到底什么是数据开放?公共数据开放和政府信息公开究竟有什么区别?这个问题早在2019年10月起实施的《上海市公共数据开放暂行办法》起草过程中被多次讨论。复旦大学数字与移动治理实验室作为课题组全程参与了《暂行办法》的起草工作。本期“数林一叶”就为您解读政府数据开放和政府信息公开的的联系与区别。
  • 政府数据开放不等同于政府信息公开
一个国家有大量基础性、关键性的数据掌握在各级政府部门手中,这些数据是社会的公共资源,在保障国家秘密、商业秘密和个人隐私的前提下,将这些数据最大限度地开放出来,供社会进行融合利用,可以释放数据能量,激发创新活力,创造经济和社会价值,这就是政府数据开放的初衷。
那么,政府数据开放与传统的政府信息公开有何联系,又有何区别呢?
将开放进行到底层
首先,在开放的对象上,数据开放的对象是数据,而不是信息。“数据”是指一手的原始记录,未经加工与解读,不具有明确意义,而“信息”则经过了分析、加工和解读,被赋予了特定意义。可以说,数据是信息的底层,数据比信息具有更大的再利用空间和挖掘潜力。目前,在各国的政府数据开放实践中,开放数据通常呈现为以电子化、结构化、可机读格式开放的数据集。数据集是指由数据组成的集合,通常以表格形式出现,每一列代表一个特定变量,每一行则代表一个样本单位。
传统的信息公开的对象主要是文本形式的文件或经过归总分析后的统计报告。然而,在大数据时代,社会公众和企业对政府信息公开的期望和需求发生了变化,与收到纸质的、文本形式的、非结构化的文件相比,公众开始期望能获得电子的、可机读的、结构化的数据,以进行再利用。可以说,数据开放是信息公开在数据时代的深入发展,将开放推进到了底层,即数据层。
早在2004年,上海市就成为我国首个出台政府信息公开规定的省级地方。当时,上海市的政府工作人员就发现在收到的信息公开申请中有一部分是关于“数据”的申请。如何回应这类申请?他们在那时已依稀感觉到了“数据”与“信息”的不同,从而开始了如何把“数据”像信息那样公开出去的探索,并在2012年上线了我国首个地方政府数据开放平台(data.sh.gov.cn)。
利用,而不仅仅是知情
其次,在开放的目的上,政府信息公开的主要目标是保障公众的知情权,提高政府透明度,侧重于其政治和行政意义,将信息公开作为政府的一种责任。政府数据开放则是不仅要让社会知道,还要让社会能利用政府数据,从而释放政府数据的能量,创造经济与社会价值,开放数据因而被视为政府提供的一项公共服务。
由此,在参与的主体上,数据开放就不仅仅是政府一方的工作,而是需要数据的供给侧和利用端的共同参与,即不仅需要政府把数据开放出来,更需要数据利用者对数据进行有效利用。可以说,政府数据开放的根本目的不在于开放本身,而在于能让社会对政府数据进行充分利用并最终产生价值。
  • 以下这些都不是真正的数据开放
在实践中,统计报告、数据可视化、查询服务和服务应用常被误认为是数据开放,但其实这些都是基于数据所开发出来的数据产品,而不是开放出来的原始数据。所以,以下这些并不是真正的数据开放:
1.政府统计报告
统计报告是一种应用文章,运用统计资料和统计分析方法,以数字与文字相结合的方式,表现所研究的事物本质和规律性。例如,政府发布的某个年度的国民经济和社会发展情况的统计报告。
然而,统计报告发布的往往不是原始的、一手的数据,而是对原始数据进行加工、归总和分析后形成的数据产品,其被再次利用的潜力和价值都不如原始数据。所以,发布统计报告并不等同于开放数据。
2.政府数据可视化
数据可视化是一种数据的视觉表现形式,借助图形化手段,来直观、清晰、形象、有效地传达与沟通信息,其本质是一种以概要形式抽提出来的信息。因此,数据可视化也是基于原始数据而产生的一种数据产品,用户并未获得可视化背后的原始数据集,也无法对这些数据进行再次利用。所以,数据可视化也不等同于数据开放。
3.政府数据查询服务
数据查询服务是指通过某种检索界面让用户输入一定的查询条件后获得相应的匹配结果。数据查询服务虽能让用户获得部分数据内容,但用户并未获得底层的原始数据来进行再次利用。因此,政府数据查询服务实际上是一种基于政府数据所提供的信息服务,而并未开放完整的、原始的、可利用的数据集。
4.政府数据服务应用
政府数据服务应用是政府基于自己所掌握的数据自行开发的服务应用,例如政府开发的各类APP应用。用户虽然能通过这些应用得到服务,却并没有获得原始数据以进行再次利用。因此,这些服务应用也不是政府数据开放。
  • 到底什么是政府数据开放?
近年来,已有多个国际组织、学术机构和政府部门对政府数据开放的基本概念、原则和标准进行了界定。2007年12月,30位开放数据倡导者聚集在美国加利福尼亚州,首次提出了政府数据开放的8项基本原则:完整的、一手的、及时的、可获取的、可机读的、非歧视的、非专属的、免授权的
《联合国电子政务调查报告》将开放政府数据定义为“主动在网上公开政府信息,使任何人都能不受限制地获取、再利用和再分发”。
根据世界银行的定义,开放数据是“能被任何人出于任何目的不受限制地进行自由利用、再利用和分发,并最大程度保持其原始出处和开放性的数据”。开放定义(The Open Definition)指出,“开放”意味着任何人都可以出于任何目的自由地访问、使用、修改和共享数据。“开放性”应具备两个维度的特性:一为技术性开放,即数据应为可机读、非专属性的电子格式,从而能被任何人使用通用、免费的软件获取和利用。数据还应被置于公共服务器上供公众获取,不设密码和防火墙;二为法律性开放,即这些数据必须被置于公共领域,或处于自由利用条款下,受到最低程度的限制。
2015年,《开放数据宪章》将开放数据界定为具备必要的技术和法律特性,从而能被任何人、在任何时间和地点进行自由利用、再利用和分发的电子数据。该宪章还提出了政府数据开放所应遵循的六大原则:第一,默认开放;第二,及时和全面;第三,可获取和可利用;第四,可比较和互操作性;第五,致力于改善治理和公民参与;第六,致力于包容性发展和创新。
我国对于政府数据开放的政策要求也与国际标准相呼应。2017年5月,国务院办公厅印发的《政务信息系统整合共享实施方案》指出,要向社会开放“政府部门和公共企事业单位的原始性、可机器读取、可供社会化再利用的数据集”。2018年1月,中央网信办、发展改革委以及工业和信息化部联合印发的《公共信息资源开放试点工作方案》要求试点地区“提升数据的完整性、准确性、有效性、时效性”,“明确开放数据的完整性、机器可读性、格式通用性等要求。” 
  • 政府数据和公共数据的范围不同
政府数据有狭义和广义之分。狭义上的政府数据仅指由各级政府部门在依法履行职责过程中制作或者获取的,以一定形式记录、保存的各类数据资源。而根据《国际开放数据宪章》的定义,广义上的政府数据不仅包括国家、区域和地方政府、国际政府组织以及广义的公共部门所掌握的数据,还包括外部机构为政府所创建的数据,以及掌握在外部机构手中但与政府项目和服务相关、并具有重大公共利益的数据。
广义的政府数据也可被称为“公共数据”。“公共数据”不仅包括政府数据,还包括政府部门以外的公共事业部门的信息和数据。此外,国有和私有企业受政府委托、得到公共财政支持所创建的数据,以及掌握在这些企业手中但与政府相关、具有重大公共利益的数据也属于公共数据,应向社会开放。
原则上,公共数据开放的范围和方式可根据该机构接受公共财政支持的多少和数据的公共价值大小两个维度来进行确定。数据获得的财政支持越高,具有的公共价值越高,其公共属性也就越高,就越应该免费开放或以尽可能低的收费开放。反之,数据获得财政支持较少,公共价值越低,可不必要求其开放或可允许其在向社会开放时收取适当的费用,以覆盖采集和管理数据的成本。
  • 数据开放就是数据共享吗?
一般情况下,“数据共享”是指在政府内部展开的,而“数据开放”则是政府对外进行的。2015年8月国务院印发的《促进大数据发展行动纲要》中分别提出要“大力推动政府部门数据共享”和“稳步推动公共数据资源开放”。对于前者,具体要求推进国家基础数据资源和信息系统的跨部门、跨区域共享;而对于后者,则指出要推进公共机构数据资源统一汇聚和集中向社会开放。
参考资料:
  • 《开放的树林--政府数据开放的中国故事》,郑磊著,上海人民出版社,2018年8月
  • 《开放不等于公开、共享和交易:政府数据 开放与相近概念的界定与辨析 》,郑磊,南京社会科学,2018年第9期
推荐阅读
继续阅读
阅读原文