在大数据和数字经济快速发展的背景下,各国政府高度重视数据的战略意义,纷纷出台多项专门政策予以支持,中国亦不例外。2015 年以来,大数据已经上升为中国的国家发展战略。2019 年,党的十九届四中全会明确指出“健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决定报酬的机制”,充分肯定了数据生产要素的地位,肯定了数据对于生产和价值创造的贡献。
李静萍教授刊发在《统计研究》期刊中的论文《数字资产核算研究》深入讨论了关于数字资产核算的三个重大问题:第一,数据是否具有资产属性;第二, 如何确定数据资产的核算对象;第三,如何对数据资产开展核算。以下就这三部分内容进行简要介绍。

一、数据的属性辨析

(一)数据的概念与范围界定

在知识管理领域,常用“数据-信息-知识”(DIK)的层次结构来表达数据、信息、知识三者之间的关系。在此框架内数据被认为用户和IT专家从业务需求中提取的未经加工的事实和观察,数据经过分析在特定情境之下具有含义从而转化为信息,信息经过体系化后用于决策即形成指导人们行动的知识。当前数字资产核算中讨论的数据就是DIK框架下的数据。
数据常常被混同于数据库,要对二者有明确区分。数据库和数据分析软件是数据开发过程的产物。数据库和数据分析软件蕴含了DIK框架下的信息和知识,是知识产权产品,而不属于数据。数据的价值需要通过数据开发过程才能发挥出来。
此外,在数据资产核算中考察的数据是未经开发的数据,具体表现为变量及其取值。其形式是多样化的,可以是结构化的也可以是非结构化的,可以是数字,也可以是文字、语音、图像、视频等。其来源也是多样化的,可以来源于机构单位自身,例如企业和政府的财务数据和业务数据等、个人的 身份数据和行为数据等;也可以从单位外部取得,例如统计调查得到的数据、电子商务中记录的客户信息或交易信息、遥感采集的影像数据、移动通信记录的社交数据、物联网记录的业务数据等。最后,数据资产核算所指数据是真实的数据,是客观记录,而不是模拟结果。

(二)数据的属性

数据具有非生产属性。国民经济核算中的生产是经济生产,即在机构单位负责控制和管理下,利用劳动、资本、货物和服务投入,生产出货物和服务的活动。如果将数据视为生产的产出,那么就必须明确数据的生产者。有观点认为,数据是由数据主体生产的。这种观点下,经济社会主体活动伴生的数据都看做经济社会主体的生产产出,生产的边界将无限扩大,任何个人和机构的任何活动都可以进入生产边界,GDP、失业率等指标都会失去指示意义。另一种观点是数据是由数据采集者生产的。这种观点的问题在于,数据作为一种客观事实和观察,是经济社会活动的伴生物,独立于数据采集而存在。例如消费者的购物数据,无论采集者是否搜集,这个数据都存在,数据采集只是将数据记录下来,而非生产了这个数据。基于对以上两种观点的辨析,我们认为数据并非任何机构单位生产的产出,不能通过生产进入国民经济核算体系,因此其进入国民经济核算体系的唯一途径只能是作为非生产资产。
数据具有资产属性。判断数据是否具有资产属性,需要深入分析数据的经济所有权和收益性。(1)数据的收益性。数据的价值在于应用。企业部门或政府部门会建立数据库,通过数据分析而获得利益。从企业方面看,数据分析有助于洞悉客户行为,提供个性化服务,开发新商业模式,提高生产效率,增加收入,节约成本,控制风险,带来经济收益;从政府方面看,数据分析则有助于更精准、更及时地分析和预判经济社会走势,降低社会成本,控制社会风险,提高政策有效性。从这个意义上说,记录在数据库中的数据具有收益性。从住户部门看,个人数据的总价值也不容忽视。个人通过数据获益的一种典型方式是向数字服务企业(如数字媒体)交换免费服务。住户部门虽然没有获得直接的经济利益,但是所获得的免费服务本质上就是住户依托个人数据获得的经济利益。(2)*数据的所有权*。对于机构单位内部的数据,机构单位就是数据主体,,因此机构单位无疑既是数据的法定所有者,也是经济所有者。对于机构单位从外部获得的数据,机构单位与数据主体分离,如果是通过统计调查搜集的数据,通常都会征得数据主体——即被访者的同意,机构单位拥有对数据的控制和使用权,以及由此带来的经济收益,因而是数据的经济所有者; 如果机构单位以免费数字服务交换用户数据,数据主体——即服务的用户在使用免费服务之前必须同意服务协议,服务协议中包括提供用户身份信息的条款,而且明示或默示数字服务的提供者有权搜集用户在使用服务的过程中所留下的各种行为信息,拥有个人数据的使用权和后续的收益权,是数据的经济所有者。此外,即使机构单位从外部搜集数据时没有遵循用户隐私保护的规定而违法,但是按照国民经济核算原理,非法交易也应该记录在核算范围之内,因此非法占有数据的单位也是数据的经济所有者。
数据的其他属性还包括,非排他性、规模经济性和动态性等。非排他性是指一条数据可以被多个用户、应用或算法同时使用,而其他资产在一个时点只能由一方使用,具有排他性。规模经济性是指单条数据没有价值或者价值极低,数据聚合后产生规模效应,价值远大于单条数据的线性叠加,其他资产通常独立发挥作用。动态性是指数据可以持续不断地累积,其他资产则具有相对固定的形态或内容。此外,数据价值的持续性有很大差异,有些数据在长期内固定不变或变化很小,例如性别和教育程度,有些数据则持续时间很短,甚至转瞬即逝,例如个人实时位置数据。

二、数据资产的核算对象

无论数据主体为何者、数据使用者为何者,只要经济所有权明确、可为其经济所有者带来收益的数据,都可作为数据资产的核算对象。但应注意的是,不宜以单条数据为单位进行资产识别。如果以单条数据为识别单元,一方面无法体现规模效应中蕴含的数据价值,另一方面需要跟踪每条数据的进入、退出及其价值变动,还需要考虑非排他性使用而产生的多个复本的问题,几乎是不可能完成的任务。更重要的问题是,若按照单条数据来识别,那么短期数据不能作为资产( Ahmad 等,2017)。然而有研究表明,长期稳定的数据(如身份信息) 价值明显低于动态数据(如行为数据)。如果在单条数据的水平上识别资产,并不能体现数据资产的完整价值。
因此,应该把聚合数据整体识别为资产。以聚合数据为识别单元,能体现数据在规模效应下的价值,只需要对聚合数据整体的生命周期进行记录而无需跟踪单条数据的进出,无需追踪单条 数据的多复本问题,可行性大大提高。对于流数据而言,虽然单条数据是短期或瞬时的,但是聚合数据本身是长期存续的,具有资产属性。具体识别可以依托于数据库,即进入数据库的数据视为数据资产。这里所指的数据库,包括各种类型的数据库、数据仓库、数据湖和数据中台等。虽然从存储形态来看,聚合数据包含在数据库中,但是从核算属性来看,聚合数据属于非生产资产,数据库属于固定资产,二者相对独立。
对于外购数据库,有可能已经包含了数据资产的部分或全部价值,在没有设置数据资产这种资产类别时,数据资产的价值被记入数据库价值,在设置数据资产类别之后,应当根据数据库价值和数据资产价值的相对大小,在各自价值可识别的条件下将二者分别记录,在不可识别的条件下记录为价值相对更高的资产的价值。

三、数据资产的核算方法

(一)数据资产附属核算框架

数据资产附属核算框架的核心是资产负债表及反映资产存量变动的若干账户,包括资本账户、资产物量其他变动账户和重估价账户。此外,还包括生产账户以记录数据开发的产出。从机构部门来看,数据资产附属核算包括所有机构部门,企业部门可以根据主要活动划分为数据企业和其他企业,其中数据企业是指主要活动是提供数据服务的企业,包括各种提供数据采集、数据存储和管理、数据分析软件、分析技术和解决方案的企业。

(1)数据资产的核算

我们已经明确了数据属于非生产资产,因此依据国民经济核算原理,数据资产核算内容主要包括资产存量及其变动,与增加值和资本形成无关。对于来自机构单位内部的数据资产,在资产物量其他变动账户中记录数据资产的经济出现。当数据在不同单位进行交易时,获得数据的单位在资本账户中记录非生产资产的获得,提供数据的单位在资本账户中记录非生产资产的处置。当确认数据不再具有价值或放弃开发使用时,在资产物量其他变动账户中记录数据资产的经济消失。如果核算期内数据的市场价格发生变化,应在重估价账户中记录数据资产的持有损益。数据资产的存量记录在期初和期末资产负债表上。
对于住户部门,其数据资产的价值等于出售数据获得的价值与通过易货交易获得的价值之和。数据资产首先在资产物量其他变动账户中记录数据资产的经济出现,然后在资本账户中记录非生产资产的处置,二者相抵消,不影响资产负债表的记录。如果个人数据处置与获取免费数字服务相对应,还需要在收入使用账户中记录免费数字服务的消费,同时这些服务的提供者要记录服务的生产。住户部门是个人数据的法定所有者,虽然从核算的最终结果来看,住户部门的数据资产存量为零,然而对住户部门进行数据资产核算,可以通过流量账户反映出住户部门通过数据交易获得的经济利益或消费福利。
对于违反隐私保护非法获得的数据,原则上应当记录为数据控制者的资产。考虑到这种非法活动未经数据主体同意,不属于交易,因此应在资产物量变动账户中进行记录。对于数据控制者,应记录数据资产的经济出现,最终表现为数据资产存量的增加;对于数据主体,应先记录为数据资产的经济出现,再记录为数据资产的经济消失,数据资产存量不变。对于跨国的数据交易,按照上述方法记录在国外部门即可。

(2)数据开发的核算

考虑到数据的价值需要通过数据开发过程才能发挥出来,因此数据资产附属核算框架中不仅需包含数据的核算,还需包括数据开发阶段的核算。如前所述,在 SNA2008 中,数据采集、数据库和数据分析软件作为产出在生产账户加以记录,其中数据库和数据分析软件的使用记入固定资本形成,从而增加资产存量,而 数据采集则不增加资产,其使用根据情况记录为中间消耗或最终消费。
考虑到数据采集方式的变化,对于线上数据采集,需要重新考虑对数据采集成本的 记录方式。如第三部分所指出的,SNA2008 建议按照生产成本记录数据库价值,其中包括数据电子化和格式转换成本,不包括数据采集成本。传统的数据采集以线下采集为主,数据采集活动与数 据电子化和格式转换活动相对独立,易于区分。然而,随着信息技术的发展,数据采集越来越依靠
线上采集,即利用计算机软件技术从传感器和其他目标数据源自动采集数据,数据采集过程与数据电子化和格式转换同步进行,密不可分。如果能够将数据采集过程与数据电子化和格式转换区分开来,仍然按照 SNA2008 的处理方式处理; 如果二者无法区分,既然线上数据采集同 时就是数据电子化,就可以对线上数据采集成本进行资本化处理,包括在数据库资产中。这种做法理论上与 SNA2008 保持一致,实践上也更为简便。
将线上数据采集成本资本化处理之后,会对 GDP 的核算结果产生如下影响:其一,提高 GDP, 原因在于线上数据采集成本不再作为计算增加值的扣减项; 其二,改变 GDP 中消费和投资的构成, 原因在于原来作为最终消费的线上数据采集在新方法下被重新分类为资本形成。

(二)数据资产的估价方法

国民经济核算的计价采取市场价格原则,由于数据市场不健全,缺乏数据交易价格,因此数据 资产的估价是数据资产核算的关键和难点。
从外部购入的数据有直接的交易价格,通常这个价格是包含了多项资产的统一报价,包括数据 的价值、数据库的价值和数据库管理系统的价值。如果没有足够的信息将各项资产的价值分离开,按照国民经济核算体系的一般处理方法,应将全部价值计入相对价值较大的一类资产。由于数据资产不在核算范围内,因此SNA2008 的处理方法是把全部价值计入数据库,设置数据资产类 别之后,应根据实际情况进行处理。
从外部免费获取的数据可以是真正免费获取的数据,例如通过网络爬虫抓取的数据,也可以是 以易货交易形式获取的数据,即通过提供免费服务而交换得到的用户数据,这些免费数据的价值都需要估计。对于真正免费获取的数据,如果市场上有同类数据资产的交易价格,可以参照市场价格 进行估价;如果没有可参考的市场价格,可采用收益法或者专家评价法进行估价。当然,如果缺乏估价依据,也可以先将数据估价为零,一旦有可能进行估价,就以重估价的方式记录数据资产的 价值。
以易货交易形式获取的数据价值是当前研究的热点之一。Ahmad 和Ven( 2018) 提出三种方案,分别是根据数据的市场价格来估价、根据广告收入来估价以及根据消费者对免费服务的支付意愿来估价。目前,市场价格法和支付意愿法只应用于特定的数据内容(如身份信息或某些特定的行为信息) 或者特定的数字产品(如Facebook) ,而且受企业和消费者异质性的影响,给出的估价缺 乏代表性,推广应用于宏观数据资产估价还有很大距离。用广告收入来估价是建立在用户使用的免费服务的潜在价值等于企业依托数据而产生的广告收入这一假定之上,得到的数据资产估价偏高。Li 等( 2019) 建议用组织资本评估数据资产,其依据是良好的商业模式是数据资产发挥价值的必要条件,然而两类资产毕竟不是等价物,而且这种评估方法更适用于以数据服务为主业的企业,对于其他单位则会有较大偏差。
来自单位内部的数据同样没有市场价格,可以采取与以真正免费方式从外部获得的数据相同的估价方式。
综上可知,通过购买方式获得的数据资产估价相对容易,内部数据和免费获取的外部数据资产估价面临较大困难。针对此种情况,建议推动数据资本化处理的探索性研究,综合应用市场价 格法、收益法、支付意愿法和广告收入法等,估算数据资产的价值。从长期看,应加快建立活跃的数据交易市场,形成数据的市场价格,从根本上解决数据估价问题。

(三)数据资产核算产生的影响

由于数据资产属于非生产资产,因此数据资产附属核算对 GDP 的影响有限,从而对收入、消费以及资本形成的影响有限,但是数据资产附属核算的结果具有重要的分析意义。数据资产附属核算的存量数据反映数据资产及数据开发资产的规模、资产类型分布和部门分布,可以用来分析数据及相关资产的发展,与生产函数结合可以分析数据及相关资产对经济增长的贡献。存量变动数据可以反映数据资产在部门间交易,特别是可以反映住户部门通过处置数据 资产获得的消费福利,对于突破 GDP 在福利测度方面的局限、全面反映生活质量和福利水平具有重要意义。此外,附属核算框架生产账户的数据反映数据开发创造的增加值,可以体现对经济增长的直接影响。
作者:李静萍
编辑:王文静
孔令仁
统计之都:专业、人本、正直的中国统计学社区。
关注方式:扫描下图二维码。或查找公众帐号,搜索 统计之都 或 CapStat 即可。
往期推送:进入统计之都会话窗口,点击右上角小人图标,查看历史消息即可。
继续阅读
阅读原文