※  信息社会政策探究的思想库  ※
※  信息通信技术前沿的风向标  ※
作者简介
孙振南
新疆大学马克思主义学院硕士研究生在读,主要研究方向为马克思主义基本原理、数字劳动等。
魏莉 
新疆大学马克思主义学院教授,博士研究生导师,主要研究方向为马克思主义基本原理等。
王建晨   
新疆大学马克思主义学院硕士研究生在读,主要研究方向为马克思主义基本原理等。
论文引用格式:
孙振南, 魏莉, 王建晨. 我国数据要素研究热点及发展趋势分析[J]. 信息通信技术与政策, 2023,49(4):9-15.
我国数据要素研究热点及发展趋势分析
孙振南  魏莉  王建晨
(新疆大学马克思主义学院,乌鲁木齐 830046)
摘要随着数字经济的飞速发展,数据要素问题逐渐成为国内学术研究的热点问题。基于Cite_Space的关键词分析可知,当前国内学界对于数据要素的概念、特征以及其生产要素内涵等方面的研究已基本完成,数据要素发展和治理方面的研究逐渐成为当前的热点和重点。未来,应进一步深化数据要素问题的现实考察,构建学术研究共同体,推进该领域研究的科学化、全面化。
关键词:数据要素;研究热点;Cite_Space
0  引言
中国共产党第十九届中央委员会第四次全体会议提出[1],要“健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决定报酬的机制”,数据由此被明确纳入生产要素范畴。这不仅意味着数据正逐步作为关键生产要素参与到市场分配过程之中,而且意味着数字经济已经成为我国经济发展的关键力量。《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》(简称“数据二十条”)也明确指出[2],“数据作为新型生产要素,深刻改变着生产方式、生活方式和社会治理方式,必须充分实现数据要素价值、促进全体人民共享数字经济发展红利”。然而,随着地方政府和各行业对数据要素应用实践的不断深入,数据要素在概念界定、权益分配等方面存在的问题也逐渐凸显。为此,亟须总结我国数据要素研究领域的前沿热点问题,从整体上把握该领域研究的热点话题和变化趋势,进而从实践层面对数据要素的发展和治理提出有效策略。
1  研究设计
1.1  数据来源
本研究以中国知网数据库文献为样本,文献检索步骤为:进入中国知网界面,点击“高级检索”栏,将文献类别限定为“学术期刊”,输入主题词“数据要素”,时间范围设置为2002年1月1日—2022年12月31日,共检索到相关学术期刊文献2 725 篇。为进一步提升后续研究的科学性,勾选来源类别中的“北大核心”和“CSSCI”栏,共检索到相关核心期刊文献1 232 篇作为本研究的最终样本。通过对最终样本进行关键词共现和聚类分析,能够帮助研究人员更加直观地掌握我国数据要素问题的研究热点及其变化发展。
1.2  研究方法
引文空间(Citation Space,Cite_Space)是以Java语言为基础设计研发,能够动态、多元计量文献信息的可视化分析工具。其关键词分析和文献被引分析等核心功能,能够直观地呈现某一时间段内、某一学科领域中的研究热点、动向和发展脉络。本研究借助Cite_Space6.1.R1(64 bit),以“数据要素”为主题进行关键词可视化分析,得到关键词共现、关键词聚类等知识图谱,从而总结我国数据要素研究领域的前沿热点问题,为该领域接续研究作铺垫[3]
2  数据要素问题研究热点可视化分析
关键词是学术论文核心内容的总结和凝练。利用Cite_Space软件对相关文献的主题词、关键词进行可视化分析,可以从整体上把握该领域研究的热点话题和变化趋势。
2.1  关键词共现分析
运用Cite_Space软件进行关键词共现分析并手动优化,得到关键词共现图谱(见图1)。其中,节点数N=513 个,关联性线段E=805 条,意味着1 232 篇文献中共有513 个不同的关键词出现,构成关联性连线805 条(同一篇施引文献中包含两个关键词即构成一条关联性连线)。而密度D=0.0061(<0.1),说明数据要素领域的研究集中化程度较低,“尚未形成紧密的知识簇团”[4]
图1   关键词共现图谱
图1中菱形标示的大小代表关键词出现的频次,菱形面积越大则该关键词的研究热度越高。从图1可以看出,以“数据要素”和“数字经济”为中心的研究数量最多,并且在出现频次超过20 次的关键词(即关键词出现频次排名的前11 位)中,有8 个关键词与“数据要素”直接相关(见表1)。由此可知,数据要素相关问题研究与其他学科并无明显的交叉融合,研究结构相对单一,需要进一步提升数据要素研究领域的多元化发展。
表1   高频关键词及出现频次表
除了关键词出现频次外,中心性指标(Centrality)也是关键词共现分析的重要指标,其代表的是多个关键词之间的关联程度。中心性数值越大,说明该关键词与其他关键词的关联性越强,其中介作用也越强。根据表2可知,中心性数值在0.1以上的仅有“数字经济”“数据要素”和“经济增长”三项,绝大多数关键词的中心性数值都小于0.1,甚至为0(注:本研究仅选取中心性数值≥0.03的11 个关键词)。研究表明,数据要素领域的研究主题种类繁多,但学科之间的交叉研究不足,相关研究领域的交叉融合发展亟需加强。
表2   中心性数值≥0.03的关键词表
2.2  关键词聚类分析
为了进一步把握数据要素相关问题研究的热点和重点,本研究对聚类进行了手动调节和优化,并借助对数似然比(Log-Likelihood Ratio,LLR)算法为聚类命名,选取其中关键词数量最多的8个类别:#0~#7(数字越小,其聚类中所包含的关键词数量越多)制作关键词聚类图谱(见图2)。其中,模块性Q=0.6296(>0.3),说明数据要素问题研究的聚类结构显著、聚类轮廓良好;而加权平均聚类轮廓值S=0.899(>0.7),则表明此聚类结构具有非常高的可信度。
图2   关键词聚类图谱
通过对聚类结果的进一步归类整理,可以得到当前数据要素问题研究的三个重点方向,即数据要素概念、数据要素发展和数据要素治理(见表3)。
表3   关键词聚类分析表
2.2.1  Ⅰ类——数据要素概念研究
当前,国内学者对于数据要素概念的研究主要为以下三个方面。
(1)基于马克思相关理论,阐释数据的关键生产要素内涵。宋冬林等[5]认为将数据作为生产要素没有偏离马克思主义生产要素理论。在最初的农业经济时代,由于自然地理条件的约束和限制,土地要素具有极强的竞用性。而随着人口总量的不断攀升,土地在促进生产力发展方面的作用逐渐受到制约。在进入工业经济时代后,资本打破了各种自然条件的束缚,其作为关键生产要素极大地促进了社会再生产的运行。随着知识经济时代的到来,各种知识性因素成为生产效率提升的关键。发挥提升资源配置效率作用的技术、管理等各种才能被越来越多的劳动者所熟悉和掌握。在接踵而至的数字经济时代,数字化、网络化的经济系统庞大且复杂,各类数据的产生和流通都以前所未有的速度进行着,各类商品的供给也都表现出一定程度的数字化特征,个性化、碎片化需求逐渐成为市场需求的主旋律。在这种情况下,从前诸如资本、知识等关键生产要素已经无法满足生产力发展的现实需要。而具有非竞用性的数据要素却能够在不发生损耗的前提下在更大的范围内被更多的主体使用,这极大地提升了劳动者的生产效率,使社会经济能够保质、保量地稳步提升。戴双兴[6]指出,数据独立成为关键生产要素的这一演进过程,是生产力发展的客观需要和必然结果。随着经济形态从农业经济、工业经济演化为知识经济再到今天的数字经济,除劳动以外的关键生产要素也从土地、资本演化为科技再到今天的数据,不断演进的关键生产要素呈现出通用性增强、竞用性降低的变化趋势。
(2)基于自身研究,对数据要素概念予以界定。中国信息通信研究院[7]将大数据时代的数据定义为“是基于二进制编码的、按预先设置的规则汇聚的现象记录”。王传智[8]将数据定义为“人类互联网行为产生的、一定条件下可被人类用于再生产的、被电子设备客观记录的内含丰富信息的符号”。白永秀等[9]认为,数据要素是数据被用于再生产的基本投入因素之一,是产品和服务实现过程中所必备的基本因素。李勇坚[10]从经济学视角出发,将数据要素定义为规模收益不确定且需要与其他资源协同的生产要素。吴志刚[11]则从本体论视角,将数据要素定义为人类在意识世界刻画、描述客观世界的最基本单元,是现实世界实体对象的数字投影。郭琎等[12]基于数据、信息、知识三者的关系指出,数据要素包含“原始的数据对象”“处理加工后的拓展信息”以及“包括智能化的数据产品和服务等在内的知识”共三重内涵。
(3)基于自身研究,对数据要素特征予以阐述。李海舰等[13]将数据要素的特征归纳为智能即时性、虚拟替代性、多元共享性和跨界融合性。王传智[14]认为,数据要素具有“作为特殊经济资源的有用性”“所有权、控制权与使用权相分离性”以及“同主体隐私相矛盾性”。李勇坚[10]从经济学视角出发,将数据要素的特征归纳为非竞争性、强协同性、部分可排他性以及外部性。吴志刚[11]指出,数据要素具有获得的非竞争性、使用的非独占性、价值的非耗竭性和非衡价性、源头的非稀缺性以及对象的社会多元性共六方面特征。戴双兴[6]将数据要素与传统生产要素相比较,认为其具有非排他性、强渗透性、可再生性以及规模经济性。白永秀等[9]认为,数据要素具有包含“多元性、依赖性、渗透性”的技术特征和包含“规模经济性、准公共物品性、马歇尔外部性”的经济特征。郭琎等[12]从技术、经济两个方面阐述数据要素的特性,认为数据要素的技术特征包含三个方面,即以“大数据”为存在形态、以网络设施为主要媒介和以拓展聚合为利用方式;其经济特征包含三个方面,即准公共物品属性、规模经济性和范围经济性。王谦等[14]则通过“技术-经济”联合分析,指出数据要素除了具有虚拟替代性、依赖性和渗透性外,还具有动态精准性、自组织性以及共享低成本性。
2.2.2  Ⅱ类——数据要素发展研究
当前,国内学者对于数据要素发展的研究主要为以下两个方面。
(1)关于促进数据要素自身发展的研究
对数据要素价值释放的研究。唐要家等[15]指出,释放数据要素价值必须以开放共享为基础,以创新数据驱动为根本动力,以多元利益激励相容为制度保障。以此为基础,进一步提出数据要素价值释放的实现路径,即实行分类治理、多轨并进的数据开放共享政策和实现多源驱动的数据商业创新。孙克[16]认为数据要素价值释放有利于治理能力的提升和人民美好生活愿望的实现,必须加速其资源化、资产化、资本化过程。
对数据要素市场培育的研究。吴志刚[11]指出,培育数据要素市场必须丰富生产资料,提升平台服务能力,不断创新生产、商业模式。王建冬等[17]认为,培育数据要素市场必须坚持国情视角、问题导向、综合改革和创新驱动四个政策着眼点。邓胜利等[18]认为,数据要素市场发展的最终目标是实现数据要素的价值增值和自由流通,因此,培育数据要素市场,能够有效发挥数据要素对于数字经济的推动作用,为数字中国的全面建设提供参考。姜奇平[19]指出,要认识到“市场”的特殊性,有针对性地建立能够激活数据要素的市场机制。赵鑫[20]指出,培育数据要素市场是以数据确权为起点,数据要素的权属问题是数据要素市场培育的关键。刘小鲁等[21]认为,完善资源配置过程中具有决定性作用的市场机制是培育数据要素市场的关键,并从垄断、外部性和信息不对称三个方面梳理了数据要素市场培育过程中所面临的市场失灵问题。施羽暇[23]认为,当前我国数据要素市场发展良好,各项制度政策已基本确立且日渐完善,但依然面临着理论研究滞后、供给能力不足等制约,为此,必须优化数据资源供给,建立数据交易流转机制。
从其他角度研究数据要素自身发展。白永秀等[9]从“效率、公平与可持续”三个方面,为数据要素高质量发展提出建议。还有学者从技术角度指出,推进数据要素发展必须充分运用人工智能、大规模图谱计算和区块链等数字技术。
(2)关于数据要素促进数字经济发展的研究
戴双兴[6]认为,数据要素能够从优化企业产品供给、推动产业转型升级和增强宏观经济调控精准度三个方面发挥其对于数字经济发展的推进作用,并进一步提出借助数据要素推进数字经济发展的具体路径,即实现产权有效激励、要素自由流动、价格反应灵活、数据内在价值以及竞争公平和优胜劣汰。王谦等[14]认为,要使数据要素为经济发展赋能,必须加快建设数据基础设施、构建数据要素市场、规范数据要素治理。
2.2.3  Ⅲ类——数据要素治理研究
国内关于数据要素治理的研究可以归纳为以下两个方面。
(1)数据要素自身治理研究
张莉等[23]指出,数据要素治理是“建立在数据存储、访问、验证、保护和使用之上的一系列程序、标准、角色和指标”。当前,数据要素治理的主要障碍包含数据体量质量不清、数据开放共享困难、数据权属尚未明晰、数据交易运转不畅和数据安全面临挑战五个方面。林伟等[24]将国内外数据要素治理研究成果划分为法律、技术、管理三个层面:法律层面包含政府数据开放、企业数据权属以及个人信息权益;技术层面包含数据处理技术、数据采集技术和数据存储技术;管理层面则包含数据生命周期管理和数据质量管理。以此为基础,想要进一步推进数据要素治理效果的提升,必须从数据安全治理研究、数据协同治理研究和数据中台构建研究三个方面进行拓展。宋方青等[25]认为,数据要素治理是数据要素市场化的重要保障,并指出要通过法律制度的设计与调整实现数据要素治理的法制化。司晓[26]指出,数据要素治理要注重多种模式并存,不断协调各方主体利益、凝聚共识。尹巧蕊[27]认为,数据要素治理能够保障“数权世界”健康成长,为我国国家治理现代化赋能。王建冬等[17]从产权、供给、流通、分配和跨境五个方面设计了数据要素治理的基本制度。唐要家等[15]认为,数据要素治理要发挥政府的政策设计供给能力,推动数字行业规范的制定,创新数据价格交易机制,发挥市场的基础性作用,强化数据主权、安全保护以及突出企业治理的基础性地位。
(2)数据要素参与分配过程的治理研究
王颂吉等[28]从初次分配和再分配的角度探讨数据要素参与收入分配的机制,认为初次分配时由市场对数据要素贡献进行评价,并加强政府对数据要素市场的监管;再分配时要以税收方式进行调节,促进数据要素分配的相对公平。范卫红等[29]认为,规范数据要素参与分配的体制机制,需要在稳步推进数据要素参与社会分配的同时,最大限度保护数字劳动者权益,“建立‘统一开放、竞争有序’的数据要素流通市场环境”,在完善劳动者数据采集、使用体系的基础上切实推进生产力的发展。李标等[30]认为,数据要素参与分配必须健全数据要素安全保护法制及其流通治理机制,形成统一、有序的数据要素市场体系。吴宏洛等[31]认为,对数据要素参与分配过程的治理需要从分配实现和分配保障两个方面切入。分配实现方面要大力发展数字经济以奠定物质基础,健全市场评价机制,建立合理的定价机制和交易信任体系;分配保障方面要处理好效率和公平的关系,促进其公平性利用,建立安全与发展兼顾的管理保障体系。李爱君等[32]认为,对数据要素参与分配过程的治理,首先要进行数据产权的界定与保护,明确数据要素所有权,并从立法、监管和司法层面为数据财产权制度体系的完善提出建议。
3  研究结论与展望
3.1  研究结论
本研究以我国2002—2022年数据要素研究领域内的1 232 篇核心期刊文献资料为最终样本,借助Cite_Space6.1.R1(64 bit)的关键词分析功能,绘制相关可视化知识图谱,总结该领域研究现状。总体来说,我国关于数据要素的系统研究起步较晚,研究热点与国家相关政策联系密切。学者们不仅从理论层面对数据要素的概念、特征以及生产要素内涵进行了论证和界定,而且从实践层面对其发展和治理提出了有效策略,高质量研究文献层出不穷。具体来看,数据要素问题研究呈现出以下特点。
(1)研究主题不断深入,学科分布分散多样,数据要素问题研究呈现出从单一到多元的发展趋势。但同时,该领域研究受政策因素影响显著,且缺少核心研究机构,研究力量较为松散,尚未形成高质量学术集群;不同学科之间的合作研究较少,有待进一步建立能够开展高密度科研合作的学术共同体。
(2)根据关键词共现结果分析发现,“数据要素”“数字经济”和“数字治理”是当前研究的热门话题,研究主体集中性较高,需要加强具有关联性的多元研究。根据关键词聚类结果分析发现,Ⅱ类和Ⅲ类较多,说明当前数据要素的概念、内涵已经基本确定,如何发展和治理数据要素逐渐成为该领域研究的重点。
(3)从发展趋势来看,数据要素问题正逐渐成为学界关注的热点。使数据要素发展符合时代规律和数字经济发展的内在要求,进而实现数据要素与数字经济的协同发展,将是未来研究的热点和重点。
3.2  研究展望
基于现有的研究成果,深化国内数据要素研究还需要把握以下几个方面。
(1)加强学术共同体建设,提升数据要素问题研究的攻关能力。近年来,国内学术界对于数据要素问题的研究已具备系统性,但仍有部分学者存在盲目性、随机性等倾向。这就需要立足科研院所主阵地,充分发挥其领头羊作用,组建囊括不同学科专家的专题科研小组,形成紧密合作又各具特色的学术共同体,使数据要素问题研究不断突破创新。
(2)加强学科间的自主融合,推动数据要素问题研究的交叉创新。数据要素作为互联网时代的产物,其天生带有多领域交叉的特征。当前,数据要素问题研究还未脱离传统研究框架,研究思路、过程还比较保守。因此,必须主动打破学科边界,实现多学科间的跨界交流融合,积极寻找新的着力点和突破口,以多元协同的态度推进数据要素问题研究的交叉创新。
(3)深化数据要素问题的现实考察,推进其研究的科学化发展。数据要素问题研究在重视理论研究的同时,也应立足现实,扎根实践。具体来说,要深入生产、生存、生活的方方面面,厘清数据要素的规律特点,在理论与实践相结合的基础上推进科学化、全面化研究的实现。
4  结束语
当前,我国数据要素问题研究呈现出从单一到多元的发展趋势,并逐渐演化出三个重点研究方向,即数据要素概念、数据要素发展和数据要素治理。从数据要素概念来看,国内学者的研究表现为基于马克思相关理论,阐释数据的关键生产要素内涵;基于自身研究,对数据要素概念予以界定和基于自身研究;对数据要素特征予以阐述三个方面。从数据要素发展来看,国内学者的研究呈现促进数据要素自身发展的研究和运用数据要素促进数字经济发展研究两条进路。从数据要素治理来看,国内学者的研究包含数据要素自身治理和数据要素参与分配过程的治理两个方向。
未来,我国数据要素研究将以数据要素与数字经济协同发展的实现为重点,通过加强学术共同体建设,提升数据要素问题研究的攻关能力;加强学科间的自主融合,推动数据要素问题研究的交叉创新;深化数据要素问题的现实考察,推进其研究的科学化发展三重进路,使数据要素发展真正符合时代规律和数字经济发展的内在要求。
Analysis of research hotspots and development trend of China’s data factor
SUN Zhennan, WEI Li, WANG Jianchen
(School of Marxism, Xinjiang University, Urumqi 830046, China)
Abstract: With the rapid development of digital economy, the problem of data factor has gradually become a hot issue in domestic academic research. Based on the keyword analysis of Cite_Space, it can be seen that up to now, domestic academia has basically completed the research on the concept and characteristics of data factor as well as the connotation of its production factors. Research on the development and governance of data factor has gradually become the current hotspot and focus. In the future, the realistic investigation of data factor should be further deepened, the academic research community should be built, and the scientific and comprehensive research in this field should be promoted.
Keywords: data factor; research hotspot; Cite_Space
本文刊于《信息通信技术与政策》2023年 第4期
主办:中国信息通信研究院
《信息通信技术与政策》是工业和信息化部主管、中国信息通信研究院主办的专业学术期刊。本刊定位于“信息通信技术前沿的风向标,信息社会政策探究的思想库”,聚焦信息通信领域技术趋势、公共政策、国家/产业/企业战略,发布前沿研究成果、焦点问题分析、热点政策解读等,推动5G、工业互联网、数字经济、人工智能、区块链、大数据、云计算等技术产业的创新与发展,引导国家技术战略选择与产业政策制定,搭建产、学、研、用的高端学术交流平台。
《信息通信技术与政策》投稿指南
为进一步提高期刊信息化建设水平,为广大学者提供更优质的服务,我刊官方网站已正式投入运行,欢迎投稿!
推荐阅读
专题丨我国数据要素市场培育进展与趋势
专题导读:数据要素
《信息通信技术与政策》2023年第49卷第4期目次及摘要
“在看”我吗?
继续阅读
阅读原文