海归学者发起的公益学术平台
分享信息,整合资源

交流学术,偶尔风月
科幻小说《三体》讲述了这样一个情节:通过干扰粒子物理研究,三体文明“封锁”了人类的科技发展。此后,人类社会虽仍有各种技术进步,却不再有根本性的科技变革。物理学家丁仪在冬眠近两个世纪后复苏,面对人类科技的停滞,分外凄然。他说:“你们知道我这些年都在干什么吗?在大学里教物理,还带博士生。孩子们啊,我这两个世纪以前的人了,现在居然还能在大学里教物理。”
该情节虽然是一种艺术虚构,但却描写出了缺乏颠覆性科技进展的社会所面临的绝望。可以说,没有这些颠覆性进展的推动,科学永远只能是一潭死水。但遗憾的是,最近的一项研究告诉我们,人类科技的发展正在步入这种缺乏颠覆性进展的时代。
美国明尼苏达大学的Michael Park、Russell J. Funk与亚利桑那大学的Erin Leahey近日在Nature发表文章称:“通过对六个大型数据库中的4500万篇论文和390 万项专利进行分析,我们发现论文和专利越来越难以颠覆既往,也难以引领科技进入新方向。” 研究人员认为,这种颠覆性进展的缺位,反映了科技发展性质的根本性转向。
01
如何衡量科技研究的颠覆性?
为了衡量论文、专利的“颠覆性”或“突破性”,研究人员提出了“CD指数(Consolidating/Disruptive index)”[1]。在该评价模式中,所有研究成果被分为两类,一类是深化型研究 (Consolidating),一类是颠覆型研究 (Disruptive)。深化型研究指那些继承过去研究结论,并沿着已有的研究方向进一步改善、深化的研究成果。后续研究在引用深化型研究时,往往会连同其前置研究一并引用。相比之下,颠覆型研究则推翻了过去的研究结论,或是开辟出全新的研究领域,或是根本上扭转研究方向。后续研究在引用颠覆型研究时,一般不会引用其前置研究CD指数正是通过这种引用模式的差异,来衡量一项研究的“颠覆性”,如下图所示:
CD指数通过引用模式对论文的颠覆性进行评估的示意图。其中灰色菱形表示核心论文,也就是被评估的研究论文;红色菱形表示该核心论文所引用的前置论文;蓝色圆形表示只引用该核心论文的论文;绿色方形表示引用核心论文并同时引用其前置论文的论文;棕色三角形表示,不引用该核心论文但引用其前置论文的论文,这种论文不对CD指数产生影响。
透过上述示意图我们可以了解,CD指数的区间为 [-1,1]。当人们引用该论文时,倾向于一并引用其前置论文,则该论文的CD指数将向-1靠近,更偏向于深化型研究。而当人们引用该论文时,倾向于独立引用该论文,不同时引用其前置研究,则该论文的CD指数将向1靠近, 更偏向于颠覆型研究。
关于Web of Science数据库和美国专利商标局中的研究成果的CD指数分析,其中红色为论文,蓝色为专利。
a表:举出了三篇论文及三篇专利的CD指数,其中J.D.Watson和F.H.C.Crick在1953年提出DNA的分子结构,该论文的CD指数为0.53,而Walter Kohn和沈吕九在1965年提出了密度泛函理论中的Kohn-Sham方程,该论文的CD指数为-0.22。
b表:根据两大数据库中所有成果的CD指数,绘制出了一条分布谱带。可以看出,颜色最深的地方都靠近CD指数为0的基线,反映出绝大部分研究成果的CD指数都接近于0。
02
科研颠覆性的“世纪大滑坡”
Park等人从不同研究领域出发,分析了1945年至2010年间科技成就的CD指数变化趋势,以此探究研究成果在颠覆性上的总体变化情况。如下图所示:
该图绘制了论文 (图a) 和专利 (图b) 的平均CD指数随时间变化的情况。可以看出,论文与专利的平均CD指数都呈现出下滑趋势。而从各个研究领域看,这种下滑趋势也是大体一致的。单就论文而言,社会科学领域的平均CD指数从0.52下降到0.04,降幅为91.9%;物理科学领域的平均CD指数则从0.36下降到0,降幅100%。就专利而言,计算机和通信技术的平均CD指数从1980年0.3,下降到了2010年的0.06,降幅为78.7%;医药领域则从1980年的0.38下降到了2010年的0.03,降幅为91.5%。
总体来看,CD指数在上世纪下半叶下降得比较快,而在2000年后趋于稳定。平均CD指数的整体下滑,则反映了这样一个事实,即:论文和专利更多地集中于深化既往研究,而非开拓新的领域
一种比较流行的观点认为,颠覆型研究占比的下降,是因为科技发展过程中,那些易于被发现的研究、易于完成的成就,大多已被前人完成。这就是所谓的“唾手可得的果实”理论。但Park不赞同这个看法,他表示,各研究领域的起步、兴盛时间有先有后,但他们在各领域观察到的平均CD指数下滑趋势,却是较为同步的。这说明CD指数的下滑是另有原因。
此外,研究人员还从术语创新与标题常用词方面进一步论证了CD指数的整体变化趋势。这是基于这样一个考量,即:颠覆型研究更有可能引入一些新术语,而深化型研究则是更多继承已有的术语。由此推论,学界研究颠覆性的整体下降,应当会反映为语言多样性的下降。
该图分析了论文、专利的标题中的用语倾向。a、b、c表为针对论文的分析,d、e、f表为针对专利的分析。
a、d表:总结了论文及专利标题中“特殊词” (Unique Word)  的占比变化趋势。

b、e表:总结了论文及专利标题中引入的“新词组” (New Word pairs) 的占比变化趋势。
e、f表:例举论文及专利标题中的动词词频统计,将统计年限中的起始年数据和最终年数据进行对比。
从上图可以看出,在上世纪下半叶到本世纪初,论文及专利中的语言多样性整体呈现出下滑,并且也是年代越早下滑越快,年代越接近现在则越趋于稳定。这一整体趋势是与CD指数的整体变化情况有所符合的。以上图e表为例,可以看出,2010年论文标题中的高词频动词的词频,整体比1950年论文标题的高词频动词的词频要高。这似乎反映了,2010年的论文标题相较1950年的更具趋同性。此外,2010年的最高词频动词是“base” (基于) ,该词没有进入1950年的词频前十,但却比1950年词频前十的词频占比之和都高。这种用语倾向上的转变似乎也能说明一些问题。
03
颠覆型研究的“绝对数量”并未减少
Park等人还对他们的研究进行了一些补充分析。首先他们指出,虽然科技发展中CD指数整体趋于下降,但高颠覆性研究的绝对数量却保持了显著的稳定性。他们将数据库中研究的CD指数分为[0,0.25], (0.25,0.5], (0.5,0.75], (0.75,1] 四个区段,然后发现,随着时间的推移,[0,0.25]区段的论文数量增加最为显著,而其他三个区段的论文数量则一直相对稳定。如下图所示:
不同CD指数区段的论文数量变化趋势。
其次,研究人员分析了论文质量和颠覆性之间的关系。有观点认为,颠覆性的下降与低质量论文的大量刊发有关。于是研究人员将论文样本限制在Nature、Science、PNAS和诺奖论文之中,但分析发现,即便是这一部分质量较高的论文,颠覆性的下滑趋势仍然是一致的。如下图所示:
图中例举了“高质量论文”的CD指数变化趋势。左下角小图反映了Science、Nature、PNAS等期刊的CD指数变化趋势。
最后,研究人员还从引文多样性、自引水平、引文平均年限等方面分析了颠覆性下降的趋势。分析发现,随着时间的推移,论文引文的领域多样性正在逐步下滑,而平均自引篇数在不断升高,引文的平均发表年限也在不断升高。研究人员分析,这说明科学家越来越依赖于固定的知识结构与研究路线,从而逐渐进入细分的专业领域之中
关于高质量文论引文多样性、自引水平、引文平均年限的一些分析。a、d表描述了论文引文多样性的变化趋势。b、e表描述了论文平均自引篇数的变化趋势。c、f表描述了引文平均年限的变化趋势。
04
如何理解颠覆性的下滑?
Park等人的研究有助于人们进一步认识科技发展中颠覆性下降的问题。对于颠覆性的下降原因,人们有三个主要的解释方向:
1、科技发展已经进入平台期。哲学家托马斯·库恩早期曾在著作《科学革命的结构》中提出“范式” (Paradigm) 概念。他以范式来指那些为后续研究奠定了基础与传统的“范例型研究”。这在性质上与Park等人所讨论的颠覆型研究有类似之处。因此,有人倾向于以科技发展的不同阶段来解释颠覆型下降的问题,即:自爱因斯坦为代表的科学家在20世纪初奠定现代物理学的范式以来,各学科的研究范式均逐渐创立并固定,后续研究逐步进入沿着既定范式前进的“常规科学”时代。因此,科学发展往往遵循这样的规律,在科技革命之初,大量颠覆型研究出现,而科技革命过去之后,科技发展则进入将范式贯彻下去的深化型研究时代。
2、科研模式与科技评价问题。有观点认为,现行的科研模式尤其是学术出版模式及其配套的科技评价体系束缚了颠覆型研究的发生。法国国家科学研究中心 (CNRS) 的科学社会学专家Jerome Lamy表示,“过专业化” (ultra-specialization) 实际上带来了过度的论文发表压力。 他批评学术界为了增加学术出版物数量而强行拆分研究为多篇论文,他认为这将令研究变为“一潭死水”。高论文出版量能够带来更多的收益,因此整个学术界都追求论文数量。这无疑会对研究产生负面影响。此外,还有人指出,现有的以单、双盲为主流的同行评议体系也不利于颠覆型研究的发表。
3、科学家的职业环境问题。这一问题与科研模式问题关系密切。有观点认为,做出颠覆型研究、甚至推动科技变革的杰出科学家往往较少为职业和利益所束缚。他们具有更多的自主性。比如在时间支配上就是如此。而现行的科研体制已经高度成熟并“产业化”,科学家陷入了繁忙的“职业陷阱”,在所谓的职业发展道路上疲于奔命。反而缺少了重大科技创新所必需的自由时间。
Park等人也建议,高校等科研机构对论文的评价应当更重“质”而非重“量”;科学家应当获得更丰厚的资助与休假安排;基金则应当支持更长期、更高风险、更个人化的资助项目,而完全拘泥于特定研究项目资助。
但是,我们也应注意到Park等人研究的局限性。该研究对于颠覆性的评估基本是建立在对学术出版物的引用分析之上。学术出版本身只是科研的一个环节,不足以反应科研活动的全貌。此外,Park等人的数据则集中于1945年至2010年,时间上的局限性可能难以支持人们在更长的历史尺度上去评价科研发展进程。Park等人也指出,CD指数的有效性虽然已在许多研究中得到证实,但毕竟仍是较新的评价指标。还行对其进行更丰富的研究,才能进一步落实其学术价值。
参考文献:
[1] Funk, R. J. & Owen-Smith, J. A dynamic network measure of technological change. Manage. Sci. 63, 791–817 (2017).
[2] Park, M., Leahey, E. & Funk, R.J. Papers and patents are becoming less disruptive over time. Nature 613, 138–144 (2023). 
点击下方知社人才广场,查看最新学术招聘
扩展阅读
科学研究的创新性和实用性,哪个更重要?
十年来,两位“卷王”加快了论文出版的整体速度
人工智能的学术泡沫:论文井喷,进展寥寥
本文系网易新闻·网易号“各有态度”特色内容
媒体转载联系授权请看下方
继续阅读
阅读原文