作者:姚斌
来源:在苍茫中传灯(ID:chuandeng169)
《给科学家的科学思维》是我阅读到的第二部科学学的论著,第一部则是托马斯·库恩的《科学革命的范式》。这部论著堪称科学学领域首部系统性研究论著,是王大顺与他的导师艾伯特-拉斯洛·巴拉巴西共同合作的产物。巴拉巴西是全球复杂网络研究权威、无标度网络的创立者,著有《网络科学》、《巴拉巴西的成功定律》、《链接》、《爆发》等一系列著作。
科学学是一门新兴的领域,它研究科学本身的发展与演化规律,本质上是一个复杂、自组织的社会系统,其形成和演化过程具有时变、非线性、多重耦合等复杂系统的常态特征。它的学术团队是以人为基本单位的群体,学术团队间的合作互动也构成了一类典型的复杂网络。
《给科学家的科学思维》产生的背景来自大数据催生的一个多学科交叉的研究时代。在这样的时代,需要重塑科学家应该具备的全新的思维框架,这个框架由三个层面来呈现:职业生涯成功的科学新思维;团队合作成功的科学新思维;科学家影响力升级的科学新思维。
1
在整个20世纪,论文和科学家的数量都在呈指数级增长。率先引领硅谷走向电子产业新时代的威廉·肖克利对论文产出量十分好奇,他曾经收集了论文发表统计数据,发现论文数量也服从对数正态分布。对数正态分布具有肥尾的特点,表明产出量存在巨大的差异。大多数研究者发表的论文数量非常少,而不可忽略的少数研究者发表了比平均数多几个数量级的论文。肖克利很快注意到,在大多数充满竞争的领域,个人能力的表现衡量指标几乎总是呈现一个狭窄的分布。人与人之间能力表现上的差异通常是有限。即使泰格·伍兹在巅峰时期,他也只能领先最强的对手几杆。最快的打字员比普通打字员每分钟也就多打几个字。能力差异的有限性提醒我们,在任何领域,要以显著优势在竞争中获胜,并非完全不可能,但十分困难。
发表论文并不能依靠有一个好点子这样的一个单一因素。相反,它要求科学家在多种因素上都要足够优秀。一个研究者只有在诸多因素上都出类拔萃,没有弱项,才有可能成为最高产的科学家。比如,艾伯特·爱因斯坦在有生之年发表了248篇论文,查尔斯·达尔文发表了119篇,路易·巴斯德发表了172篇。然而,尽管伟大的科学家往往非常高产,但并不是所有高产科学家都能做出举足轻重的学术贡献。事实上,大多数科学家都没有能够做到。有些科学家并不高产,然而却并不妨碍他们成为伟大。因预测希格斯玻色子的彼得·希格斯在有生之年仅发表25篇论文,遗传学家格雷戈尔·孟德尔的署名论文仅有7篇,却为他们带来了不朽的声誉。事物总是辩证的。虽然高产量不一定都能带来高贡献,但高产量却有可能让一个人明显超出竞争者。
瑞利男爵是物理世界的巨人,好几个自然定律都是以他的名字命名的。瑞利散射定律解答了一个著名的问题:天空为什么是蓝色的?1886年,他递交了一篇有关几个电动力学悖论的论文,但很快被拒稿了。原因是他的名字无意中被漏掉了。当编辑明白这是瑞利的大作时,马上就接受了他。这就是说,最初被视为某位“悖论发现者”所写的不成熟的文章,一旦被证明出自一位享誉世界的科学家之手,突然就有了发表价值。
这件事凸显了一个在科学界至关重要的信号传递机制:科学声誉的作用。社会学家罗伯特·默顿将此现象称为“马太效应”,它来自《圣经·马太福音》:“凡有的,还要加给他,叫他有余;凡没有的,连他所有的也要夺去。”在科学界,当评判一篇科研论文时,人们确实信赖声誉,看重作者的地位和研究机构的名气。而那些没有地位的研究者,无论在研究设计还是研究方法上,都要经历更严格的审查。一篇论文获得新引用的速度,往往与论文已获得引用量成正比。高被引论文阅读量更高,因此也更有可能被再次引用,这种现象被称为“优先连接”。最终使用引用率主要取决于科学界对成果内在价值的集体认知。
2
很多伟大的科学家都拥有不止一项突破性成就。艾萨克·牛顿就是一个典型的例子,除了牛顿力学,他还创立了万有引力理论、微积分、牛顿运动定律、光学,还有最优化理论。事实上,著名科学家往往会涉及多项科研发现,这种现象也可以用马太效应来解释。初始的成功可能会使科学家备受认可,改善同事对他的看法,获得在竞争中赢得优势并最终取胜的经验。每一项回报都增加了其下次成功的可能性。
但是,还有另一种解释也同样有趣。那些伟大的科学家只是因为超常天赋,才能在科研事业中取得多项轰动性发现,并不断获得成功。因此,未来的成功仍属于先前已经取得成功的那些人,并非是以前的成功给他们创造了有利条件,而是因为以前的成功验证了他们的潜在天赋。而根据马太效应,仅仅是成功本身就能增加未来成功的可能性。
不管在哪种机制下,那些先前已经获得成功的人,在将来更有可能成功。但是,如果一些人能成功而其他人不能成功的唯一原因是天赋上的差别,那就意味着命运从一开始就青睐某些人,同时又忽视了其他人。如果马太效应是真实存在的,那么他所经历的每一次成功都将为下一次成功创造更好的机遇。他可能不是爱因斯坦,但是如果能幸运地赢得先机,他就有可能缩小自己与大师之间的差距,因为成功会像滚雪球一样越来越大。这就是“成功孕育成功”的效应。
科学家的职业周期一般始于学习,这时他们通常没有重大的创新成果。“1万小时定律”显示,要在人类能力所及的任何领域取得卓越成绩,需要差不多10年的专门训练。随后才有可能引来创造性的产出。当累积到一定程度时,重大突破随时都会降临。这种现象被称为“随机影响规则”。它告诉我们,某项成果成为重大突破的概率完全是随机的。准确地说,我们所做的每一个项目成为个人最优秀成果的概率是一样的。
不具有随机性的是产出率:年轻的研究者总是热切地不断尝试,论文一篇篇地发表。如果影响力在个人从事的所有项目中随机存在,那么从统计学上讲,具有影响力的成果总会在职业生涯早期的某个时候产生,因为那时的产出率更高。随机影响规则为我们认识产出率的作用提供了一个新视角:要想获得期待已久的科研突破,反复尝试是极其重要的。
“年轻等同于创造性”这一信条并不限于科学界,它在企业界同样根深蒂固。事实上,硅谷科技博客奖的获奖者平均年龄为31岁,荣登《公司》和《企业家》杂志“顶尖企业家”榜单的人平均年龄为29岁。红杉资本是一家著名的风险基金管理公司,他们支持的创业者平均年龄为33岁。经纬创投的受资助者平均年龄为36岁。
然而,数据分析更显示,与大众的认知不同,最优秀的企业家往往是中年人。在发展迅速的高新企业中,企业家在创建公司时的平均年龄为45岁。而50岁获得巨大成功的可能性是30岁同行的两倍。这些结果表明,创业绩效随着年龄而激增。与主流观点相反,你最好把宝押在年长一点的人身上,因为年长的企业家更有可能成功。
3
成功可能伴随着运气的成分。但是,一个人职业生涯中的成功靠的不仅仅是运气。职业生涯的一个关键特征是,优秀的科学家在所有科研项目上都很优秀。每位科学家可能都有一篇使他们声名鹊起的重要论文,但那篇论文的出现并不是靠运气。这就意味着他首先必须足够优秀。
一位卓越科学家的第二篇最佳或第三篇最佳乃至许多篇论文,通常都是引用量较高的论文,这也意味着,一位能够始终发表杰出论文的科学家,总有某些与众不同的特点。运气固然很重要,但仅凭它并不能带来长远的发展。从这个角度看,多发表一篇论文总是有意义的,即使他的影响力有限。首先,他无疑能增加发表的论文总量;其次,即使论文没有发表在重要刊物上,但随着时间的推移,它的引用量也会累积起来,从而增加个人的总体影响力。
对于爱因斯坦而言,1905年是他的“奇迹年”。那一年,他发表了四篇彻底改变物理学的论文。他解释了布朗运动,印证了原子和分子的存在。他发现了光电效应,向量子力学迈出关键的一步,并因此项发现而在十五年后获得诺贝尔奖。他创立了广义相对论,完全改变了我们对时间和空间的认知。然后,在这一年的年末,他写下了世界上最著名的公式:E=mc²。这就是爱因斯坦的“连胜”之年。
连胜在体育领域很常见。列纳德·蒙洛迪诺曾在《醉汉的脚步》中分析了著名的棒球手罗杰·马立斯本垒打的连胜案例。20世纪60年代初,马立斯打破1927年贝比·鲁斯创下了60个本垒打的连胜记录。但在此后的岁月,马立斯再也没有取得这样的成绩。连胜同样也发生在投资领域里,著名的基金经理彼得·林奇和比尔·米勒都曾经在长达十几年中连胜道琼斯指数。
对于科学家、艺术家以及电影导演,我们知道他们最成功的成就都是在成果序列中随机出现的。这个发现告诉我们,创造性是随机的,是不可预测的。偶然性是决定主要成就产生时间的最关键因素。也就是说,与体育或金融领域不同,科学家的职业生涯不大可能出现连胜。马太效应表明,成功孕育更多成功。因此,当我们有一个高影响力的成果,即使它产生的时间是随机的,我们随后也极有可能产出更多高影响力的成果。然而,根据随机影响规则,情况应该是相反的。如果职业生涯中每一篇论文的影响力都是随机的,那么一次成功后的下篇论文可能只是趋于平庸,而不是更为轰动,从而形成对均值的回归。
虽然每个最高影响力成果出现的时间是随机的,但个人职业生涯中顶尖论文产出的相对时间却遵循着高度可预测的模式。严格地说,个人职业生涯轨迹并不是真正随机的。相反,职业发展中的重大成果产出时间具有高度的群集性,高影响力成果有时会连续出现,呈现“爆发”态势。而且这些特征并不局限于科学家的职业生涯,艺术家和电影导演的重大成果也遵循相似的模式,这表明在大量创造性工作中,成功作品的出现具有普遍性的群集现象。这样就解释了爱因斯坦“连胜”的原因。
尽管连胜具有普遍性,但它在创造性职业生涯中又具有唯一性。事实上,当放宽计算要求,允许存在至多3个连胜期,我们发现有68%的高影响力科学家仅经历过1次连胜期。第2次连胜有可能发生,但可能性较低,多于两次则非常少见。这同样适用于对彼得·林奇或比尔·米勒的解释。连胜在职业生涯中出现是随机的,这进一步解释了随机影响规则。尽管爆发与连胜以不同的方式测量,但说明连胜与人类活动中的爆发特征具有共性,连胜现象很可能在创造性领域之外也存在。这就意味着,虽然我们不会有爱因斯坦那样的影响力,但只要坚持,我们自己的“奇迹年”可能就在前方,举目可期,指日可待。
4
科学的理解和发现都局限于那些成功发表出来的构想,而绝大多数构想都是失败的,甚至有时是完全失败的。很显然,如果仅仅专注于那些成功的研究,无疑会固化我们对于失败的系统性偏差。
二战时,英国军方研制了一种在飞机上使用的防弹装甲材料。然而,对于设计师来说就面临一个重要问题:需要把这种材料首先用在飞机的哪个部分?盟军决定采用数据驱动方法。他们标记了每一个中弹点。在收集了数据之后,决策似乎是显而易见的:把装甲材料用于弹孔最多的地方。但是,统计学家亚伯拉罕·沃尔德提出不同意见:正确的策略应该是反过来做——把装甲材料用于那些没有中弹的部位。这是因为所有的记录都来自成功返回基地的飞机。如果一架飞机成功往返的话,那么看上去像蜂窝乳酪的机身就并非是我们关注的重点。相反,引擎部位等没有弹孔的地方才是需要额外保护的关键部位,因为这些部位中弹的飞机根本就没有返回。
这个经典的案例表明,基于只包含成功的样本数据,所得到的初始结论可能会被完全推翻。科学中类似的偏差非常多:文献往往聚焦于那些能够获得基金、在同行评审的期刊上发表文章、获得授权专利、成立新企业以及长期多产的研究人员。
如果比较“侥幸成功”和“不幸失败”的年轻科学家向美国国家卫生研究院提交的R01申请,来观察他们更长期的生涯表现,就会发现早期生涯的挫折确实有影响:它显著增加了人员流失率。“不幸失败”的申请人永远离开美国国家卫生研究院系统的可能性要比“侥幸成功”的申请人高出10%以上。也就是说,一次挫折就可以终止一个人的学术生涯。然而最令人吃惊的是,数据显示从长期来看,“不幸失败”的个体如果继续其科研工作的话,会系统性地超越“侥幸成功”的个体,前者在后续10年发表的文章具有明显更高的影响力。
一个可能的解释是筛选机制,“不幸失败”组中的“幸存者”具有先天的良好特质,从而使得继续留在领域内的人总体上比“侥幸成功”的人表现更好。那些早期没有获得资金资助,但仍然坚持不懈的人,并不是一开始就表现良好,而是逐步磨砺,也成了更好的自己,印证了“玉汝于成”这个成语。
这些结果看上去特别反直觉,因为科学遵从“富则更富”的规律,但结果却是失败而不是成功带来了更多的成功。这些发现表明科学中的失败具有很强的反作用——损伤了一部分的研究生涯,却无意中促进了其中某些人的成功。如同早期的成功一样,早期的失败也可以成为未来成功的风向标。这是一个好消息。因为科学家即使不是每天,也会每周都经历失败。这一研究也得出了一个更广泛适用的观点:尽管我们在理解成功方面取得了一些成功,但我们也许在理解失败方面却遭遇了失败。
科学学的本质决定了它必须是关于科学、属于科学和服务于科学的。如果科学只是依赖于少数几个学科,如信息科学、社会科学和工程学,那么它将会失去科学活动的一些关键方面,而这一活动正以指数级的速度变得更大、更为复杂且更为互联。换句话说,科学要想成功,就需要所有的科学。如此,才有可能进行着成功地滚动着成功的雪球。
版权声明:部分文章推送时未能与原作者取得联系。若涉及版权问题,敬请原作者联系我们。
继续阅读
阅读原文