编者按:
瑞典皇家科学院11日在斯德哥尔摩宣布,将2021年诺贝尔经济学奖授予三名经济学家David Card(戴维·卡德)、Joshua D. Angrist(乔舒亚·D·安格里斯特)和Guido W. Imbens(吉多·W·因本斯),以表彰他们在劳动经济学与因果分析方法研究领域作出的突出贡献。作为普及数据科学的社区,统计之都在主页(https://cosx.org/)和公众号(CapStat)也曾发表过一些因果分析的文章,我们也在第一时间采访和收集了一些在因果推断领域的学术界和业界人士(包括统计、计算机、公共管理、教育等相关专业)关于此次获奖的一些观点,既包括对因果推断工作的祝福和美好展望,也包括对因果分析滥用的警示和质疑。供大家批判、参考。

对因果分析工作的祝福和美好展望

青年统计学者苗旺总结说,这至少是因果推断相关工作第三次获得诺贝尔经济学奖了。并指出混杂因素是因果推断的核心难题,而在大数据和人工智能时代,因果推断面临新的挑战和机遇。
2021年并不是诺贝尔经济学奖第一次颁发给因果推断的研究成果,1989年Haavelmo和2000年Heckman获诺贝尔奖的主要贡献都与因果研究密切相关。Card, Angrist和 Imbens获奖的工作着重于观察性研究和混杂因素的工具变量调整方法。因果关系是众多科学研究的最终目标,混杂因素是因果推断的核心难题,工具变量已有百年历史,在为诺贝尔经济学奖获得者欢呼的同时,因果推断也面临大数据和人工智能应用的新挑战,着力发展新的混杂因素调整方法在理论和应用层面都有重要意义。2021年的诺贝尔经济学奖是一个新的里程碑,激励我辈在因果研究的道路上马不停蹄。

(青年统计学者苗旺)
Judea Pearl 点赞了从非实验数据得出因果结论这一工作,在对获奖者和因果推断发展献上祝福的同时,他再次旗帜鲜明地反对了Angrist和Imbens的因果推断方法(注:获奖者的方法都是基于Rubin教授的Rubin Causal Model,而Pearl更推崇他发明的因果图模型)。
祝贺我们的同事Joshua Angrist和Guido Imbens获得2021年诺贝尔经济学奖,从而引起更多人对因果推理科学及发展的新方法关注。我过去是(现在还是)坚决反对Angrist和Imbens的方法,这绝非秘密,主要是因为他们忽视了因果推理的两个基本定律。然而,他们的方法已经引起了经济学的颠覆,并且我更加赞赏从非实验数据得出因果结论的一般问题。这一最新奖项将增加研究人员对因果推理科学的兴趣,自然会吸引经济学家研究更通用、更透明的因果关系管理方法。

(加州洛杉矶分校教授 Judea Pearl)
中国人民大学统计学院李伟阐述了 Pearl 对因果推断总结的三个层次,相关分析、因果作用和反事实推断。他还指出,因果推断与机器学习和人工智能等领域的交叉融合,产生了各种具有挑战性的重要研究问题,亟需各领域专家学者相互协作解决。
因“对因果关系分析的方法学贡献”,经济学家乔舒亚·D·安格里斯特(Joshua D. Angrist)和吉多·W·因本斯(Guido W. Imbens)在今年共同分享一半的诺贝尔经济学奖。除了经济学领域,因果推断在生物医学、教育等许多领域中都受到了广泛关注,至今仍是一个挑战性的难题。人工智能研究的先驱Judea Pearl将因果推断这一问题分为三个层次。第一个层次是相关分析。若两个变量之间相关,其未必有因果关系。因为它们可能受同一个变量即混杂因素的影响。第二个层次是因果作用。若要正确评价因果作用,则需要观测到所有的混杂因素。而当研究问题中含未观测混杂因素时,这两位今年的诺贝尔经济学奖获得者及其同事提出的工具变量方法被用来消除未观测混杂因素的影响,以正确评价因果作用。第三个层次是反事实推断,这是因果推断的最高层级,它强调人们对已经采取的处理和发生结果的反思及改进。例如,一位有10年烟龄的病人得了肺癌,我们要关心其肺癌由吸烟导致的概率有多大。要反思的问题是:假如该病人不吸烟是否还患肺癌?这类反事实问题在某些需要归因的场景下十分常见,如法律判决、疾病诊断、机械故障判断、药物副作用判别等。但由于反事实推断这一问题最为复杂,目前研究还相对较少。在当前大数据时代,海量的数据使得因果推断迎来了新的发展机遇。例如,因果推断与机器学习和人工智能等领域交叉融合,产生了各种具有挑战性的重要研究问题,亟需各领域专家学者相互协作解决。

(中国人民大学统计学院李伟)
中国人民大学统计学院刘越老师赞扬了工具变量方法广泛的应用价值,并号召因果推断的学者加强与其他方向学者的交流与合作,为学界和业界创造更多的价值。
2021年的诺贝尔经济学奖由 David Card, Joshua Angrist 和Guido Imbens共同获得,这三位学者在因果推断,尤其是工具变量方法领域的研究成果对现在诸多学科具有巨大的影响力。
多年前,经济学家Susan Athey(Imbens 的妻子)曾在哈佛大学的讲座中提到:工具变量是一个非常重要的方法,但却鲜为人知。如今,随着因果推断的学者逐渐走出象牙塔,工具变量在统计学、经济学、社会学、政治科学、教育学、流行病学、计算机科学、哲学等领域得到了广泛应用,因果推断也成为了临床试验、药物监管、在线广告竞价等实际场景中的金标准。随着因果推断涉及领域的不断扩大,因果推断的学者更应该加强与其他方向学者的交流与合作,为学界和业界创造更多的价值,也为因果推断的发展贡献自己的力量。
(中国人民大学统计学院刘越)
匹兹堡大学教育学院秦旭再一次提到,三位诺奖获得者的工作都在利用自然实验探索因果关系上做出了卓越贡献,大大地拓宽了因果推断的适用范围,比如在公共卫生、教育学等。
今年的三位诺贝尔经济学奖获得者都在利用自然实验探索因果关系上做出了卓越贡献,这其实也是对因果推断方法在经济学中的成功应用与发展的肯定。提到因果推断,人们往往会想到随机试验。在对很多社会问题的研究中,随机试验并不适用于探索因果效应。比如,我们不能随机分配一个人的工资、学历。然而自然实验经常发生,例如,它们可能由于某些地区的政策变化而产生,这意味着一些人受到干预,而一些类似的人没有,因此,自然的随机性将人们分为实验组和控制组。三位获奖者巧妙地利用自然实验大大地拓宽了因果推断的适用范围。他们在方法上的贡献并不局限于经济学,还被广泛用于其他领域,比如公共卫生、教育学等。很多统计学、经济学等专业的学生可能都读过他们的经典论文或者著作。尽管他们的方法存在争议,但正如2011年图灵奖得主 Judea Pearl 第一时间在推特上发表祝贺时所说,他们的获奖会提升研究人员对因果推断的兴趣,吸引经济学家开发更通用、透明的探索因果关系的方法。

(匹兹堡大学教育学院青年统计学者秦旭)
上海交通大学自然科学研究院刘林提到,在生物学领域恰好存在着大量天然的工具变量—孟德尔随机化,这也是当今(生物)统计中因果推断非常重要的方向。同时也指出,因果推断的发展是由统计学、计算机科学、经济学、政治科学等多学科共同相互促进的。
Angrist 与 Imbens 等人在工具变量方面的贡献确实十分重要:他们本人当初应该也没有想到,在生物学领域恰好存在着大量天然的工具变量—孟德尔随机化,这也是当今(生物)统计中因果推断非常重要的研究方向,其中很多近年比较重要的结果与方法也是由 Angrist,Imbens,Andrews 等经济学家在Weak IV/Weak Identification等问题中的成果所启发的。更值得期待的是,因果推断一直以来都在由多个领域(统计学、计算机科学、经济学、政治科学等)的 cross-fertilization 来推动,我相信 Angrist 与 Imbens 等人的诺贝尔经济学奖可以促使更多的学生和其他方向的学者对因果推断产生兴趣,以进一步加速因果推断的发展。

(上海交通大学自然科学研究院刘林)
还有学者详细总结了 Imbens 教授的杰出贡献,比如匹配、工具变量、断点回归设计、因果树等方法。并推荐了 Guido W. Imbens与Donald B. Rubin合著的书籍《Causal Inference for Statistics, Social, and Biomedical Sciences: An Introduction》。
Guido W. Imbens 是美国斯坦福大学商学院经济学教授、美国艺术与科学院院士、世界计量经济学会会士、圣加仑大学名誉博士。Guido W. Imbens 教授在因果推断领域做出了杰出的贡献,发展了利用匹配、工具变量、断点回归设计等方法研究现实情况下干预效果的方法和理论。例如,在 Rubin 因果模型下,Guido W. Imbens,Joshua D. Angrist 和 Donald B. Rubin 在20世纪90年代中期的工作建立了因果效应的识别条件,给出了工具变量所对应的被估量的因果解释。这些研究有助于增加实证研究的透明度和可信度,成为后续研究的基础并获得了广泛的应用。Susan C. Athey 和 Guido W. Imbens 在2016年的合作论文提出了因果树的概念和方法,成为后续发展的因果森林的基础,适用于估计和推断异质性因果效应,在个性化医疗、精准营销等领域有着广泛的应用。此外,Guido W. Imbens与Donald B. Rubin合著的书籍《Causal Inference for Statistics, Social, and Biomedical Sciences: An Introduction》已经成为因果推断领域的经典教材。

(清华大学青年统计学者)

对因果分析滥用的警示和质疑

除了对因果分析工作的祝福和展望之余,部分学者也提出了警示甚至质疑。
芝加哥大学博士冯俊晨提醒大家应该警惕因果思潮的对经济学研究的负面影响,包括因为过度追求因果关系而放弃宏大叙事,以及数据集获取的高门槛阻碍了相关研究的普及和大众化。
21年诺奖给了在利用自然实验(natural experiment)识别因果关系上做出卓越贡献的三位经济学家(但让我们不要忘记不幸离世的Alan Kruger)。
自20世纪90年代以来,随着经济学界对于实证研究中因果关系可识别性(identifiability)和合理识别(clean identification)的关注,利用人为政策造成场景来近似严谨的可控随机试验,成为经济学实证研究的标配。例如Card & Kruger利用州界来研究最低工资,Angrist利用越战抽签来研究服兵役,都是让人击节赞叹的经济学研究名篇。
除了对于智力审美的贡献,自然实验极大地扩展了可以准确评估政策的实际效果(以及未预料到的效果)的场景。通过更准确地评估和优化这些公共政策,社会福利得到了提高。除了公共政策领域,我相信商业决策,其他社会科学领域(甚至公共医学)也会越来越多地接受自然实验的“科学性”,从而进一步扩展我们的认知边界。
在我们庆祝因果识别又一次被主流经济学界认可时,我们也应该警惕这股思潮的负面影响。首先,对于可识别性的追求让经济学一定程度上放弃了对于宏大叙事的研究。借用醉鬼在路灯下找钥匙的隐喻,经济学家宁可在路灯下找石子,也不愿意去摸黑找钥匙。我们想要找到经济运行的真理,却得到了关于不公平的抽签如何改变人生的仔细研究。其次,使用合理识别的方法往往需要研究者获得非常特殊的私有数据集(而不是公共可得的数据),这不仅使得“高端”经济学研究成为只有一小部分人可以玩的游戏,同时也降低了这些研究的可复制性。  
(芝加哥大学公共管理博士冯俊晨)
中国人民大学统计学院吴喜之在质疑因果推断是否能大规模应用的同时,也进一步质疑了诺贝尔经济学奖的实际价值。
因果关系非常复杂, 因为涉及哲学和标准不确定等非科学问题。简单或复杂的事情都很难搞清因果关系, 困难是需要识别所有相关的变量。但人类的认知范围太可怜 (比如关于气候暖问题), 根本无法识别如此复杂宇宙 (包括人类本身的生理和心理) 的各种变量。而由于这些限制,因果推断很难大规模应用。和受到普遍尊重的诺贝尔科学奖相比, 诺贝尔经济奖是最少受到尊重的奖项之一, 先后得奖者的观点互相矛盾, 而且大都没有后续的实际意义。

(中国人民大学统计学院教授吴喜之)
京东商城的熊熹结合工作实践,调侃了部分因果工作成为“玄学”和“故事会”。在欣赏那些被津津乐道的大佬成名作同时,质疑“这样的极限边界条件以及苦心孤诣的设计,真的可以推广应用吗?”。最后指出,验证那些精巧的因果推断,还是得靠最朴实无华、大巧不工的 AB 实验上。
近些年来,大量经济学模型随着“数据科学家”们的不断挥舞而在互联网公司登堂入室,造成了一种比深度学习炼丹更“玄学”的应用。除了传统而可靠的AB实验,工具变量、断点回归以及倾向性匹配等比较时髦的方法越来越多的被拿来讲故事,很不幸我也是其中一员。本次诺奖的宣传作用,可能可以让“故事会”们得到更多关注认可,但是更需要从业者审慎对待自己的斧头。
深度学习被人诟病的过拟合问题,在因果推断中甚至有过之无不及。现实中的因果绝少单因素以及线性影响,为了达成这样的使用场景,学者们常常需要在极限边界条件寻找数据。这其中有一些非常漂亮值得学习的工作,比如本次获奖者Card通过古巴偷渡事件研究移民对劳动力市场的影响,2020年克拉克奖获得者Melissa Dell基于爪哇种植园,秘鲁矿区和越南殖民史等历史地理断点研究殖民等制度对经济的积极影响等,包括这次因为诺奖而被朋友圈热转的“多读一年书,工资增加9%”。但是这样的极限边界条件以及苦心孤诣的设计,真的可以推广应用吗?深度学习模型的预测能力,尚可用各种测试集以及实际场景来不断验证;各种正则化、drop out等方法论也层出不穷。但是验证各种精巧的因果推断故事的斧子在哪里呢?恐怕还是要落到最朴实无华、大巧不工的 AB 实验上。
京东商场数据科学家熊熹

统计之都发布的因果分析文章

统计之都在推广因果推断方面也做了一些科普工作,尤其是现任加州大学伯克利分校丁鹏老师的系列专栏文章被广泛阅读和传播,以下是曾在公众号上发表的相关文章,以飨读者:

附:Angrist 和 Imbes 的介绍

Joshua Angrist,以色列裔麻省理工学院福特经济学教授,美国国家经济研究局研究员,美国艺术与科学学院和世界计量经济学会院士。他是世界顶尖的经济学家中劳动经济学,城市经济学,和教育经济学家,被称为运用准实验研究设计(如工具变量)研究公共政策的影响以及经济或社会环境的变化专家。他是麻省理工学院的共同创始人和联席总监学校效能和不平等倡议,研究人力资本和收入不平等。他曾担任多个编辑委员会成员和《劳动经济学杂志》的联合编辑,是《基本无害计量经济学》《功夫计量经济学》的作者。Joshua Angrist教授被中国经济学界的粉丝们尊称为“安神”。
Guido Wilhelmus Imbens,荷兰裔美国经济学家。 自 2012 年起担任斯坦福大学商学院经济学教授。1983 年从鹿特丹伊拉斯姆斯大学毕业并在布朗大学获得博士学位。他曾任教于哈佛大学,加州大学洛杉矶分校和加州大学伯克利分校。Imbens 专攻计量经济学,特别是绘制因果推理的方法。2019年至2023年担任Econometrica的编辑。他是计量经济学会(2001 年)和美国艺术与科学学院(2009 年)的会士。他与Rubin撰写的《 Causal Inference for Statistics, Social, and Biomedical Sciences: An Introduction》,被誉为“因果推断”领域最经典的教科书。

关于【数说风云】

【数说风云】是针对热点或重大话题,统计之都邀请不同背景嘉宾从不同角度对话题分析、讨论的栏目,以启发思考、促进创新。欢迎留言参与讨论。
编辑:向悦,任焱
统计之都:专业、人本、正直的中国统计学社区。
关注方式:扫描下图二维码。或查找公众帐号,搜索 统计之都 或 CapStat 即可。
往期推送:进入统计之都会话窗口,点击右上角小人图标,查看历史消息即可。
继续阅读
阅读原文