民调为什么又错了？ | E闻美政（附音频）

转载请征求许可，规范署名(公号名/ID/作者)，违者必究。

编辑：SUN

音频专栏 | E闻美政

文章仅代表作者本人观点，不代表《纽约时间》立场。

第 41 篇

民调为什么又错了？

By | Eric

在 2016 年大选前的民调，普遍认为希拉里将获得大选的胜利。值得注意的是，民调结果和普选结果 popular vote 的差距其实不大，全国民调显示希拉里得票总数将超过川普 3%－4%，而实际结果是希拉里总得票数超过川普 2.1%。但那一次民调，在之后的总结中，发现对各州的预测有较大出入。普遍认为，这是因为那一次民调中，忽略了未接受过大学教育的白人这个川普的主要票仓，导致民调采样的成分，和实际投票者的组成成分不匹配造成了预测的误差。这就好像如果你调查某种疾病的发病率，结果采样人群的各年龄段人数比例和实际人群的年龄构成比例不同，比如说人口比例中老年人占 20%，而你采样人群中老年人只有 5%，而这个病主要集中发病就在老年人。那么采样本身就存在了误差，最后得出的疾病发病率就会比真实的发病率低很多。这就是统计学中的所谓抽样误差（sampling error）。

在 2020 年大选之前，各民调机构认为自己修改了自己的抽样标准，加大了对无大学教育背景的白人群体的抽样。但他们今年的预测，其错误率几乎和 2016 年一模一样，甚至某些州还比 2016 年的预测更糟糕。要知道，在美国，民调的准确性是很高的。比如 2018 年中期选举，民调预测的结果基本上都符合最后投票结果。

很多华裔会问，民调会不会作假呢？这种想象显然是把神州的某些特色运用到了西方社会。事实上，西方绝大多数民调公司是专业搞市场调研的公司，民意调研的准确度，就是他们的产品质量。一些阴谋论所谓民意调查造假，是因为他们根本不知道西方的民调公司是靠什么吃饭的。像经常受 CNN，美联社委托做民调的 IPSOS 公司，就是一家法国的上市公司，年收入超过 20 亿美元，全世界市场调研公司排位第五。说这样一家公司数据造假，不如说可口可乐公司在可乐里兑自来水了。

但让我们回到现实。一旦涉及到川普，民调就立刻不准了。为什么？这是一个让人饶有兴趣的话题。

在蓝州，其投票结果川普得票比例的中位数，比民调的要高出 2.6 个百分点；而在红州就更离谱，川普实际得票超过预测 6.4 个百分点。

有一种流行的说法是，川普的支持者很害羞（shy Trump voters)。他们在接受民调的时候羞于承认自己支持川普。但在实际投票中还是把票投给了川普，这造成民调出现误差。但越来越多的证据显示，这种说法正确的可能性不大。因为很多民调不是人打电话，而是机器人提问和接受答案，这种情况下，人不会觉得自己正在接受道德审判，不会隐藏自己的观点。另外，更有力的证据是，和大选无关的一些民调，比如对共和党的支持率，对移民政策的看法等，都高度和大选民调吻合。这说明接受民调的人并没有掩饰自己。

有一种解释是这样。由于疫情的影响，对民主党和共和党的选民是不对等的。比如在传统的红州，民主党支持者投票的意愿本来也不高（这归功于美国古怪的选举人团制度，在深红州民主党支持者投票等于白费。），疫情影响下，他们更加懒得去投票，这可以解释今年大选中红州的投票结果，川普大大超出了民调预测的胜出比例。但反过来，疫情对共和党支持者的影响没有那么大，所以他们的投票比例并没有下降太大。

但这种解释是基于投票率在疫情影响下会下降的假设。实际的情况是，今年的投票率非常高，达到历史性的 65.4%。所以这种解释的力度也不大。

让我们回到抽样误差的理论。看上去这一次还是发生了抽样误差。民调公司想要预测投票结果，就必须预测哪些人将会出来投票。他们选择的抽样的样本，其年龄，性别，学历，种族等组成成分，需要和实际出来投票的人群比例接近，这样抽样结果才能反映真实的投票结果。但是，2020 年发生了一件事，那就是剧烈的社会撕裂导致破纪录的投票人数。无论是拜登还是川普，他们获得的票数，都是美国迄今为止最高的得票数，超过 1.5 亿的美国人出来投票，而 2016 年投票人数已经是当时历史最高了，也只有 1.2 亿人投票。今年这种情况可能是民调公司没有想到的，这可能导致他们抽样上的误差。

另外可能还有一个更为深刻的原因。那就是社会信任度的问题。

谷歌公司下属的一家数据分析公司 Civis Analytics 认为，川普的支持者，有很大一部分是对美国社会充满了不信任感的社会底层老百姓。他们不相信建制，不相信科学家，不相信大公司。在抽样中选定的这部分人，往往不愿意接电话，不愿意配合调查。分析指出，接电话接受调查的人群，其社会信任度 social trust 的程度，高于普通民众。接受调查的人，其民主党或倾向于民主党的可能性，高于共和党或倾向于共和党的可能性。另外还有一个很有趣的现象，就是，凡是相信 QAnon (阴谋论组织）的地区，民调都显得更为不准确。这是因为相信阴谋论的人，他们的社会信任度，非常低。虽然民调公司试图弥补这一偏差，但显然不太成功。请注意这样一个数据，在 1997 年，超过 1/3 的美国人在接到民调电话时愿意接受调查，而这一比例在 2019 年，下降到了 6%。

另外还有一个有趣问题，是这次大选特有的现象。在以往的大选中，候选人都是标准的美国政客，选民对候选人的关注点基本上是对称的。他们会对比双方的政策，双方的风度，双方的丑闻等。所以，传统上的民调，都是将同一个问题对称地去套在两个候选人身上，比如“你更同意川普的经济政策，还是拜登的经济政策？“ 但这一次，情况完全不同。选民其实不是在选择两个对等的对象。这次大选的选民投票抉择，实际上是在两个不同类别的对比中形成的。这两个不同类别是：”我是否还能忍受川普的恶劣人品？“ 和 ” 我是否能容忍拜登的加税政策？“ 这是两个完全不同的类别问题，但真实地存在于选民的抉择因素之中。这种不对称也可能造成民调问题设计的困难。

最后，还需要考虑到人的因素。尤其在人工调查中，调查者的语气和态度会影响被调查者，而被调查者给出的答案又会受到调查者的主观判定影响。这就是说，一个左派的调查者，更容易获得倾向于左派的答案，反之亦然。这就出现了左派媒体调查的结果，往往倾向于民主党，而右派媒体民调的结果，会倾向于共和党。

民调除了能够帮助商业人士更加了解顾客的需求外，在西方也是政治人物的问路石。民主政治中，了解选民意愿的重要性无论这么说都不过分。那么民调机构在这两次非典型大选中获得的经验和教训，对于民主政治来说，也是非常重要的。

Eric 往期专栏（含音频）：