思想的多样性：均值回归的谬误

作者：姚斌

来源：在苍茫中传灯（ID：chuandeng169）

在统计学范畴，很少会有比均值回归更有趣的概念。其原因有二：首先，人们几乎每天在生活中都会遇到几次；其次，几乎没有人理解它。因此，“均值回归”成为人类做出错误判断的根源之一。这是统计学家加里·史密斯在他的《运气的秘密》一书中的研究主题。

霍勒斯·西克里斯特的错误

均值回归最早由维多利亚女王时代的科学家弗兰西斯·高尔顿提出。高尔顿在遗传性状的研究中发现，最大的母本种子可能受到积极的环境影响，而最小的母本种子可能受到负面的环境影响，但环境影响并不会遗传给后代，因此，后代种子比母本更接近平均值。高尔顿把这种模式称为均值回归。但是，高尔顿没有意识到运气因素的影响。个子很高的父母可能运气非常好，但他们的子女通常不会有这样的好运气。

讽刺的是，统计学中最著名的回归错误是经济学家，甚至是诺贝尔奖获得者制造出来的。史密斯惊讶地发现，这些精通现代统计方法的评论者和作者居然没有意识到，他们创造了可怕的回归谬误。在回归谬误的引导下，人们更倾向于相信，操纵公司的是可预测的经济力量，而非运气。

回归错误的出现最初可以追溯到20世纪30年代。当时，经济学教授霍勒斯·西克里斯特花费了10年时间收集并分析了73个不同行业的数据。他汇编了1920年到1930年间的重要商业年度数据，包括零售业利润率、资产利润、零售业支出和资本支出。他根据20世纪20年代的具体数据，将一个行业的公司分为4个梯队：排名前25%，排名25%~50%，排名50%~75%，以及最后的25%。

对于在1920年排名前25%的那些公司，西克里斯特计算出了它们1920年到1930年每年的上述数据平均值。对于另外三个梯队的公司，他也进行同样的计算。几乎在每个案例中，1920年排名前两个梯队的公司的计算结果都和1930年的平均值几乎相同；1920年排名后两个梯队的公司的计算结果也都近似于1930年的平均值。

由此，西克里斯特发现了一个具有普遍性的现象，那就是成功和不成功的企业“都会走向平庸”。这就是他的著作《商业中平庸者的胜利》的由来。平庸成为了新经济原则：竞争压力不可避免地让高级才能无处发挥作用。显而易见的出路就是保护那些更高级的公司，避免它们与那些不尽如意的公司竞争。杰出的统计学家哈罗德·霍特林一针见血地指出：“西克里斯特浪费了10年时间，最后什么都没有证明，他所谓的著名理论仅仅是均值回归效应的误导。”

在任何特定的年份中，无论是和其他公司相比，还就自身实力而言，最成功的公司往往更有可能是因为碰到了好运气而表现出色，而最不成功的公司恰恰相反。这就是为什么第一梯队、第二梯队公司的后续表现总是与普通公司的表现相近。同时，在极端情况下，当它们运气差而其他公司运气好时，它们的位置就会被取代。这些波动都是正常的，但并不意味着所有的公司终将走向平庸。正如平均成功率中的数据所揭示的那样，任意一个年份中最优秀的和最差的公司在下一年都会更接近平均值，但这并不意味着每家公司只能得到平庸的成绩。

加里·史密斯的实证

为了说明商业中的自然波动，加里·史密斯也虚构了一个包含100家公司的行业，然后计算出利润中的资产回报率。和平均水平相比，一些公司获得了更高的利润，但每家公司的利润率比起平均利润率来说总是忽高忽低。史密斯随机生成的每一家公司在1920年的利润率，还用同样的方法得到了1930年的数据。按照西克里斯特的理论，史密斯根据1920年各家公司的利润率将它们分为4个梯队。分别显示了1920年各家公司的平均利润率以及4个梯队在1930年的平均利润率。在1920年处于第一梯队的公司当年的平均利润率为48%，到了1930年这一数字则为39%。这些公司的利润下降是因为它们在1920年的运气更好。实际上，1920年的每个梯队公司的利润都更接近于1930年的平均值。

正如反常的父母通常会生出比他们正常的一些小孩，反之亦然。无论时间是前进还是倒退，利润总是会趋向一个平均值。史密斯采用同样的方法生成了1910年的各家公司的利润。在1920年位于前两个梯队的公司的利润不仅接近于1930年的平均值，同样也接近于1910年的平均值，后两个梯队的情况也是如此。1920年各家公司利润在时间轴的前后方向都有朝平均值靠近的趋势。

史密斯假设每家公司在1910年、1920年、1930年这三个时间节点的盈利能力都是相同的，但实际情况是，公司的经营水平会随着时间推移不断提高。史密斯之所以这样假设，是为了展示，即便所有公司的盈利能力都保持不变，利润依然会趋同。1910年和1930年的均值回归现象，反映出利润的数值总是上下波动的。但如果把公司分成不同的梯队，那么只能证明在1920年，它们要么运气极佳，要么运气极差。就像霍特林所说的那样，这些图表仅仅证明了利润率总是倾向于在某个数字附近徘徊。而花费10年的时间对这些数据进行研究则是浪费。

均值回归效应并不意味着每家公司在不久之后将会变得同样平庸，或者每个人都将处于同一水平。这种回归仅仅反映出，如果用有瑕疵的方法去衡量一个从前未被观察到的特质，那么往往会夸大该特质与平均水平的差距。

如果舍弃假设的数据，那么真实的数据是怎样的？史密斯计算了1990年到2010年之间的某个时间点上，道琼斯工业平均指数名册上的28家公司的利润率，同时获取这些公司在1990年、2000年和2010年的利润。因为经济状况的起伏，这三个年份的平均利润率存在差异，分别为6.6%、8.1%以及6.2%，因此他计算了每家公司的利润率与当年平均利润率的差值。根据2000年的数据，他把这些公司分成4个梯队，并计算出它们在三个年份的利润差。研究显示，所有公司的利润在2000年前后走向趋同。

不能忽略运气的作用

在经济学现象中，我们可以经常观察到，随着时间的推移，商业利润往往愈发趋近平均值。经济学理论将这种现象视为竞争环境的一个典型特征。市场价格上升或成本下降这些突如其来的好运导致了超出正常水平的利润，进而催化了新的竞争。这种理论并不鲜见。许多观察者曾经撰文评论过这种均值回归的现象。但他们都忽略了运气的作用，而寄希望于给出一个经济学解释。最常见的解释是，竞争者们会对某些公司的发展感到眼红，继而迎头赶上，瓜分利润，而那些表现平平的公司会改变其一贯的做法并取得进步。

资本资产定价模型的创立者威廉·夏普在所著的一本投资教材中这样写道：“经济力量将最终导致不同公司的利润和增长率的趋同。”为了证明这一结论，他研究了1966年利润增长率最高和最低的公司。十四年后也就是1980年，两种公司的利润率都接近于平均值。他因此自豪就得出这样的结论：“趋向平均值是一种显而易见的现象，并且无疑是真实的。”就像50年前的西克里斯特一样，他并没有考虑到这种趋同可能仅仅是统计学上的回归现象而已。几年后，另外两位杰出的金融学教授犯下同样错误。尤金·法玛和肯尼斯·弗伦奇也描述了收入数据的回归现象。他们也将其原因归结于竞争。

在竞争环境中，这种利润率的均值回归现象在行业内外都很普遍。总是会出现一些新公司，模仿那些创造过超高利润的产品和技术。而利润较低的公司或许由于失败的预期或其他公司的接管，能够更好地利用现有资产。这些随意的解释可能有些道理，但无疑是以偏概全。这些证据毫无说服力，因为它们完全忽略了纯粹的统计学原因，即相对高收入的公司也可能只是因为运气更好。

总体而言，经营良好的公司比经营不善的公司更赚钱。但也不能忽略运气的作用。新资源和新技术的发现，带来比预期更成功的产品、竞争者偶尔引发的麻烦以及诉讼的输赢等等。在任意的特定年份中，总会有资产回报率高的公司同时拥有更好的运气，这也意味着它们这一年的资产回报可能高于前一年或者下一年。

从优秀到卓越的随机性

忽视商业表现中的运气成分会带来不幸的后果。不管我们以什么标准衡量成功，每个公司总会出现大起大落。因此，业绩表现只是一种有瑕疵的衡量标准，并且极易受到均值回归效应的影响。如果一位研究者将表现极佳的公司汇编成一份名单，并且试图寻找它们之间的共性，认为是这些共性促成了它们的良好业绩，那么他就已经误入歧途了。无论是差公司、好公司，还是顶级公司，都不可避免地拥有一些共同特征。找到这些特征并无任何建设性意义，我们无法确定它们能否解释过去的成功，或者预测未来的辉煌。

许多管理类著作对所谓的“好公司名单”进行地毯式挖掘，然后宣称已经发现了这些公司的成功奥秘。2010年，吉姆·柯林斯出版了他的《从优秀到卓越》。柯林斯说，他的著作给出了“我们一直都在寻找的适用于任何组织的、永恒而普遍的答案”。他的结论是：“我们相信，几乎任何组织都可以实质性地提高它的地位和表现，甚至跨入顶级公司的行列，前提是它们能够有意识地将我们发现的理论付诸实践。”

柯林斯花了5年时间，研究了过去40年的股市行情走势，观察了1,435家公司，最后发现，有11只股票高于市场整体表现，并且在跻身顶级公司行业后仍然继续上升。这11家顶级公司具有5个共同特征。这些特征看上去非常有道理，但问题在于这是一个回顾性的研究，其可信度已经被数据挖掘这一模式削弱。柯林斯这样写道：“通过从数据中直接进行经验推理，我们创造出了这本书中的所有概念。我们的项目并不存在需要测试或证实的理论前提。我们选择基于手头的证据，从无到有地构建一个理论。”柯林斯显然认为，这一声明让他的研究看上去颇为专业和中立。他并没有编造任何东西，只是根据数据得出了所有结论。

事实上，柯林斯承认，他并不清楚为什么一些公司比其他公司表现更好，同时对“从数据中得出结论”这一方法的弊端有充分的了解。当我们回顾那些所谓的好公司与差公司时，总能从中发现一些共性。因为科林斯的发现看上去会非常有道理，所以数据挖掘的弊端并没有那么明显。但数据挖掘毕竟是数据挖掘，连柯林斯自己都承认，他的理论是在研究数据之后编造出来的。

柯林斯并没有提供任何证据证明他所描述的5个特征造就了这些公司的成功。如果要证明这些，他必须为这些特征提供理论上的正当性，并提前挑选那些拥有或者没有这些特征的公司，根据事先确立的一系列标准评价他们取得的成功。但这些工作他都没有做过。

《从优秀到卓越》出版之后，书中提到的11家公司有些走向了平庸，有些甚至一落千丈。2001年，房利美的股价还在80美元以上，2008年已经跌到了1美元以下，2010年甚至退市了。2009年，电路城也破产了。这11家伟大的公司中，有5家在股市上的表现变得更加出色，其余6家则大不如前。这本书出版后不久，这11家公司的总体表现与市场水平相比，确实逊色了不少。

回归效应的愚弄

无独有偶，汤姆·彼得斯和罗伯特·沃特曼的畅销书《追求卓越》也采取了非常相似的做法，带来了一模一样的问题。

彼得斯和沃特曼采用了6个指标用来衡量公司长期成功。其中的3个指标与增长率有关，另外3个用来衡量资本和资产回报。能够停留在榜单上的公司必须于1961年到1980年在其所属的行业中有4~6个指标排名前50%。然后，他们让行业专家为这些公司20年来的创新纪录评分。最后，榜单中剩余的43家里，有35家是公开交易的公司，还有8家私有化公司或者其他公司的分支。由此，最终发现了它们8个共同特征。

史密斯认为，这本书充其量也只是研究者自身努力的记录。本质上，它也是一个回顾性研究，其可信度被数据挖掘严重削弱了。没有任何方法能够确认，一个行动派的公司是否会比其他公司更加成功，或者那些有着辉煌过去的公司在未来能否再创佳绩。

后来，一家金融机构的高管米歇尔·克莱曼重新审视这些公司，并对比了这本书出版的前后5年里，它们在长期成功指标方面的表现。她发现，该书出版后，每个类别下超过2/3的公司都开始走下坡路。它们并不是因为受到了《追求卓越》的诅咒，而是因为它们之前的出色表现有相当大的运气成分。

克莱曼也提到，这些公司如今的糟糕表现可能是因为统计学上的均值回归效应，但是她对回归效应的理解却是错误的。她认为，随着时间的推移，潜在的经济力量会使得新的竞争者进入颇具吸引力的市场，鼓励参与者离开低回报率的领域。因此，公司的业绩表现会逐渐回归到平均值。但事实上，均值回归效应是源于市场的随机浮动，并非经济力量。

在随后的实验中，克莱曼研究了该书出版后12年的数据，证实了她最初的结论。在该书出版后的12年里，这些公司的表现都有一定的提升。她的结论是，就整体而言，好公司变差了，而差公司却变好了。她提到了均值回归效应，却进行错误的解读：“有一种自然现象叫做均值回归效应，即随着时间的推移，团体中每一个成员的财产都会越来越接近于整体的平均值。这一概念广泛适用于经济力量将事物推向均衡状态的情形。”

史密斯指出，这种解释不仅忽视了运气的作用，而且在某种程度上非常接近西克里斯特的理论，即所有公司都在走向平均的均衡状态。而实际上，回归效应并没有假设“经济力量将事物推向均衡状态”。经济力量可能存在，但均值回归效应是一种纯粹的统计学现象。当观察到的数据与未观察到的数据并不完全相符时，回归效应便会发生。例如，用盈利能力去衡量一家公司有多么伟大。

从长期来看，到2013年，彼得斯和沃特曼挑选的这35家公开交易顶尖公司里，有5家已经破产。整体而言，从这本书出版到2012年，书中的15家优秀企业的股票行情高于市场整体水平，另外20家则不尽如人意。

这些书本质上都是有缺陷的。此类问题在其他题材的书籍中也屡见不鲜，例如，“商业成功的秘密/秘诀/方法”“如何活到100岁”等等，它们本质上都是基于对商业成功、长寿者生活方式的回顾性研究。如果我们相信行动派更容易成功，那么不妨找出那些行动派和非行动派公司，看看未来10年谁的表现更好。事实上，我们总是回顾过去，而非展望未来，这让我们很可能受到均值回归效应的愚弄。

今天的投资者如何看待均值回归？著名的投资者詹姆斯·安德森指出，均值回归失效的根本原因在于，技术革命会使得代表旧经济秩序的企业破产、消亡。就连霍华德·马克斯也说，将均值回归的思维模式应用于“不褪色”的商业模式将导致错误的结论。

继续阅读

阅读原文