顶着人类的直觉破浪前行,是一件困难的事。
--蒙洛迪诺
首先,你要搞晕的这个聪明人,必须是真聪明;
其次,你用来搞晕他的,必须是一个看起来不那么复杂的问题。
为了减少写作的道德压力,我直接选了一个已经搞晕了不少聪明人的题目。
事实上,在互联网时代,已经很难有什么有争议的严谨题目。
然而我要说的这道题,不仅在网上吵翻天,连在顶尖的学术专家之间,也会产生分歧。
让我们立即开始吧。
蒙洛迪诺曾经与霍金合著过《时间简史》,他的《醉汉的脚步》是一本非常棒的讲概率和随机性的书。
在讲到“样本空间”这个概念时,蒙洛迪诺出了一道题:
题目A:生男生女
一家两个小孩,已知生男生女概率相同,已知一个是女孩。
请问另外一个也是女孩的概率是多少?
这道题看起来似乎很简单:
已知一个是女孩,另外一个要么是男孩,要么是女孩,答案应该是1/2呀?
解答:根据样本空间的概念,也就是我在为什么真正聪明的人都是概率高手?(零公式入门篇)里说的“平行宇宙”,用穷举法,两个小孩有如下四种可能--
第一胎       第二胎

男                 男

男                 女

女                 男

女                 女
所以,已知有一个是女孩,所以排除第一种可能,剩下三种可能性,答案是1/3。示意图如下:
对于本题的让人迷惑之处,蒙洛迪诺解释道:如果我们指定了哪一个是女孩,例如老大是女孩,那么另外一个也是女孩的概率就变成了50%。
如上图:因为一旦指定了老大是女孩,上面的四种可能性中,要把“男-男”和“男-女”两个可能从样本空间中去掉,这样只剩下“女-男”和“女-女”,所以“女-女”的概率是50%。

然而,另外一个聪明人“不赞成”这个答案。
他就是加里·史密斯,耶鲁大学博士,曾在耶鲁大学任教7年,其间两度获得教学奖。
他在《简单统计学》一书中,指名道姓地批评了蒙洛迪诺的“谬误”。
加里·史密斯用另外一种方式陈述了题目:
题目B:另一个孩子
一个名叫史密斯的男人正在和他的女儿散步。
史密斯说,他们家还有一个孩子。
请问:这个不在身边的孩子是女孩儿的概率是多少?
起来这道题的表述似乎和蒙洛迪诺的题“类似”,然而加里·史密斯有完全不同的解答。
首先他毫不留情地批评“专家”们“三分之一”的答案错了。
加里·史密斯给出了一个表格:
B是指男孩,BB就是指老大男孩老二也是男孩。
G是指女孩,BG就是指老大男孩老二是女孩。
上图显示了在 BB、BG、GB 和 GG 之间均匀分配的 400 个家庭。
让我们不厌其烦地跟着作者分析一遍。

已知:
  • 在史密斯有两个男孩儿的 100 种情况中(BB),他总是和一个男孩儿散步。
  • 在史密斯有两个女孩儿的 100 种情况中(GG),他总是和一个女孩儿散步。
  • 在他拥有一儿一女的情况中(BG 或 GB),一个合理的假设是,他与男孩儿或女孩儿散步的概率相等。
分析:
  • 观察第一行,即史密斯和女孩儿散步的 200 种情况。在 100 种情况中(GG),不在场的孩子是女孩儿,在另外 100 种情况中(BG 或 GB),不在场的孩子是男孩儿。
  • 在第二行里(史密斯和男孩儿散步的 200 种情况),在 100 种情况中(BB),不在场的孩子是男孩儿,在另外 100 种情况中(BG 或 GB),不在场的孩子是女孩儿。
结论:
不管和史密斯散步的孩子是女孩儿还是男孩儿,他的另一个孩子是男孩儿或者女孩儿的概率都是相等的。
(以上图表和分析来自《简单统计学》,后面我会给个更简单更形象的计算。)
所以,答案应该是1/2,而不是1/3。

当然,这个问题也能够用常识直接回答掉:
看到一个是女儿,和另外一个还是是男是女没关系。
所以另外一个是女孩的概率是1/2.为什么要计算那么复杂呢?

原因在下面。
假如你没有感到一点点晕,那么你并不是真的懂。最多只是在较浅的层次懂了。
那么霍金的合著者,与耶鲁大学的博士,到底谁对谁错呢?
真相是:
1、两个人的答案都是对的。
2、但“耶鲁博士”对“霍金合著者”的批评是错的。
那问题出在哪儿呢?

原因是:
这两位牛人讨论的题目,压根儿不是同一个。
我们再来看一下。

霍金的合著者)题目A:
两个孩子,已知至少有一个是女孩,另外一个是女孩的概率是多大?
(耶鲁大学博士)题目B:
两个孩子,亲眼看见一个是女孩,另外一个是女孩的概率是多大?
难道这说的不是一回事儿吗?
亲眼看见一个是女孩”,不就证明了“至少有一个是女孩”吗?
你觉得呢?

搞晕聪明人的时刻到了。
你看,即使是耶鲁的博士,也混淆了二者之间的区别。
《简单统计学》是很好的书,而且也有较小概率是我说错了。

最简单的方法是采用贝叶斯公式来计算,但是我继续采用零公式的方式,来做一些可感知的推理。
至少有一个是女孩,与亲眼看见一个是女孩,并非一回事情。
这个是关键。
这二者直接的差别,可以从空间、时间两个维度的“整体与局部关系”来揭示。

1、先看空间维度的“整体与局部关系”。
至少有一个是女孩”,不能确保你亲眼看见的那个就是女孩。
尽管你可以由“亲眼看见一个是女孩”推理出“至少有一个是女孩”,但是,你不能由“至少有一个是女孩”推理出“亲眼看见一个是女孩”。
我用画图来形象描述一下:

如上图所示,亲眼看见一个是女孩”被包含于“至少有一个是女孩”。也可以说,亲眼看见一个是女孩”是比至少有一个是女孩”信息更多的概率描述。
2、再看时间维度的“整体与局部关系”。
至少有一个是女孩”,是上帝视角的统计结果;
亲眼看见一个是女孩”,是人肉视角的观察结果。
我用时间维度来说,未必精确,但大致是一个形象化的描述。

如上图所描述--
(蓝色字体)统计:上帝视角的统计结果,是对符合至少有一个是女孩”的所有样本空间的整体描述;
(红色字体)观察人肉视角的观察结果,是对其中一个平行宇宙的实际结果亲眼看见一个女孩的真实描述。
理解了本质差别之后,我们再来看看上面两道题。
(霍金的合著者)题目A:
两个孩子,已知至少有一个是女孩,另外一个是女孩的概率是多大?
这道题目,其实是关于“样本空间”的概率问题。
所以基于上图之“统计”那一列,可以得出结果是1/3
(耶鲁大学博士)题目B:
两个孩子,亲眼看见一个是女孩,另外一个是女孩的概率是多大?
这道题目,其实是关于从“结果”推理“原因”的计算。
没错,这就是一个贝叶斯计算。

我们不用公式,就可以清晰地推理计算。

看见一个女孩,只会发生在“男女、女男、女女”三个样本空间里。

所以,当“亲眼看见一个女孩”,问另外一个是女孩的概率是多大,其实是在问:

两个孩子,亲眼看见一个是女孩,那么她来自“女-女”家庭的概率是多大?
(我有点儿产生自己是个不错的中学老师的幻觉了,因为知乎上那么多聪明人就这个问题吵得不可开交,却没人像我这样转化问题。当然有可能我没看到哈,或者我干脆也说错了。
我把“男女、女男、女女”三个样本空间重新摆成下面这个样子,因为面积代表可能性的数值(平行宇宙的胖瘦,我在《如何用小概率赚大钱?》承诺过要讲,所以这里简单带一下),这样就可以“可视化+可计算”了。
上图三个长方形的面积应该一样,画得不好。
因为“亲眼看见一个是女孩”,这个观察结果,发生在上图黄色区域里。
根据面积比例可以发现,“女-女”占了观察结果是一个女孩的可能性的50%。

我们很容易得出结论:

根据“看见一个女孩”这个观察结果,她来自“女-女”家庭的可能性是50%。
所以,当你亲眼看见一个女孩,另外一个也是女孩的概率是50%
这里有点儿“诡异”的地方是,“亲眼看见一个女孩”这个“”,更新了我们对于这个女孩来自于什么家庭()的“信念”。
为什么古希腊人没能发展出概率理论呢?

蒙洛迪诺认为,
一个答案在于许多古希腊人相信,未来是按照神的意志而发展的。

苏格拉底曾经说,任何“在几何中使用概率和似然性进行论证”的数学家“都不配成为第一流”。

为什么中国古代没有发展出概率理论呢?

尽管中国古代哲学里有很了不起的“灰度理念”,但却缺乏用数学进行计算的思维。

一直到16世纪,一个叫卡尔达诺的人,才用自己疯狂的大脑和混乱的人生,叩开了概率的大门。

再到17世纪,帕斯卡和费马在一系列伟大的通信中讨论了赌博和概率。

贝叶斯的登场是悄无声息的。
1748年,苏格兰哲学家大卫·休谟写了一篇题为“论神迹”的文章,其中他指出,目击者的证词永远无法证明神迹的发生。
很难说贝叶斯的研究是为了反驳休谟,并证明上帝的存在。因为他并未在生前发表自己的“贝叶斯公式”。
休谟主张我们对于因果的概念只不过是我们期待一件事物伴随另一件事物而来的想法罢了。
“我们无从得知因果之间的关系,只能得知某些事物总是会连结在一起,而这些事物在过去的经验里又是从不曾分开过的。我们并不能看透连结这些事物背后的理性为何,我们只能观察到这些事物的本身,并且发现这些事物总是透过一种经常的连结而被我们在想像中归类。”
朱迪亚·珀尔在《为什么》里写道:
休谟的观点很自然地引发了一个问题,有人可能会称其为福尔摩斯式的问题:需要多少证据才能让我们相信,我们原本认为不可能发生的事情真的发生了?在何种情况下,某个假设才会越过绝不可能的界限抵达不大可能,甚至变为可能或确凿无疑呢?
贝叶斯公式“简单”得让人意外,但他确实提出了一种了不起的思路:

我们可以从一个“果”推断某个“因”的概率。
这就是贝叶斯时代的“逆概率”推理。
不同于通过“因”找到“果”,贝叶斯公式是通过“果”找到“因”。
通常意义上这是非常困难的事情。而贝叶斯致力于打破这种认知不对称,并提出了一种即使并非数学天才也能使用的估算逆概率的方法。
从贝叶斯法则到贝叶斯网络,人工智能找到了处理不确定性的秘方。
休谟和贝叶斯最后相逢于科学方法。
朱迪亚·珀尔对此总结道:
“从许多层面来说,贝叶斯法则都是对科学方法的提炼。教科书对科学方法的描述是这样的:
(1)提出一个假设;
(2)推断假设的可检验结果;
(3)进行实验并收集证据;
(4)更新对假设的信念。
通常,教科书涉及的只是简单的正确和错误两种结果的检测和更新,证据要么证实了假设,要么驳斥了假设。
但是生活和科学从来不会那么简单!所有的证据都包含一定程度的不确定性。
贝叶斯法则告诉我们的正是如何在现实世界中执行步骤(4)。
让我暂停对贝叶斯的追溯,再次回到那两道搞晕聪明人的题目。
我想表达的是,尽管人的大脑对概率的直觉很一般,但是,如果我们可以用可感知的方式,去分析概率计算的因果关系,会更加有助于理解这个世界的不确定性。
最后
主观猜测与客观结果,是如何通过概率联系在一起的?

为什么决定一个事情发生与否的概率,可以因为一些看不见摸不着的东西变大或者变小?

未来可能发生的事件,和过去可能发生的事情,会有什么本质上的不同?

个体的观察会如何决定”平行宇宙”的存在与消失?

以及,到底是谁在主宰我们的命运呢?
最后,关于概率的书,《醉汉的脚步》、《简单统计学》、《为什么》这三本算是不错的。
其中,《为什么》尤其有助于你再多搞晕几个人。

所以,谁是你最想搞晕的聪明家伙?
继续阅读
阅读原文