家里有罐炒黑豆,二宝发现后吃不停嘴,然后就变成了人间大炮,专门发射臭弹,全家人仰马翻,苦不堪言。


晚上,朵拉来问我:什么叫贝叶斯推理?


我大喜。


朵拉,贝叶斯推理非常重要。它有个特点,一方面,我们每个人每天每刻都在贝叶斯推理,另一方面,用归用,我们几乎从来不细算。


为什么说每时每刻都在用呢?你今天出门带不带伞,要看今天下不下雨。但下不下雨是将来的事,你怎么知道呢?你就看看天色,阴沉你就带,晴朗你就不带。


天色是你刚刚获得的信息,根据新信息来调整行为,就是贝叶斯推理的本质。我们每个人都是部天然的人肉贝叶斯推理机。


生活中的许多事都像这样,要么带伞要么不带,是与非,1或0,所以,虽然我们都是贝叶斯推理机,但决策的颗粒度很粗。我们不细算。不细算其实是很有道理的,我们的祖先在东非大草原上的时候,听见附近的树丛里传来沙沙声响,必须马上决定是逃跑还是开打,不能细算沙沙声来自风还是猎豹。细算不合算。算对了收益有限,算错了没命。


所以,演化赋予我们以贝叶斯推理,但懒得给我们细算方法。


再后来,我们人类自己发明了细算的方法,发明人叫贝叶斯,所以用他的名字来命名这个方法。


“怎么细算呢?”


二宝今天猛放臭屁。我们就举这个例子。突然,我们闻到一股臭气,有人放臭屁,请问是谁放的?


“那肯定是二宝。”


你现在就在用不细算的贝叶斯推理。二宝是猛放臭屁,但这不等于臭屁一定都是他放的。具体有多少机率是他放的臭屁,我们得细算。


我先写几个式子:


P(宝):指二宝放屁的机率,P是probability的简写。


P(臭|宝):“臭|宝”指当二宝放屁时这个屁是臭的,P(臭|宝)是其机率。


P(宝)·P(臭|宝):指二宝放臭屁的机率。


好了,现在的问题是我们闻到了臭屁想知道有多大机率是二宝放的,它可以写成:


P(宝|臭)。


它等于多少呢?


首先,它取决于房间里有几个人,然后,取决于这些人放屁的机率,然后,取决于这些人如果放屁放的是臭屁的机率。


假如房间里只有二宝一个人,那么不用细算我们也知道是他放了臭屁。但如果细算的话,这个式子是这样的:


P(宝|臭) = P(宝)·P(臭|宝)/ P(宝)·P(臭|宝)


这个式子看着没什么意义,它当然等于1。


但如果房间里不只一个人,我也在。这个式子就不一样了。


P(宝|臭) = P(宝)·P(臭|宝)/ (P(宝)·P(臭|宝)+ (P(爸)·P(臭|爸)


分母新增的部分是我放臭屁的机率。整个分式的含义是二宝放臭屁的机率在所有人放臭屁的机率中所占的机率。


“那怎么计算呢?”


这时我们就需要知道P(宝)、P(爸)、P(臭|宝)、P(臭|爸)。如果我们对这些信息已经有所判断,就把判断反映到机率上。


比如说,我们大体知道二宝只要放屁就一定是臭的,那么P(臭|宝) = 1。我呢,一半一半,所以P(臭|爸) = 0.5。


P(宝)和P(爸)是多少比较难判断,但贝叶斯推理为这种情况做好了准备。它说,如果我们对一件事只知道它有多少种选择,但对各种选择的机率一无所知,那我们就平均分配,所以,P(宝)和P(爸)都设定在0.5,毕竟一个人只有放屁不放屁两种情况。


0.5不一定对,简直可以说一定是错的,但在我们不知道对的是什么的时候,贝叶斯推理要求我们必须有个起点。要是错得太离谱,我们以后再想办法调整。


把这些值代进去,我们就得到:


P(宝|臭) = P(宝)·P(臭|宝)/ (P(宝)·P(臭|宝)+ P(爸)·P(臭|爸)) = (0.5·1)/ (0.5·1 + 0.5·0.5) = 2/3


臭屁是二宝放的机率是2/3。


还比较符合预期,对吧?


如果房间里不止我们俩,你也在,那么情况又发生了变化。


“爸爸,我放屁不臭!”


朵拉,那就把你的P(臭|朵)设为0.1。这样的话,


P(宝|臭) = P(宝)·P(臭|宝)/ (P(宝)·P(臭|宝)+ P(爸)·P(臭|爸)+ P(朵)·P(臭|朵)) = (0.5·1)/ (0.5·1 + 0.5·0.5 + 0.5·0.1) = 5/8


人越多,二宝的嫌疑就越小,这符合直觉,但直觉不能告诉你二宝嫌疑下降了多少,贝叶斯推理就可以。


“真妙啊!”
继续阅读
阅读原文