很多阴谋论是这样开始的:只要数据库够大,渴望寻找规律的眼睛总能发现看起来可疑的东西。但其实,人类特别不擅长识别什么是真正的随机。不过如果你懂数学,就可以认识到,一些违背直觉的结果其实完全可以预见,一点也不诡异。
撰文Eddie Woo
翻译阳曦一
20世纪70年代初,水门丑闻淹没了美国政治,彻底改变了人们看待总统的眼光。时任美国总统理查德·尼克松被发现严重违法,而且他还安排了一场大戏掩盖整个违法事件。这一事件为什么会对大众心理产生如此深远的影响?部分原因在于公众看到的事件发展过程一波三折。
水门事件的新闻刚爆出来的时候,大部分人觉得这只是一件无足轻重的小事,很快就会消失在新闻的视野之外,就像普通一天里的其他琐事一样。随着调查的深入,人们意识到这件事不会很快结束,主流观点认为水门事件正在成为一场捕风捉影的猎巫。堂堂的国家元首竟然是个肆意参与叛国行动的犯罪分子,而且滥用特权践踏正义,几乎没人能容忍这种事情。有一段时间,那些相信尼克松总统有罪的少数派被视为怪人和阴谋论者,他们捏造的荒谬故事毫无可行性,更不可能是真的。
直到剧情彻底逆转,每个人最深的恐惧突然成真。经过一系列堪比好莱坞大片的波折和反转,令人震惊的真相终于浮出水面——那些阴谋论者才一直是对的。
水门事件是阴谋论时代的转折点。在那之前,相信暗语、秘密社团和政府掩盖真相的人往往被视为疯子。但水门事件迫使大众承认,哪怕那些看起来最荒诞不经的说法有时候也可能是真的。
阴谋论为什么在全世界的每个角落长盛不衰,隔一阵子就冒头?对于这个问题,数学有自己的答案。令人惊讶的是,它让我们看到,阴谋论者的磨坊永远不会缺少原料。我们在数据自然形成的海洋里游弋,这片海洋和我们的世界所具备的天性决定了阴谋论者永远可以指着某些东西说,这正是我们眼皮子底下那些可疑行为和秘密存在的“证据”。
为了理解这一切是如何发生的,我们不妨先思考一个孩子们玩的非常简单的解谜游戏,你肯定听说过,它叫:找单词
我曾花费大量时间玩这个游戏。在成长的过程中,我甚至有一本专门的找单词解谜书(现在我意识到,它是我妈对我烦不胜烦的时候给自己找清静的重磅武器之一)
找单词的谜题看起来是这样的:
这个谜题里藏着彩虹的全部七种颜色:红(red)、橙(orange)、黄(yellow)、蓝(blue)、绿(green)、青(indigo)和紫(violet)。有的单词需要横着找,有的要竖着读,甚至有单词藏在斜线上。小心——还有的单词是反着写的(从右到左,而不是从左到右)。作为额外的奖赏,这张表里还藏着另一种我没说的颜色——试试看,你能不能找到它!
自己创造一个找单词谜题并不难。我出题的时候只是画了张空白的表格,然后把我想要添加的单词一个个添加进去。完成这一步以后,我只需要用一系列随机的字母填满空格就行。砰——变!找单词谜题出现了。
但是,如果我跳过第一步——在谜题中加入我的单词——那会怎样?如果我出一个完全由随机字母构成的谜题,那会发生什么?下面这张3×3的表格就是个例子:
不出所料,它看起来完全不知所云。事实也的确如此——不管你怎么看,都无法在这张表格里找到任何英语单词。可是现在,如果我分别增加一行和一列,看看会发生什么:
如果你从第一行的B开始,顺着斜线滑向右下方——显然,你会看到“坏”(bad)这个单词一下子蹦了出来!不仅如此——从第二行的第二个字母开始,从左向右读,你还会找到第二个词:爸爸(dad)。这堆随机字母是不是想说,我不是个好爸爸?!
如果我再增加一行和一列,让它变成一张5×5的表格,你甚至会看到更多单词自然地出现。除了“坏”和“爸爸”以外,我还看到了“里面”(in)、“做”(do)、“不”(no)、“泽德”(zed)、“是”(be)、“命令”(bade)和“麻烦”(ado)。单词的数量直线上升!
这到底是怎么回事?我没有刻意在这张表格里写下任何单词——下面的两张表格是以同样的方式随机创建的,每张表格里同样充满了单词:
在左边这张表里,我能找到:小马(pony)、公牛(ox)、木材(log)、不是(not)、色彩(hue)、哇(yay)和水疗(spa)
右边的表里有:小精灵(elf)、公牛(ox,它出现了三次!)、前度(ex)、凸轮(cam)、做(do)、红(red)、有趣(fun)、空隙(gap)、哦(oh)、瞧(lo)和不(no)
你可以创造自己的“随机”找单词表格,只需要把下面这个网址输入你的搜索引擎:www.bit.ly/findaword。
如果你进入这个网址玩一玩,你也会发现,要创建一张完全不包含任何英语单词的表格真的非常难。所以,这是怎么回事?
你观察到的这种现象叫“无序的不可能性”(impossibility of disorder)
混沌之海里必然存在有序的岛屿——只要这片海足够大。
我们刚才亲自证明了这个论断:3×3的表格里一个单词都没有,但随着表格变大,避免单词出现变得十分困难。
研究这种情况的数学分支叫作拉姆齐理论(Ramsey theory),这个名字来自英国数学家兼经济学家弗兰克·P.拉姆齐。读者里可能很少有人接触过这方面的数学,因为它所属的领域叫作图论(graph theory),澳大利亚所有的数学必修课都没有涉及图论。
如果说学校里教的数学像一趟悉尼之旅,那么代数就是歌剧院——每个人最终都会去看它。从另一方面来说,图论就像你家附近的便利店——它不是游客爱去的地方,只有一小撮人对它有所了解。和便利店一样的是,这些人之所以了解它,是因为它能帮助他们解决日常问题。
拉姆齐理论最清晰的范例是一个名叫“派对问题”(Party Problem)的场景。办过派对的人都知道,确定宾客名单是一件难事。当然,你邀请的所有人都是你的朋友,但他们彼此之间是否存在友谊呢?图论是研究关系的数学,它能帮助我们理解事物通过特殊关系彼此联结的任何情况。比如说,铁路线串起郊区,电线连接房屋——友谊凝聚人群。
举个例子,假如你希望派对上有至少三个人要么互为朋友,要么互不相识。在这两种情况下,你都可以保证他们聊得起来。如果这三个人互相认识,那他们会像着了火的房子一样一拍即合。如果三个人全都是初次见面,那他们可以在你的派对上认识彼此。大家肯定能玩得开心!
图论帮助我们理解、解决这个问题的第一条路是,它为我们提供了用数学形式来描述这种局面的途径。生活中的某些问题之所以难以回答,是因为你甚至很难厘清局面。但是,如果我们能用简单的示意图提炼出关键的细节,问题就解决了一半。
下面的两个圈代表派对上的两个人。如果二者之间是实线,那代表他们互相认识,虚线代表互不相识。
利用这件工具,我们可以用示意图画出任意人际关系的“派对”,无论他们是否相识。如果除了A以外,我们还请了5个人来参加派对,那么这位特定的客人(在这个例子里是A)和其他客人的关系有12种基本组合。在这12种情况下,你都能看到有三个人的小团体被标亮了——他们要么互为朋友,要么互不相识。
因为我们总能找到三个互相认识或者互不相识的人,这意味着只要你邀请至少6个人,就一定能找到这样的小团体。如果你想知道左页的示意图是怎么画出来的,我们又如何证明6是确保这一情况出现的最小数字,请直接跳到“6个人够多了”那章。
这和我们的找单词谜题或者阴谋论者又有什么关系?呃,拉姆齐理论告诉我们,随着组合结构(combinatorial structure)——它可能是一群朋友,也可能是一张找单词的表格,甚至是报纸上的一篇文章——的膨胀,必然会出现特定的结构和“规律”。所以当我们的表格膨胀到一定的尺寸,英语单词就会凭空冒出来。
进一步说,很多阴谋论也正是这样开始的。只要数据库够大,渴望寻找规律的眼睛总能发现看起来可疑的东西。
数字命理学家是一群总在数字中寻找规律的人,他们擅长将重要的意义赋予特定的数字。2017年,数字命理学家度过了一个狂欢日,在那一天,音乐家杰斯(Jay-Z)发布了一张名为《4:44》的专辑,主打歌也与之同名,这位歌手兼创作人似乎在这个时间醒来然后写了这首歌。
一位数字命理学家认为,这首歌的名字与杰斯的私人生活关系密切:“(他老婆的)生日是4日,他妈妈的生日是4日,他自己的生日也是4日,而且他是在4日结婚的。”这当然是个惊人的规律,但拉姆齐理论明明白白地告诉我们,在这个拥有70亿人口的世界上,这么巧合的事情必然会在某个地方发生。(归根结底,一年里有12个4日——这意味着现在活着的人里至少有2.3亿人出生在4日,这些人里还会有相当一部分互相结了婚!)
拉姆齐理论宣称,结构必然会自发地从混沌(只要它的规模够大!)中浮现,有时候它会以最出乎意料的方式出现在我们的日常生活中。比如说,苹果发布iPod的时候就遇到了超乎预期的自发式结构。虽然在那之前,便携式音乐播放器已经存在了很多年,但iPod问世以后,无论走到哪里都能调用自己全部音乐库的人出现了大幅增长。CD播放器一次只能装一张专辑,iPod突破了这个限制,人们可以轻轻松松地把成百上千首歌放进口袋。
iPod shuffle同样拥有这个新特性,除此以外,它的特点是随机播放。这个型号的iPod设计理念是从内置曲库中随机挑选歌曲播放,实际上它也是这样做的——但世界各地的用户开始报告它的奇怪行为。“我的iPod会捣乱——我的曲库里有几十位音乐人的作品,但它会时不时一口气连播4、5首同一个乐队的歌!”他们觉得自己的播放器出了问题,不再像广告上宣称的那样“随机播放”。有人甚至提出了一套理论:他们认为自己的设备似乎有自己的性格,它特别偏爱某些音乐人。“我怎么从来没听到过曲库里麦当娜的歌……我的iPod似乎痴迷于喷火战机乐队!”
在拉姆齐理论的指导下,我们认识到,这样的结果其实完全可以预见。如果你听了几百个小时随机播放的歌曲,那你早晚会连续听到好几首同一位音乐人的歌。你听的时间越长,这种事发生的概率就越大——就像找单词的表格越大,就越可能自发产生有意义的单词。
讽刺的是,我们之所以总能在随机中发现规律,很大程度上是因为:实际上人类特别不擅长识别什么是真正的随机。比如说,看看下面这张表格中抛硬币的结果(正面或反面)
再跟下面这张表比对一下:
剧透警告:这两张表格中有一张其实不是抛硬币的结果——而是由一个人假装抛硬币编造出来的。你能分清它们的真假吗?
数学会告诉我们答案:因为从可能性与概率的角度来说,抛硬币这件事特别容易理解,所以我们可以相当准确地预测不同的结果序列(比如说正面后面紧接着反面,或者连续出现三个反面)出现的概率。真相是,第一张表记录的是真正抛了硬币的结果,第二张表是假的。第二张表里很少连续多次出现相同的结果,这暴露了它是人类编造的。人类认为连续四次出现正面或反面是不正常的——但要是你抛硬币的次数够多(如第一张表所示),这样的情况必然会出现。
英国命理师兼魔术师达伦·布朗在一次表演中充分利用了这种现象,当着现场摄像机的镜头,他一口气抛出了10个正面。在这个电脑合成特效的年代,大部分人觉得他肯定对影片做了什么手脚。但布朗的确没耍花招,无论是拍摄的角度还是剪辑——他真的连续扔出了10个正面。不过,为了拍到这段影像,他们花了九个多小时来拍摄,终于等到了10连正的画面!这听起来可能有点极端,但这么长的拍摄时间几乎保证了10连正的出现。如果连续扔2025次硬币,你甚至会发现里面连续出现正面最多的次数不是10次,而是15次!
这种数学现象还有更严肃的应用。说到概率,人类直觉地认为,任何事连续发生的概率都不大。如果是在赌场里,这样的直觉一旦出错就可能引发灾难性的后果。赌博成瘾者常常报告称,他们无法自控地坚信,连续输了这么多次以后,自己总归会赢一次。这种赌徒谬误(gambler's fallacy)既不正确又很可悲——相信这种谬误的人往往会输得身无分文,因为他们的直觉错得离谱。
拉姆齐理论的这个方面与人类生理学的交叉产生的后果更加微妙。比如说著名的安慰剂效应:哪怕你吃下的药、做的治疗从生物学的角度来说对病情并无帮助,它依然有可能改善你的健康状况。这方面的记录多不胜数,所以人们在对新药做临床试验的时候,才会要求在实验组和对照组之外设置一个安慰剂组。对照组不用药,实验组使用待测试的新药,安慰剂组用的是不含活性成分的糖丸——只是他们以为自己吃的是真正的药物。
安慰剂组总会——无一例外——有人报告称,新药让他们感觉好转了,哪怕他们实际上没吃药。对他们中的某些人来说,病情好转部分是因为他们相信自己真的吃了药。人类的身体怎么会因为子虚乌有的药而出现真实的改善呢?
这是规律在发挥作用。现代人从小就在耳濡目染之下将药物和健康联系在了一起,用心理学术语来说,这叫经典条件反射(classical conditioning)。条件反射会引发真实的生物学反应,这方面最让人记忆犹新的案例来自俄国生理学家伊万·巴甫洛夫。在那个著名的实验中,巴甫洛夫只在摇铃后才给狗食物。建立了这一规律以后,只需要摇铃——哪怕没有食物——参加实验的狗也会因为期待开饭而分泌唾液。从统计学的角度来看,我们可以说,巴甫洛夫向狗群输入了数据,暗示食物和铃声之间有某种联系。
现在我们把这个理念和拉姆齐理论结合起来看。假如你开始售卖没有医学疗效的糖丸,只是给它们贴上了感冒药的标签。人们生病的时候会来买它,因为他们觉得这种有趣的新产品值得一试。根据拉姆齐理论,我们可以预测,如果购买、服用糖丸的人足够多,那么肯定会有随机的一群人在吃药的过程中症状减轻,或者比平时好得快。于是这些消费者可能会不经意地将自己的好转与服药联系在一起,哪怕他们吃的是没有疗效的安慰剂糖丸!
只要掌握了正确的观察方法,你就会发现,秩序的岛屿在混沌之海中无处不在。天空就是一个完美的舞台,它很好地展现了只要数据够多,就必然出现各种不寻常的规律。白天,你会看到,天空中的白云和鱼儿那么相像。
夜空更有力地证明了这一点:千万年来,星空给人们提供了太多机会,人们想象出来的各个星座,有着五花八门的有趣形状和故事。
作者简介
埃迪·吴(Eddie Woo)
出身于华人家庭,澳大利亚著名数学教师。悉尼最大的公立高中的首席数学老师,三个孩子的父亲。

2012年,吴因一位学生患癌失学,于是将课堂内容制作成生动有趣的视频,并上传YouTube供这位学生在家观看。出乎意料的是,这些视频很快受到了学生们的极大追捧,吴也因此被全世界的学生和数学爱好者所熟知和喜爱。至今,吴的YouTube粉丝已达140万,视频总播放量超过1亿次。

2018年,吴获评“全球教师奖”全球十佳教师。同年,他因突出的教育贡献获澳大利亚新州“年度当地英雄奖” ,并出席澳大利亚国庆日庆典致辞,成为澳洲史上第一位在国庆日庆典上演讲的华裔嘉宾。
本文经出版社授权,选自《吴老师的趣味数学课》(天津科学技术出版社,2022年5月)
继续阅读
阅读原文