田忌赛马：谋略能否弥补实力的差距？博弈论与纳什均衡（五）

各位同学大家好！我是李永乐老师。之前我讲了几期博弈论，没看过的小伙伴可以点击：

之前我们一直在说：如果参与博弈的几方都是足够理性的，那么博弈的结果一定是纳什均衡点，既然如此，为什么我们还经常说：国际形势瞬息万变呢？不确定性究竟来源于哪里？

我们首先从一个物理学神兽——拉普拉斯妖说起吧。法国著名科学家拉普拉斯曾经说过这样一段话：

我们可以把宇宙现在的状态视为其过去的果以及未来的因。假若一位智者会知道在某一时刻所有促使自然运动的力和所有组构自然的物体的位置，假若他也能够对这些数据进行分析，则在宇宙里，从最大的物体到最小的粒子，它们的运动都包含在一条简单公式里。对于这位智者来说，没有任何事物会是含糊的，并且未来只会像过去般出现在他眼前。

拉普拉斯

他所说的智者被后人称为“拉普拉斯妖”，他知道宇宙中一切粒子现在的状态，按照物理学规则，他就能计算出未来世界的样子。看起来，如果生活中的每个人都能如拉普拉斯妖一般智慧，那么世界上就没有那么多不确定了，所有的选择都是理性的，最终世界也会向着纳什均衡的方向发展。

可是，随着科学的发展，人们逐渐认识到：即使是物理世界，未来也不是确定的。在量子力学出现后，人们发现粒子的位置和动量并不能同时精确确定，这就是不确定性原理，我们无法根据现在的情况准确预知未来的情景。我们只能对未来有概率性的判断，也就是计算出未来哪种情况出现的概率大，哪种情况出现的概率小。

博弈论也是一样。在前几期节目中，我讲了几个例子，比如策梅洛定理、囚徒困境、胆小鬼博弈、海盗分金币问题，其实都存在明确的纳什均衡点，如果博弈几方都是理性的，博弈的结局就是确定的，100%的，就像拉普拉斯的语言一般。

但是也有一些情况，看起来博弈的几方并没有一个统一的固定策略，它的结局也是概率性的，宛如量子力学。最典型的就是我们小时候常玩的“石头、剪刀、布”。

比如，两个小朋友张三和李四玩石头剪刀布，张三如果出石头，李四应该出布，这时如果张三能反悔，他应该出剪刀，这时如果李四能反悔，他应该出石头…如此这般，双方不可能找到一个固定的策略，是不是纳什均衡不存在了？

再比如，《史记·孙子吴起列传》里记载了田忌赛马的故事。齐国的大将田忌常同齐威王进行跑马比赛。他们在比赛前，双方各下赌注，每次比赛共设三局，胜两次以上的为赢家。然而，每次比赛，田忌总是输给齐威王。

孙膑说：“将军与大王的马我看了。其实，将军的三等马匹与大王的都差那么一点儿。只要让齐王先出马，然后您用您的上等马对齐王的中等马，用您的中等马对齐王的下等马，用您的下等马对齐王的上等马。这样您两负一胜，就能赢得比赛了。

果然，用孙膑的策略，田忌就赢了齐王。

可是，显然，这种计策只能用一次。如果下次田忌再和齐王赛马，齐王一定不会再告诉田忌自己的出马策略了。当然，田忌也不会告诉齐王，否则自己一点胜算没有。那么双方就又陷入了一个石头、剪刀、布的循环之中。是不是纳什均衡不存在了？

不不。

纳什定理告诉我们：只要博弈双方的策略都是有限的，那么一定存在纳什均衡。只是，我们之前几期节目中讲的，博弈几方都会不约而同的走向一个固定的策略集合，这叫做纯策略下的纳什均衡。

纳什定理告诉我们：即使在博弈时，像石头剪刀布和田忌赛马一样，不存在纯策略的纳什均衡，双方为了让自己的收益最大化，也一定会以固定的频率在几种策略之间切换，参与博弈的每一个人都会为每一种策略分配固定的频率，因为只有这样才能让自己的收益最大化，这样的策略集合叫做混合策略的纳什均衡。在量子力学中，我们求解了波函数，就能求解出各种情况出现的概率，也相当于一个混合策略纳什均衡了。

以石头剪刀布为例，如果你和朋友不停的玩石头剪刀布，如果你想赢的最多，你应该多出石头，还是多出剪刀，还是多出布？你都不应该，因为你多出石头，对方就会发现规律，从而多出布，你就会输的多赢得少；如果你多出剪刀，对方发现之后就会多出石头，你还是输的多赢得少。为了让对方没办法占你的便宜，你必须石头、剪刀、布各占1/3的频率，这样对方才能没办法占你的便宜。同样，对方也会这么想。

因此，石头剪刀布的混合策略纳什均衡就是：双方都以1/3的频率出石头、剪刀、布，每个人的平均收益都是0.

同样，如果齐王和田忌反复赛马，齐王也好，田忌也好，出马的顺序都是六种，一共有六六三十六种策略，我们可以把所有的策略和双方的收益写成一个表格，在这个表格中，胜1局得1分，输1局扣1分。

如果对方知道了自己采用哪一种策略，就能有针对性的选择自己的策略，从而获胜。比如齐王选上中下的顺序，田忌就选下上中，从而获胜。

齐王选中下上，田忌就选上中下从二获胜。

所以和胆小鬼博弈拼命显示自己的决心不同，在田忌赛马中，双方都会隐藏自己每一局的具体策略。可是，只要博弈次数足够多，每一种策略的频率就可以被统计出来，是无法隐藏的，如果你用某种策略次数更多，对方就可以有针对性的出马，获得更多利益。

所以，田忌赛马的选择是：双方都随机的按照这六种情况出马，每种策略的频率各1/6，这样才能让对方不能有针对性的获利。

你会发现，如果双方都随机出马，那么在每种情况下，齐王都有5/6的可能会获胜，只有1/6的可能会输掉。

反过来，无论田忌出什么顺序，最终都有5/6的可能会输掉，只有1/6的可能会获胜。

这种不对等性，就体现了双方的实力差距。如果田忌不想着怎么提高自己马的实力，那就必须想尽一切办法探听到齐王的出马顺序，否则大概率无法获胜。在战争中，谍报工作非常重要，尤其是对弱势一方，往往是克敌制胜的关键，例如官渡之战，赤壁之战都是如此。我们之所以总能会记住那几场以弱胜强、以少胜多的战役，正是因为它们不太容易出现。在绝对实力面前，谋略的作用其实是有限的。

下一回，我将继续讨论混合策略的纳什均衡，讲一个有趣的案例：美女和男人的游戏，关注我，听我漫谈相对论。

继续阅读

阅读原文

关键词

田忌

策略

纳什均衡

田忌赛马

胆小鬼博弈