“在生活当中,我们经常会遇到与共识有关的问题。比如说下面一个故事。A、B两人有事需要面谈,他们要用短信的方式约定明天的见面时间和地点。不过,两人的时间都非常宝贵,只有确信对方能够出席时,自己才会到场。A给B发短信说,‘我们明天10:00在西直门地铁站见吧’。不过,短信发丢了是常有的事情。为了确信B得知了此消息,A补充了一句,‘收到请回复’。B收到了之后,立即回复:‘已收到,明天10:00不见不散’。不过,B也有他自己的担忧:A不是只在确认我要去了之后才会去吗?万一对方没有收到我的确认短信,届时没有到场让我白等一中午怎么办?因此B也附了一句:‘收到此确认信请回复’。A收到确认信之后,自然会回复‘收到确认信’。但A又产生了新的顾虑:如果B没收到我的回复,一定会担心我因为没收到他的回复而不去了,那他会不会也就因此不去了呢?为了确保B收到了回复,A也在短信末尾加上了‘收到请回复’。这个过程继续下去,显然是没完没了。其结果是,A、B两人一直在确认对方的信息,但却始终无法达成这么一个共识:‘我们都将在明天10:00到达西直门地铁站’。”
“有些聪明的人或许会说,那还不简单,A给B打个电话不就行了吗?在生活当中,这的确是上述困境的一个最佳解决办法。有意思的问题出来了:打电话和发短信有什么区别,使得两人一下就把问题给解决了?主要原因可能是,打电话是‘在线’的,而发短信是‘离线’的。在打电话时,每个人都能确定对方在听着,也能确定对方确定自己在听着,等等,因此两人说的任何一句话,都将会立即成为共识:不但我知道了,而且我知道你知道了,而且我知道你知道我知道了……”
“大法师当众宣布‘岛上至少有一个蓝眼睛’,就是让所有人都知道这一点,并且让所有人都知道所有人都知道这一点,并且像这样无限嵌套下去。这就叫做某条消息成为大家的共识。让我们来看一下,如果这个消息并没有成为共识,事情又会怎样。”
“为了简单起见,假定岛上只有两个蓝眼睛。这两个人都能看见对方是蓝眼睛,因而他们都知道‘岛上至少有一个蓝眼睛’。但是,由于法师没有出现,因此他俩都不知道,对方是否知道‘岛上有蓝眼睛’这件事。所以,到了第二天的时候,之前的推理就无法进行下去了,每个人心里都会想,对方没有自杀完全有可能是因为对方不知道‘岛上有蓝眼睛’这件事。”
“类似地,如果岛上有三个蓝眼睛,那么除非他们都知道,所有人都知道所有人都知道了‘岛上有蓝眼睛’这件事,否则第四天的推理是不成立的,到了第三天,会有人觉得,那两个人没自杀仅仅是因为他们不知道对方也知道‘岛上有蓝眼睛’这件事罢了。继续扩展到100个蓝眼睛的情形,你会发现,‘互相知道’必须得嵌套100层,才能让所有推理能顺利进行下去。”
“实际上,我的题目条件也是不完整的。岛上的所有人都非常清楚地知道上面这些条件和规则,应该改为:上面这些条件和规则是岛上所有人的共识,或者说:岛上所有人都知道上面这些条件和规则,并且所有人都知道所有人都知道,等等等等。如果没有这个条件,刚才的推理也是不成立。比方说,虽然所有人都是无限聪明的,但是如果大家不知道别人也是无限聪明的,或者大家不知道大家知道别人也是无限聪明的,推理也会因为‘昨晚他没自杀仅仅是因为他太笨了没推出来’之类的想法而被卡住。”
韩衍听完之后眼前一亮,似乎明白了。
刘猛教授继续说道:“其实人的大脑很难想象这道题目的假设,所有的人都具有推理的能力,如果是用计算机程序实现的话就清楚多了,相当于每个人的思维都在无限循环之中,而大法师说的那句话则是打破所有人无限循环的中断,将触发一系列的连锁反应。”
韩衍若有所思,刘猛心情很好,道:“我先不告诉你最后结果是什么不如先来讨论博弈论。”
“1950年,加拿大数学家Albert Tucker提出了著名的‘囚徒困境‘。设想某个犯罪团伙的两名成员被捕,他们被关在两个不同的房间里分别受审。警方向两人说了完全相同的话:首先坦言因证据不足,只能将两人各判有期徒刑一年;但是,只要其中一人招供而另一人保持沉默,则前者会无罪释放,后者会判有期徒刑三年;另外,如果两人都招供了,则两人各判有期徒刑两年。如果两人都保持沉默,他们加起来总共只关两年,这对他们来说是最好的结局。但实际上呢?每个人都会发现,不管对方做出的决定是什么,如实招供总能让自己少关一年。其结果就是,两个人都会不约而同地选择招供,于是两人各判两年,这对他们来说其实是最坏的结局。”
“囚徒困境要想成立,有个条件必不可缺:两人今后永远不会见面。这样,每个人才能放心大胆地背叛对方,不用担心自己会遭到报复。如果决策并不是一次性的,决策双方今后还会反复相遇,情况就不一样了。Robert Axelrod的《合作的进化》一书中提到,第一次世界大战的西线战场上曾经出现过一个非常有趣的现象:堑壕战当中的英德士兵“相识”一段时间之后,会逐渐产生一种非常微妙的合作机制。比方说,一方的食物补给车辆驶入战区后,另一方本来可以轻而易举地炸掉它,但却并没有这么做,因为他们知道这么做的后果——对方会采取报复行动,这会搞得双方都没吃没喝。久而久之,这种合作甚至会发展到,德军士兵在英军的射程范围内来回走动,英军士兵竟然无动于衷!”
“这是一个非常复杂的社会。每个人都想让自己的利益最大化,于是在不该有合作的地方出现了合作,在不该有背叛的地方出现了背叛。数学家们建立了各种模型,来描述人们在利益驱动下制定决策的方式,于是就有了这样一个数学分支——博弈论。”
“枯燥的说博弈论可能不好理解,下面我就给你讲几个例子,你自然就明白什么叫绝对理性和无限死循环。”刘猛教授笑着说道。
某家航空公司把两个行李箱搞丢了。这两个行李箱里装的东西完全相同,但却属于A、B两名不同的旅客。航空公司派出一名经理,与这两名旅客协商赔偿事宜。经理向这两名旅客解释说,航空公司方面无法为丢失的行李箱估价,因此需要让两名旅客各自独立地写下一个2到100之间的正整数(包括2和100),表示自己对行李箱的估价,单位是元。
如果这两名旅客写下的数完全相同,航空公司方面就认为这是行李箱的真实价值,并按照这个数目对两名旅客进行赔付。但是,如果其中一名旅客写下的数比另一名旅客更低,那么航空公司方面将会认为,前者的估价是真实的。航空公司将按照这个估价对两名旅客进行赔付,但报出此价的旅客会多得2元作为奖励,另一名旅客则会少得2元,作为估价过高的惩罚。举个例子:若A、B两人分别估价50元和40元,则A将会获得38元,B将会获得42元。
如果两名旅客都是绝对理性的,并且上述所有条件都已经成为这两名旅客的共识。那么,这两名旅客将会写下怎样的数呢?
如果你是第一次听说这个问题的话,你肯定不会相信这个问题的答案:最终结果是,两个人都只估价2元。为什么呢?
容易想到,对于这两个人来说,最好的结局便是两人都估价100元,这样一来,两个人都会得到100元钱。然而,其中一个人肯定会动一下歪脑筋:“如果对方估价100元,我估价99元,那么航空公司会认为我是诚实的,我就可以得到101元了,而对方只能得到97元。”另一个人其实也想到了这一点,因而两个人会不约而同地写下99元,其结果就是,两个人各得99元。
有趣的是,如果两个人都想到了对方也会写下99元,那么每个人都会发现,把自己的估价重新提高到100元是无益的,但是把自己的估价减小到98元,会让自己的收益从99元提高到100元。结果,两个人都会把估价改为98元。总之,两个人都意识到了这一点:不管对方报多少钱,我比对方少报1元总是最佳的选择。于是,这种恶性的心理战将会一直持续下去,直到每个人都推出,自己应该把估价从3元改为2元。到了这一步,两人终于不再有争斗,于是就得到了刚才所说的答案。
如果这个时候有个人站出来说一句:“你们两个这样恶性斗争下去每个人都会拿到最少的钱。”这句话看似是一句废话,实际并非如此,这会让两人达成一种共识,不再继续争斗下去。
再者说,让10个人玩一个这样的游戏:给每个人都发100元钱,然后每个人都可以选择捐出一部分钱;筹到的捐款将会用于投资,最后将会收回双倍的钱,并且均分给所有人,即使大家出的钱不一样多。最好的结局固然是,每个人都拿出100元,最终每个人都会得到200元。
但是,理性的决策者会这么想:“如果我只出99元钱,那么用于投资的基金就只有999元,最后大家将会获得1998元的回报,每个人都会分得199.8元;但是,别忘了我手里还有1元,因此最终加在一块儿,我不就有了200.8元了吗?事实上,如果我干脆一分钱也不出,我就能坐享180元的回报,我手里将会拥有280元!”如果每个人都是绝对理性的,那么每个人都会发现,自己比别人出的少,总能让自己更赚一些。最后的结果竟然是,每个人都不愿意拿出一分钱!
在生活当中,这样的现象也很多,比方说中小学生补课的问题。最好的情况应该是,每个学校都不补课,这既保证了公平性,又减轻了孩子的负担。然而,每个学校都会想,如果别的学校不补课,我们学校哪怕只补一个小时,我们就赚到了。当然,等到所有学校都意识到这一点后,每个学校都会争着再多补一个小时。其结果就是,每个学校都在没完没了地补课,于是就有了这样的悲惨现状。
在博弈论中,如果玩家们都做好决策并把所做的决策公之于众后,每个玩家都发现,单方面地修改自己的决策不会让自己更赚,我们就把此时众人的决策叫做一个“纳什均衡”。这是以美国数学家约翰?纳什的名字命名的,看过电影《美丽心灵》应该对这个名字非常熟悉,所以说,研究博弈论很容易把自己搞成神经病,很容易陷入思维的无限死循环中,而且越是聪明的人研究博弈论越容易被关进精神病院。
刘猛最后说道:“回到我们蓝眼睛的问题,也就是说:大法师说完那句话之后,第101天,所有蓝眼睛的人都会发现自己是蓝眼睛而集体自杀,第102天,剩下的900个棕色眼睛的人因为蓝眼睛的人死光了,也就知道了自己眼睛的颜色也会集体自杀,最终的结果就是这个岛彻底灭绝了。”
韩衍敲了敲脑袋,只觉得很肿胀,不好意思道:“刘猛教授,我的头好疼,需要回去休息一下了。”(未完待续)