如果你的身边有“专业”的彩民朋友,通过观察你会发现,他通常会将以往的中奖号码进行收集、归纳、总结,然后得出自己所预测的下一期中奖结果。他们这种行为,其实是一种信息收集与预测的途径,也是概率推算的规则,其原理与酒吧博弈堪称如出一辙。
在生存博弈中,人们是在互动的行为下进行策略选择,每个人的决策与对手的决策是相互依赖的。因此,倘若把对手看作是不会反应的弱智者,那就往往会在博弈中犯错误。
有个由100人组成的群体,每人在每个周末都要决定是去酒吧活动还是留在家里。设定每个参与者面临的信息只是以前去酒吧的人数,因此他们只能根据以前的历史数据归纳出此次行动的策略,没有其它的信息可以参考,他们之间更没有信息交流。酒吧的容量是有限的,比如说空间是有限的或者说座位是有限的,如果去的人多了。去酒吧的人会感到不舒服,这个时候还是留在家中比去酒吧舒服。
设定酒吧的容量是60人,如果某个参与者预测去酒吧的人数超过60人,他将决定不去酒吧,否则就去酒吧消遣。但是,如果许多人预测去的人超过60人,而决定不去,那么酒吧的人数会很少,这个时候做出的这些预测就错了;相反地,如果有很大一部分人预测去的人少于60人,因而他们去了酒吧,那么去的人就会很多,超过了60人,这个时候他们的预测也错了。因而一个做出正确预测的人应该是能够知道其他人如何做出预测的人,可是在这个问题中每个人预测时面临的信息来源都是一样的,即过去的历史,同时每个人无法知道别人怎样做出预测,因此所谓正确的预测近乎不存在。
这个案例就是一个典型的酒吧博弈。它由美国学者阿瑟(w.B.Arlhul)在1994年提出。阿瑟教授通过真实的人群以及计算机模拟两种实验得到了两个迥然不同的结果。
在对真实人群的实验中,实验对象的预测呈现有规律的波浪状形态,实验的数据片断如下:从上述数据看,虽然不同的博弈者采取了不同的策略,但是其中一个共同点是:这些预测都是用归纳法进行的。我们完全可以把这个实验的结果看作是现实中大多数“理性”人做出的选择。
在这个实验中,更多的博弈者是根据上一次其他人做出的选择而做出“其本人这一次”的预测。然而,这个预测已经被实验证明在多数情况下是不正确的。
从这种意义上来看,这种预测是一个非线性的过程,对于下次去酒吧的人数,人们无法做出肯定的预测,这是一种混沌现象。所谓这样一个非线性的过程说明,系统未来的情形对初始值高度敏感,这就是所谓的“蝴蝶效应”。美国科学家洛伦兹的“蝴蝶理论”告诉我们,一只亚马逊热带雨林中的蝴蝶翅膀,可以导致其身边的空气系统显示发生变化,并引起微弱气流的产生,而微弱气流的产生又会引起它四周空气或其他系统产生相应的变化,由此引起连锁反映,最终导致两周后可能在美国德克萨斯引起一场龙卷风。
通过计算机的模拟实验得出了另一个结果:最初去酒吧的人数没有一个固定的规律,但是经过一段时间以后,这个系统去与不去的人数之比接近于60:40,尽管每个人不会固定地属于去或者不去的人群,但这个系统的这个比例是不变的。如果把计算机模拟实验当作是更为全面的、客观的情形来看,这个实验的结果说明的是更为一般的规律。
实际上,混沌系统的行为是难以预测的。对于酒吧问题。由于人们根据以往的历史来预测以后去酒吧的人数,我们假定这个过程是这么进行的,过去的人数历史就很重要,然而过去的历史可以说是随机的,未来就不可能得到一个确定的值。
酒吧问题所反映的是这样一个社会现象,人们在很多行动中,要猜测别人的行动,但是却没有足够的关于他人的信息,因而只有通过分析过去的历史来预测未来。通常,人们根据过去的经验进行归纳而得出策略,这种做法固然可行,因为人们还没有其他更好的办法预见未来,在实际生活中人们确实往往凭借历史经验做事。
人们常说,计划没有变化快,也就是说未来不容易准确预测。实际上,归纳的方法在人们的认识中没有绝对合理性,运用归纳的方法对人们的行动的预测中更缺乏合理性。如果预测的办法有合理的基础,那么就要在预测中建立一个合理的学习机制,也就是说,错误的预测不要紧,但应考虑有没有办法改进这个预测以便下一次能做出更好的预测。
与少数人博弈
生活中有很多例子与这个模型的道理是相通的。“股票买卖”、“交通拥挤”以及“足球博彩”等等问题都是这个模型的延伸。对这一类问题一般称之为“少数人博弈”。“少数人博弈”是改变了形式的酒吧问题,是由一位定居瑞士的中国人张翼成在1997年提出的。
在股票市场上,每个股民都在猜测其他股民的行为而努力与大多数股民不同。如果多数股民处于卖股票的位置,而你处于买的位置,股票价格低,你就是赢家;而当你处于少数的卖股票的位置,多数人想买股票,那么你持有的股票价格将上涨,你将获利。
在实际生活中,股民采取什么样的策略是多种多样的,他们完全可以根据以往的经验归纳得出自己的策略。在这种情况下,股市博弈也可以用少数者博弈来解释。
“少数人博弈”中还有一个特殊的结论,即:记忆长度长的人未必一定具有优势。因为,如果确实有这样的方法的话,在股票市场上,人们利用计算机存储的大量的股票的历史数据就肯定能够赚到钱了。但是,这样一来,人们将争抢着去购买存储量大、速度快的计算机了,在实际中人们还没有发现这是一个炒股必赢的方法。
“少数人博弈”还可以应用于城市交通。现代城市越来越大,道路越来越多、越来越宽,但交通却越来越拥挤。在这种情况下,司机选择行车路线就变成了一个复杂的少数人博弈问题。
虽说城市道路往往是复杂的网络。但我们可以简化问题,假设在交通高峰期间,司机只面临两条路的选择。这个时候,往往要选择没有太多车的路线行走,此时他宁愿多开一段路程,而不愿意在塞车的地段焦急地等待。司机只能根据以往的经验,来判断哪条路更好走。当然,所有司机都不愿意在塞车的道路上行走。因此每一个司机的选择,必须考虑其他司机的选择。
在司机行车的“少数者博弈”问题中,司机经过多次的选择和学习,许多司机往往能找到规则性,这是以往成功和失败的经验教训给他的指引,但这不是必然有效的规则性。
在这个过程中,司机的经验和司机个人的性格起作用。有的司机因有更多的经验而更能躲开塞车的路段;有的司机经验不足,往往不能有效避开高峰路段;有的司机喜欢冒险,宁愿选择短距离的路线;而有的司机因为保守而宁愿选择有较少堵车的较远的路线,等等。最终,不同特点、不同经验司机的路线选择,决定了路线的拥挤程度。
学会利用“混合策略”
人生充满了不确定性,正是因为无法事先确定胜负,才使许许多多的比赛和博弈充满了魅力。在两种不确定走向存在时,我们如何才能尽力采取两头兼顾的办法呢?这就需要我们采取一种“混合策略”,它虽然不能保证你永远在博弈中获胜,却给你指明了一条最佳的应对思路。
所谓“混合策略”,是与“纯策略”相对而言的。在博弈论中,“纯策略”是指参与者对某个策略有一个“明确的”选择——或者用或者不用,别无它途。而“混合策略”,则是指策略人随机地选取自己的策略。在现实生活中,采取混合策略的例子很多。
小朋友之间进行的“石头——剪刀——布”的游戏,便是一个人人皆知的使用混合策略的例子。小朋友玩游戏时,每次都是在“石头”、“剪刀”、“布”三者之间权衡,而不固定采取一个策略,这便是一个混合策略。对于这个游戏而言,参与者要想获得最好的结果,他最应该采用的混合策略(称为“均衡策略”)是。选择“石头”、“剪刀”、“布”策略白9概率相同,均为1/3。不然的话,如果一方选择某个策略的概率高于其他策略,并且这个规律被对方总结出来的话,对手就会采取相应的应对策略,其获胜的次数便会大大增加了。
通过猜拳这个简单的博弈我们可以知道,参与博弈的人试图通过选择混合策略给对手造成不确定性,使对手不能预测自己的行动,从而使自己获得好处。如果参与博弈的人太有规律地行动,那么他必定就会被对手战胜。或者他一旦破坏了自己的随机策略,那么他就会失败。
很早的时候曾经看过吴孟达和童星郝绍文主演的一部影片,故事记不得了,但有个情节印象挺深刻:吴孟达和郝绍文要通过猜“剪刀,石头,布”来决定最后10块钱的归属。吴孟达的做法是:给郝绍文一枚硬币让他纂在手里然后划拳。郝绍文是小孩子,理所当然地按照吴孟达的预期出了“石头”(因为郝只有出石头才能确保手中的硬币不至丢落),吴孟达自然是出了“布”赢得了10块钱。吴为了防止郝的混合策略,采取了一种作弊的手段,虽然手段不够光彩,但是结果却让自己很满意。不让对手洞悉自己,而采取混合策略的做法,在某些对抗中非常普遍。玩牌,划拳以及足球,篮球等比赛中都是如此。
我们大家都知道“田忌赛马”的故事:战国时期,齐威王与大将田忌赛马,每次都派出一匹不同等级的马。在三场比赛中,由于齐威王的马都比田忌的马要好,所以全部获胜。田忌的谋士、杰出的军事家孙膑发现,田忌的上马虽然不如齐王的上马,但比齐王的中马更强,而田忌的中马也比齐王的下马强。而且,齐王的马每次都是按照上、中、下来安排出场顺序的。于是在下一次比赛的时候。孙膑让田忌把马的出场顺序改为:下、上、中,但齐王的马的出场顺序仍旧是:上、中、下。结果,田忌以2比1在比赛中获胜。
在这里,齐王的失败在于他运用了纯策略:他每一次出场的马都是确定的,而且这一点也为田忌和孙膑所知。如果齐王不这么做,而是采取混合策略,即在每一次比赛中。随机选择出场的马,孙膑的策略将难以施展,齐王也就不一定输。事实上,由于齐王的马总体上比田忌的马跑得快,齐王赢田忌的可能性还是要大得多。只要计算一下就可以知道,假如齐王运用的是混合策略,这时田忌也只能用混合策略进行回应。这样每个人的马出场顺序均有6种可能,共有36种可能组合。如果齐王隐瞒自己的策略,不让田忌知道马的出场顺序,田忌赢的可能性只有1/6,而齐王赢的可能性为56。
在战争中,军事家实施混合策略。是让敌人“知道”自己可能采取任何一个备选策略,但却不让对方猜到自己究竟要采取哪一个策略,即只让敌人“知道”自己所选策略的一个概率分布。战争中的一方对另一方进行轰炸时,一般不会向对方透露轰炸的具体日期,因为将被轰炸的一方如果知道对方的轰炸日期,就会采取对付空袭的措施。而一旦后者做好了准备,轰炸方的目的就难以完成。在“轰炸——被轰炸”的博弈中。轰炸一方的时间是随机的,防炸方也是时刻准备着,这就是混合策略。
国际政治生活中也不乏混合策略的例子。
比方说,美国正在和恐怖分子进行一场。反恐战争。他们之间玩的也是混合策略。恐怖分子要对美国进行袭击,而美国要防止恐怖分子的袭击。恐怖分子胜利果实的大小。等于被袭击方美国的损失。恐怖分子不能预先告诉美国,他们将何时何地以何种方式袭击何处目标。如果美国政府事先已经得知恐怖分子的计划,肯定会采取措施进行防范,恐怖分子的袭击将难以得手。
因此,恐怖分子采取的是混合策略:任何时间、任何地点均可对美国进行袭击。而对于美国政府来说,他们的任何一个目标,无论是民用的还是军用的,均有可能成为恐怖分子的袭击目标,因而不能放松对任何—处目标的保卫。
小偷与守卫
https://www.cwzww.com https://www.du8.org https://www.shuhuangxs.com www.baquge.cc