千米小说网

千米小说网>概率思维选择比努力更重要 > 第三章 洞察充满不确定性的未知世界的决策方法 最大最小准则(第3页)

第三章 洞察充满不确定性的未知世界的决策方法 最大最小准则(第3页)

夏洛克·福尔摩斯与詹姆斯·莫里亚蒂

在柯南·道尔的著名侦探小说《夏洛克·福尔摩斯探案集》中,有一篇叫作《最后一案》(收录在《夏洛克·福尔摩斯回忆录》中),描写了福尔摩斯被宿敌詹姆斯·莫里亚蒂围追堵截的场景。当时,福尔摩斯几乎被莫里亚蒂所杀。他从维多利亚车站乘坐开往多佛的火车,准备逃往欧洲大陆。在火车即将驶离车站的瞬间,莫里亚蒂出现了,两个人四目相对。福尔摩斯预判了莫里亚蒂准备启用特快专列提前抵达多佛设伏的计划,于是在火车经停的坎特伯雷提前下车。这样一来,福尔摩斯就完美地躲过了莫里亚蒂乘坐的特快专列的奔袭追赶。

福尔摩斯经常利用自己的创造性思维解决问题。但是,这次在坎特伯雷提前下车的做法真的就是最佳选择吗?这是一个值得深思的问题。因为如果莫里亚蒂也看穿了“福尔摩斯想在中途下车”的想法,那福尔摩斯就只能束手就擒了。冯·诺依曼和奥斯卡·摩根斯特恩在《博弈论与经济行为》一书中也提到了这一问题。他们认为从博弈论的角度来看,福尔摩斯的判断(柯南·道尔在小说中描写的情节)是不合适的。他应该选择的策略是“乘车一直坐到多佛”和“在坎特伯雷提前下车”的概率组合。下面,我们来看一下他们的分析,如表3-3所示。

表3-3 下车地点组合的莫里亚蒂的收益值表

他们将福尔摩斯、莫里亚蒂双方较量的战场设定在特定的博弈框架内。

表3-3是从莫里亚蒂的视角出发总结出的损益得失表。无论是莫里亚蒂还是福尔摩斯,都有两种行动方案可以选择,分别是“在多佛下车”和“在坎特伯雷下车”。如果双方在同一车站下车,莫里亚蒂就能实现自己的阴谋,成功拦截并杀害福尔摩斯。因此,在这种情况下,莫里亚蒂的收益值是100,而福尔摩斯则相反,收益值为-100。与之相对,如果莫里亚蒂在坎特伯雷下车,而福尔摩斯在多佛下车,那么福尔摩斯就可以从多佛前往欧洲大陆,从而顺利逃亡。因此,在这种情况下,莫里亚蒂的收益值是-50,而福尔摩斯的收益值是50。此外,如果福尔摩斯在坎特伯雷下车,而莫里亚蒂在多佛下车,那么莫里亚蒂虽然无法抓住福尔摩斯,但是可以阻止他逃往欧洲大陆。因此,从这个角度来看,双方打了个平手,各自的收益值均为0。

如表3-3所示,关于莫里亚蒂的保底值,在多佛下车时为0,在坎特伯雷下车时为-50,因此其最大保底值为0。另一方面,关于福尔摩斯的保底值,在多佛和坎特伯雷下车时均为100,因此最小值为100。由此可见,两者之间的保底值是不一致的,无论采取哪种行动组合,都无法实现博弈均衡。但是,即使面对这种局面,只要能够合理采用概率组合的方式,依然可以实现均衡。关于这一点,或多或少会引起争议,下面,我将试着进行论证。

福尔摩斯究竟应该怎么办?

我们先从结论开始说起。按照最大最小准则,莫里亚蒂应该采用的策略是“按照0。6的概率在多佛下车,按照0。4的概率在坎特伯雷下车”;按照最大最小准则,福尔摩斯应该采用的策略是“按照0。4的概率在多佛下车,按照0。6的概率在坎特伯雷下车”。也就是说,在这一策略下,福尔摩斯应该准备10张纸,在其中的4张纸中写上多佛,在剩余的6张纸中写上坎特伯雷,然后,将这10张纸混合在一起,从中随机抽取1张,作为自己最终的决定,可以说,这是一种均衡的策略。

下面,我们将对这一结论进行分析论证。

为了更加具体直观地进行说明,我们假设莫里亚蒂在多佛下车的概率为0。1,在坎特伯雷下车的概率为0。9。然后,在这一条件下,尝试计算保底值,如表3-4所示。对此,我们只要从福尔摩斯的策略中,选择对于莫里亚蒂而言最差的一组即可。

假设福尔摩斯在多佛下车的概率为p(与之相应,在坎特伯雷下车的概率自然就是1-p),那么,针对四种结果,出现的概率具体如表3-4所示。

表3-4 莫里亚蒂的收益值表

这样一来,莫里亚蒂的收益的期望值(基于概率计算的平均值)就等于概率乘以收益值相加之和:

0。1×p×100+0。1×(1-p)×0+0。9×p×(-50)+0。9×(1-p)×100=90-125p

由此可见,福尔摩斯在多佛下车的概率越大,莫里亚蒂的收益的期望值就越小。也就是说,对于莫里亚蒂而言,福尔摩斯在多佛下车的概率为1时,其承受的损失是最大的,此时的保底值最小,为-35(90-125)。

下面,我们再计算一下莫里亚蒂在多佛下车的概率为0。9,在坎特伯雷下车的概率为0。1(与刚才的情况正好相反)时的期望值:

0。9×p×100+0。9×(1-p)×0+0。1×p×(-50)+0。1×(1-p)×100=10+75p

在这种情况下,福尔摩斯在多佛下车的概率越小,则莫里亚蒂的收益的期望值就越小,因此,当p=0时,保底值最小,为10。

有鉴于此,莫里亚蒂的保底值变化情况,具体如图3-1所示。

图3-1 莫里亚蒂的保底值变化情况

只要观察一下,就会发现莫里亚蒂的保底值是随着在多佛下车的概率而变化的,当概率从0增加至0。6时,保底值也随之增大,当概率大于0。6后,保底值开始持续下降。因此,莫里亚蒂的最大保底值就是在多佛下车的概率为0。6时计算得到的数值。也就是说,莫里亚蒂按照最大最小准则应该采取的策略是“按照0。6的概率在多佛下车,按照0。4的概率在坎特伯雷下车”。

关于福尔摩斯按照最大最小准则应该采取的策略,也可以按照相同的思路来考虑,如图3-2所示。

图3-2 福尔摩斯的保底值变化情况

到此为止,我们对最大最小准则的阐述就告一段落了。正如广大读者读过上文之后所感受到的那样,最大最小准则在不知不觉间影响着人们的日常生活,发挥着重要的作用。此外,关于使用最大最小准则的有效性和合理性,也有着充分的依据支撑。尤其是在深入研究冯·诺依曼和奥斯卡·摩根斯特恩对零和博弈理论分析的基础上,无论是从行为选择的合理性来看,还是从数学必然性的视角来看,这一准则都是正当、合理的。

因此,我衷心希望读者有意识地使用或规避最大最小准则,从而灵活掌握更富战略性的行动指针,在日常生活中处理复杂问题拥有更为可靠的决策依据。

[1]金融衍生品(derivatives)是一种金融合约,其价值取决于一种或多种基础资产或指数,合约的基本种类包括远期、期货、掉期(互换)和期权。

[2]看涨期权(calloption),又称认购期权、买进期权、买方期权、买权、延买期权或“敲进”,是指期权的购买者拥有在期权合约有效期内按执行价格买进一定数量标的物的权利。

[3]奈特氏不确定性(Knightiay)指无法被衡量、不能被计算概率的风险,由经济学家弗兰克·奈特提出。在奈特的成名作《风险、不确定性与利润》中,他为风险与不确定性做出定义,主张风险是能被计算和评估的,而不确定性是无法被预先计算与评估的。此外,他还提出利润是来自不确定性的论点。

[4]约翰·冯·诺依曼(JohnvonNeumann,1903—1957),美籍匈牙利数学家、计算机科学家、物理学家,是20世纪最重要的数学家之一。冯·诺依曼是布达佩斯大学数学博士,现代计算机、博弈论、核武器和生化武器等领域的科学全才之一,被后人称为“现代计算机之父”“博弈论之父”。冯·诺依曼先后执教于柏林大学、汉堡大学、普林斯顿大学、普林斯顿高等研究院,曾担任美国原子能委员会会员、美国国家科学院院士。冯·诺依曼早期以算子理论、共振论、量子理论、集合论等方面的研究闻名,开创了冯·诺依曼代数。第二次世界大战期间,冯·诺依曼参与曼哈顿计划,为第一颗原子弹的研制做出了贡献。1944年,冯·诺依曼与奥斯卡·摩根斯特恩合著《博弈论与经济行为》。这是博弈论学科的奠基性著作。冯·诺依曼晚年转向研究自动机理论,著有对人脑和计算机系统进行精确分析的著作《计算机与人脑》(1958年),为研制电子数字计算机提供了基础性的方案。

[5]奥斯卡·摩根斯特恩(enstern,1902—1977),德国-美国经济学家,曾长期在维也纳大学讲授经济学。1938年纳粹德国吞并奥地利后,摩根斯特恩被迫离开奥地利来到美国,1944年加入美国籍。他在普林斯顿大学教经济学,并在那里度过了他的后半生。他热心于将数学应用于经济学,更广义地说,应用于人类的各种战略问题,以便获得最大收益和尽可能地减少损失。他认为这些原理也同样适用于哪怕简单得像抛掷硬币这样的游戏,因而提出了博弈论。

[6]零和博弈(zero-sumgame),又称零和游戏,是博弈论的一个概念,与非零和博弈相对,属非合作博弈。它是指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”,双方不存在合作的可能。

已完结热门小说推荐

最新标签