事件“需要带伞”的概率=“雨”的概率+“雪”的概率=0。2+0。1=0。3。
如上所述,只要遵守“标准化规则”,坚持所有基本事件的概率之和为1,那么概率分布在原则上就是自由的。但是,缺乏依据的随机概率分布是没有任何意义的。由此可见,如何选择“依据”是一个重要的问题。
利用历史统计结果
选择依据的最具代表性的方法就是“利用历史统计的结果”,比如在预测指定的某一天的“晴”“阴”“雨”“雪”四种基本事件的概率分布时,就可以“利用关于天气的历史数据”进行分布。
下面,我们以天气预报中的“降水概率”为例进行说明。一般来说,次日的降水概率可以按照下述流程确定:首先,抽取预报对象日前一天的气压分布图,并从历史数据中选择出现过同一气压分布图的日期。为了减轻对比工作量,可以抽取100天的同类数据。其次,统计其中第二天降水的天数,假设有40天是降水的,那么此时应该预报的降水概率就是40%,见图2-1。
那么,这种分布方法的精髓又在哪里呢?
在预测天气状况的“信息”中,气压分布是勉强算得上能够有效捕捉到的关键要素。如果气压分布状况不同,与之相应,可以判断两天之间的降水概率肯定也不相同。但是,如果气压分布状况相同,在预测天气状况方面,使用历史统计结果就是比较好的手段了。也就是说,在气压分布相同的状态下,如同上文提到的掷骰子和双色球一样,人们在预测天气状况时,具备的条件是“没有任何差别”的。
接下来,就该轮到数学概率出场了。关于次日的天气状况预报,是从上文所述100张气象图中随机选择1张来确定的。从这种意义来看,究竟哪张气象图会被选到,其概率是相等的。在100张气象图中,有40张代表“降水”,有60张代表“不降水”。这样一来,选出来的气象图代表“降水”的概率就只能是40%。我们将使用这种统计方法分布的概率称为统计概率。统计概率是指针对“无法通过其他信息进行区分的事情”分布数学概率的方法。
虽然统计概率并不是像数学概率那样具有高度合理性的方法,但是如果能在适合的场景使用,有时还是能够很好地发挥效果的。比如19世纪的英国工程师约瑟夫·贾格尔就曾经在1873年雇用六名助手记录赌场轮盘游戏转出的数字。他对这些数字进行统计分析后,发现其中九个数字出现的频率要远远高于其他数字。他通过大量集中投注这九个数字,赢得了巨额奖金。可以说,这是证明统计概率发挥作用的经典案例。
然而,在使用统计概率的情况下,需要注意一个隐藏着的重要前提条件,那就是“关于诱发事件的机制,无论是过去发生的机制,还是今后要发生的机制,其在本质上都应是相同的”。比如关于“降水”这一气象学方面的机制,如果其过去和未来的机制是完全相同的,那么上文所述降水概率的天气预报就具有客观必然性。然而,从根本上讲,地球的气象环境是在不断变化发展的,如果诱发降水的机制发生了根本性的变化,那么再使用历史数据进行判断就没有任何作用了。我们将根据历史经验预测未来的方法称为“归纳推理”。关于这种归纳推理的问题,将在第二部分第六、七章中进行详细论述。
从同样的观点来看,刚才提到的贾格尔投注轮盘游戏的策略之所以能够成功,也是因为“他投注的是同一个轮盘”。实际上,对于贾格尔不同寻常的赢钱方式,赌场也极度怀疑,他们采用更换轮盘的方式进行应对。当然,在更换了轮盘之后,贾格尔的策略就不再有效了。
当信息的信任度不明确时
在使用统计概率时,还有一点必须严格遵守,那就是“核对数据背后的信息是否准确合适”。以刚才提到的降水概率为例,其成立的前提是:对于“降水”这个现象而言,“气压分布状况”是至关重要的本质性信息。并且,这个前提只能通过天气预报的准确率进行验证,除此以外没有其他方法。同样,关于贾格尔采取的轮盘游戏策略的有效性,也是通过“他确实赢得了巨额奖金”这一事实得以证明的。不得不说,无论哪种情况都属于自我循环、自我检验。
物理定律是可以通过补充实验进行验证的。也就是说,由于物体具有重现性,因此可以实施补充实验进行确认。但是,天气预报和经济预测不具备重现性,无法实施同一条件下的补充实验,因此只能通过自我检验进行评价,比如“由于预测准确,所以是正确的”。在这种情况下,“无论到了什么时候,法则都跳不出经验法则的范畴,无法提前预测哪些判断是错误的”。在无法判断用于统计概率分布的数据是否合理的情况下,无论何时,概率分布的有效性都是值得怀疑的。然而,大家往往容易遗忘这一点,我们对此必须给予充分注意。
通过主观决定概率
统计概率是用于描述概率分布的典型方法。但是,在现实生活中,我们掌握的数据在很多时候是并不充分的。在这种情况下,大家可能会感到束手无策,但还是有工作可以做的。
那就是“通过主观适当分布概率”。如果大胆一点来说,那就是“看心情分布概率”。这种概率并未经客观数据或实验证明,只依赖于人的“主观判断”,因此又被称为主观概率。
在日常生活中,主观概率的使用频率很高。比如“可行的概率大概是八成”“成功的概率大概有五成”等。前者的“八成”和后者的“五成”这些数值绝不意味着“0。8”或是“0。5”之类的精确的数值,而是仅仅代表发言者心目中的“关于可能性的大体印象”。从这种意义上来看,可以说这些数值带有一定的主观色彩。但是,这并不意味着它们就完全没有任何依据。前者要表达的意思是“从此前的经验看,大概率是行得通的”,后者要表达的意思是“就算根据此前的经验,也无法明确判断究竟是成功的可能性更大,还是失败的可能性更大”。一听到“主观概率”这个名词,总给人一种不靠谱的感觉。但是,实际上,它也是人们经过认真地逻辑思考,逐渐分析提炼出来的。在某种意义上,主观概率是具有合理性的。沙万奇就曾经证明过:如果人们的行为选择满足了某种规律,那么他们选择主观行为的方式就与基于数学概率确定行为的方式是一致的。
沙万奇准则是一个非常深奥的数学难题,在此我们尽量避免详细论述。为了帮助大家找到一点感觉,下面将举一个天气的例子进行简要介绍。
假设现在有彩票甲和彩票乙两种选择。无论是彩票甲还是彩票乙,发生“雨”和“雪”的基本事件时,奖金都是相同的,例如,发生“雨”时,都可以中1万日元;发生“雪”时,都可以中2万日元。
彩票甲和彩票乙的不同之处在于发生“晴”或“阴”的基本事件时,奖金不同,比如发生“晴”时,彩票甲可以中10万日元,彩票乙可以中5万日元;发生“阴”时,则恰恰相反。
关于彩票甲和彩票乙,假设你更喜欢甲。此时,再制作彩票丙和彩票丁,保持“晴”和“阴”时的奖金不变,仅调整“雨”和“雪”时的奖金(保持彩票丙和彩票丁中奖金额相同),例如,发生“雨”时,都可以中3万日元;发生“雪”时,都可以中4万日元。在这种情况下,针对新制作的彩票,你的喜好是没有任何改变,还是更加喜欢彩票丙呢?这是沙万奇提出的代表性规律:确定事件原则(surethingprinciple)。
沙万奇的确定事件原则在概率理论和统计学界掀起了一股新的风潮。下面,我将以沙万奇理论为基础,对主观概率的原理和使用方法进行说明。
使用主观概率的方法主要有两种:第一种是你亲自对各种事件实施主观概率分布,并以此为参考进行决策;第二种是你观察与你有利害关系的人是如何实施主观概率分布的,然后据此做出对自己有利的决策。
粗略比较“发生的可能性”
由于主观概率本来就是“主观”的,因此那些细微的数字差别是没有实际意义的。我们根本不必纠结出现“晴”的概率到底是0。4还是0。41,真正重要的是“对等性”和“概率大小”。
比如当依据主观感觉判断事件“发生的可能性”时,你一般都不会给出具体的概率数值,而是用比起某件事更可能发生(概率大小)或者与某些事都很可能发生(对等性)这样的方式来做出决策,这是非常正常的。
例如,当赌马时,如果你判断“A马进入前三名的可能性要比进不了前三名的可能性大”,则意味着“A马进入前三名的概率”对应的数值要大于0。5;当法官审理A、B、C三名犯人共同犯罪的案件时,如果法官觉得“C为主犯的可能性比其他两个人小”,那么,“主犯为C的概率”对应的数值就要小于三分之一。
如上所述,我们可以认为主观概率是以大小关系或对等性为基础,对基本事件发生的可能性进行概率分布的结果。实际上,沙万奇准则也是在这一框架的基础上构建的。
因此,如果你想使用主观概率对缺乏数据支撑的事件进行预测,那么针对各种基本事件,你可以根据自己的经验和思维逻辑先对“基本事件发生的可能性进行比较研究”,再分布能够满足相应大小关系和对等性的大体数值。即使你没有绝对把握分布严谨准确的数字,只要能够讲清大小关系和对等性,最起码也可以实现大体的概率分布。
当然,还有许多人对大小关系和对等性缺乏自信,并为此而感到迷惑。在这种情况下,还有更为灵活的推理方法,那就是基于多重先验和惊奇的方法,我将在第二部分中对其进行详细解说。
沙万奇主观概率准则的真正有趣之处在于看透了这些人的思维方式,他是按照下述方式思考问题的。
如果对人们的选择行为进行观察,你就可以从中洞察他对事件实施主观概率分布的模式。也就是说,只要仔细观察选择行为,你就可以看透人们内心设想的主观概率。
例如,针对价格和奖金额度完全相同的不同种类的彩票A和彩票B,某人选择购买了彩票A。这就说明他判断彩票A的中奖概率要大于彩票B;你与朋友打赌一顿晚饭,押巨人队对阪神队的棒球比赛结果,如果你赌巨人队赢,那就意味着你判断巨人队获胜的概率比阪神队获胜的概率大。