第5章 概率
在第2章中,我们说过概率就是频数与样本大小的比值。这是概率的一种定义,但并不是唯一定义。实际上,概率的含义一直就是一个有争议的话题。
我们先搁置争议,看看其他内容。大家普遍认同概率是一个0到1之间的值,是一种定量度量,对应于定性地描述某一件事发生的可能性的大小。
被赋予概率的“事情”称为事件(event)。如果E表示一个事件,那么P(E)就表示该事件发生的概率。检测E发生情况的过程就叫做试验(trial)。
举个例子,假设有一个标准的六面骰子,计算抛出6点的概率。每抛一次就是一次试验。抛出6点就是成功,否则就是失败。在某些情况下,“成功”可能是坏事,而“失败”才是好事。
如果我们有一个包含n次试验的有限样本,其中我们观察到s次成功,那么成功的概率就是s/n。如果这个试验集合是无限的,概率的定义就会复杂些。但大部分人都可以接受用一系列假想的重复试验来表示概率,例如抛硬币或掷骰子。
在遇到不同事件的概率时,我们就遇到麻烦了。例如,我们想知道候选人赢得选举的概率。但每次选举都是不同的,因此不存在一系列的重复试验来计算概率。
遇到这种情况,有些人就会说上面这个概率的概念在这里并不适用。上面这种观点称为频率论(frequentism),就是用频率来定义概率。如果没有一系列相同的试验,那就不存在概率。
频率论在哲学上是没有错误的,但它却限制了概率的使用范围,只限于随机的物理系统(例如原子衰变)或因无法预测而被视做随机的系统(例如意外死亡)。任何涉及人为因素的情况都不适用。
还有一种观点是贝叶斯认识论(bayesianism),这种观点将概率定义为事件发生的可信度。根据这个定义,概率几乎能用于所有情况。贝叶斯概率的一个问题是它会受个体认知的影响:对于同一事件,不同的人会因为所掌握的信息不一样而对其发生的可信度有不同的判断。正因为如此,很多人认为贝叶斯概率要比频率概率更主观。
举个例子,他信·西那瓦成为泰国总理的概率有多大?频率学派会说这个事件没有概率,因为找不到一系列试验来验证这个问题。他信是否能成为总理跟概率没有关系。
反之,贝叶斯学派会根据其自己所掌握的信息赋予这个事件一个概率。例如,如果你知道2006年泰国发生了一次政变,并且你非常肯定时任总理的他信流亡国外,你就有可能将这个概率设为0.1。这个值真正代表的是你的记忆出错的可能性,或者他信复职的可能性。
看一下维基百科,你就会知道他信不是泰国的总理(在我写这本书的时候)。有了这个信息,你可能就会将这个概率改成0.01,而这个值反映了维基百科针对此事件出错的可能性。