吞噬小说网

吞噬小说网>日常生活中统计学的作用 > 第1部 快速学习理解贝叶斯统计学的精髓(第2页)

第1部 快速学习理解贝叶斯统计学的精髓(第2页)

下面我们来确认一下,这四个“可能世界”(所有可能发生的情况)的概率之和:

0。2×0。9=0。180。2×0。1=0。02

0。8×0。3=0。240。8×0。7=0。56

(0。18+0。02)+(0。24+0。56)=1

1-4第三步:通过观察到的行为,排除“不可能的情况”

下面,让我们进一步进行推测。

作为一名店员,现在你面临的情况是:顾客上前来打招呼。这也意味着,你观察到了顾客的某一种行为。这为“可能世界”又增添了一条信息。

这条信息的内容是:“不询问店员”的可能性消失了。上一节中提到,在顾客类别包括“来买东西的人”和“随便逛逛的人”两类,顾客的行为包括“询问”和“不询问”两类的情况下,“可能世界”共分为4种。在现实世界中,因为已经观察到了“询问”这一行为,因此“不询问”这一行为覆盖的世界就不复存在了。这意味着,“可能世界”受到了限制。下面我们借助图形来理解这一问题。(图表1-5)

图表1-5信息导致可能性受到限制

因为“可能世界”变成了2个,从而我们可以推测获得新的数值。

在一部分可能性不复存在,而一部分可能性又在现实中受到了限制的情况下,会发生些什么呢?这正是所谓的——在推测中“概率发生变化”。下面通过一个简单的例子,来解释一下何为“概率的变化”。

现在,有人洗好了52张扑克牌摆在你面前,扑克牌背面朝上。当被问道“最上面一张扑克牌的花色是什么呢?”的问题时,如果你回答“是黑桃”的话,那么,这一推测为正确的概率是多少呢?当然,是四分之一,对吧。因为扑克牌共有四种花色,每一种花色的可能性都是相等的。

但是,如果对方背着你偷看了最上面的一张扑克牌,并告诉你“最上面一张扑克牌其实是黑色的”,结果又会怎样呢?从你的推测来看,扑克牌是红色花色的可能性自然就不存在了。当然,你的推测也可能会发生变化吧。也就是说,此时只有可能是黑桃或梅花,所以,你推测这张扑克牌的花色“是黑桃”的概率应当为二分之一。

将这个实验的来龙去脉用图来表示,如图表1-6所示。

图表1-6因某种可能性消失而导致的概率变化

最初,4种花色的概率相加之和为1。但是,由于红色花色的可能性不复存在,此时黑桃的概率和梅花的概率相加之和便不等于1。为此,还是要保持之前的比例关系,通过恢复标准化条件(使所有情况的概率相加之和为1),所以,花色为黑桃的概率应变更为二分之一。

1-5第四步:寻求“来买东西的人”的“贝叶斯逆概率”

上一节,由于观察到“询问”这一行动,使得“可能世界”被限定在两个以内。也就是说,面前的顾客所属的世界,要么是“来买东西的人询问店员”,要么是“随便逛逛的人询问店员”,只有这两种可能性。显示其可能性的数值(概率),如图表1-7所示。

图表1-7“不询问”的可能性消失

根据观察到的行为,可能性被限定为两种,此时,所有情况的概率(长方形面积)之和已经不为1。因此,要采取上一节中用扑克牌举例的办法,保持比例关系,恢复标准化条件,从而使概率发生变化。具体如下所示:

(左边长方形的面积):(右边长方形的面积)=0。18:0。24=3:4

简化比值,合计3+4=7,如果按照除法计算,就会得出“相加得1”的结果。也就是说,

(左边长方形的面积):(右边长方形的面积)=3:4=37:47

用图表示,如图表1-8所示。

图表1-8恢复标准化条件,计算后验概率

从上表中我们可以看出,上前询问的顾客为购买者的概率,可以推定为37。这个概率,被称为“贝叶斯逆概率”或“后验概率”。

在此,对“逆概率”一词中的“逆”的含义,进行简要说明。(在之后的讲义中会逐渐进行详细说明)。

所谓的“逆”是指:用与之前相反的方法,来解析表示几个互不相同的“世界”的图形。截至上一节的观点是:顾客共分两种类别,每一种类别都会随机做出“询问”或“不询问”的行为,这一观点的前提是对图表进行纵向观察。这正是从“类别”这一原因,得到“行动”这一结果的处理方法。但是,现在让我们来横向观察图表。也就是说,“上前询问”的顾客可分为“来买东西的人”和“随便逛逛的人”两种类别,从中随机选择一种。从“询问”这一行动的结果追溯到“类别”这一原因。【结果→原因】这一过程,就是“逆概率”这一概念中“逆”的含义。

1-6贝叶斯推理过程的总结

用图表对于之前提到的后验概率的计算方法进行总结,如图表1-9所示。

图表1-9关于顾客类别的贝叶斯推理过程

那么,通过求后验概率,我们能够了解到什么呢?其实,只要抽出图表的开头、中间和结尾部分,并填入数值,结果就很明确了。(图表1-10)

热门小说推荐

最新标签