吞噬小说网

吞噬小说网>生活工作中的极简统计学 > 第15讲 在获得信息之后概率的表示方法 条件概率的基本性质(第3页)

第15讲 在获得信息之后概率的表示方法 条件概率的基本性质(第3页)

这被称为“贝叶斯公式”。

进行具体计算,则为:

式子(7)可以按照以下思路来理解:左边表示从“黑球”的结果追溯到“B壶”这一原因的概率,从直观上不是很容易理解。而右边的p(A)和p(B)均为每一类别的先验概率,p(黑|A)和p(黑|B)是由原因推导出的结果的概率,这一点已经在设定中予以说明。换言之,式子(7)是通过已知的概率(右边),推导出直观上看不出的概率(左边)的计算方式。

乍一看式子(7),可能会觉得计算过程很复杂,令人迷惑。不过,只要在面积图中填入前面讲过的概率符号,就能明白“现在做的,只是把之前面积图的方法直接转换为计算公式罢了”。

图表15-4贝叶斯逆概率的公式

下面请观察图表15-4。迄今为止,我们采用的计算方式都是在获得“取出的球为黑球”这一信息之后,再得出以下比例关系:

(A的后验概率):(B的后验概率)

=(A&黑球的面积):(B&黑球的面积)

用条件概率来描述,则可以得到如下比例公式:

p(A)p(黑|A):p(B)p(黑|B)…(8)

式子(8)中,左右两边的计算,与通过乘法计算长方形的长宽而得出的概率是一样的。然后,在满足标准化条件的情况下进行变形(左右数值之和相除),得到:

由此又可以得到以下公式:

最后的式子(9),与(7)是完全相同的。

下面,我们通过用来说明条件概率的面积比例的思路,再次进行探讨。

现在,我们已经获得了“取出的球为黑球”这一信息,那么,正如15-2中的解说,B的条件概率即为:在表示“A&黑球”的长方形与表示“B&黑球”的长方形的总和(表示事件“黑球”的情况)中,表示“B&黑球”的长方形所占面积的比例这一数值。而在式子(8)中,左侧为表示“A&黑球”的长方形的面积,右侧为表示“B&黑球”的长方形的面积。因此,用右侧来除以左右之和,其结果,与“在‘取出的球为黑球’的情况下,计算表示‘B&黑球’的长方形面积所占比例”的结果是相同的。这也意味着,最后的计算与条件概率p(B|黑)的面积所代表的意义相一致。

最后需要说明的一点重要内容:采用贝叶斯推理方法计算后验概率时,无须考虑式子(7)中的分母。要点是,因为有了比例公式(8),那么(7)和(9)的分母,只是用来恢复标准化条件罢了,可以忽略。毕竟,关键点在于比例关系。因此我们只需记住比例公式(8)即可。

第15讲·小结

1.条件概率是指,在获得信息之后,基本事件减少的情况下,赋予的比例关系。

2.在获得“事件B”这一信息后,事件A的条件概率p(A|B)可定义为:p(A|B)=p(A和B的重叠部分)÷p(B)

3.在贝叶斯推理中,使用条件概率公式②时有两种方法。

4.第1种使用方法:求出类别&信息的概率。即,p(类别&信息)=p(类别)×p(信息|类别)

5.第2种使用方法:求出后验概率。已知数据信息,通过上面的方法来计算p(类别&信息)的比例关系,并使之满足标准化条件。

练习题

答案参见此处

下面,以癌症检查为例,来练习条件概率的表示方法。

基本事件分别为:“癌症”、“健康”、“阳性”、“阴性”。选取合适的基本事件,填入下面的括号中。

p(癌症&阳性)=p(癌症)×p(|)…(1)

p(癌症&阳性)=p(阳性)×p(|)…(2)

p(健康&阳性)=p(健康)×p(|)…(3)

p(健康&阳性)=p(阳性)×p(|)…(4)

此时,从(1)和(3)中,可以得出:

p(癌症&阳性):p(健康&阳性)

=p(癌症)×p(|):p(健康)×p(|)…(5)

从(2)和(4)中,可以得出:

p(癌症&阳性):p(健康&阳性)

=p(|):p(|)…(6)

从(5)和(6)中,可以得出:

p(|):p(|)

=p(癌症)×p(|):p(健康)×p(|)

左边为后验概率之比,右边为通过先验概率和条件概率中算出来的比值。

热门小说推荐

最新标签