第18讲决定概率分布性质的“期待值”
18-1用一个数值来代表概率分布
在贝叶斯推理中,可以计算出各个类别的后验概率。例如,第2讲中,可以根据检查结果呈阳性,计算出“患癌症的后验概率为4。5%”“身体健康的后验概率为95。5%”。如果将患癌症设为数值1、身体健康设为数值0的话,这与在x=0,1时计算出的概率分布情况相同,因此也可以视为一个问题得到了解决。
但是,第4讲的案例:根据某对夫妇第一胎为女孩的事实,来计算“第二胎也是女孩的后验概率”,这种情况又需要另当别论。第4讲中,将该夫妇生女孩的概率设为“0。4”、“0。5”、“0。6”三种,并计算这三种情况各自的可能性。通过贝叶斯推理得出的结论是:“0。4”的后验概率为27%,“0。5”的后验概率为33%,“0。6”的后验概率为40%。也就是说,设定x=0。4、0。5、0。6时,计算得出的概率分布分别为0。27、0。33、0。4。但是,上述结论并不能解答“该夫妇第二胎也是女孩的概率”的问题,而是提供一个用数值来回答问题的方法,这个数值就是所谓的“期待值”。第4讲中虽然讲解了期待值的计算方法,但并没有详细说明期待值的含义。现在,我们已经掌握了概率分布的思考方式,所以可以详细地了解一下“期待值”的相关知识。
18-2期待值的计算方法
下面,通过具体事例来讲解,用一个数值来代表概率分布“期待值”的计算方法。首先,第14讲中关于天气的概率模型为例,其基本事件的集合为:
{晴天,阴天,雨天,雪天}
将其概率分布设定为:
p({晴天})=0。3、p({阴天})=0。4、p({雨天})=0。2、p({雪天})=0。1
为了制作概率分布图,在这里需要将基本事件设为数值。设定天气越恶劣,数值越大,即:
晴天→1、阴天→2、雨天→3、雪天→4
概率分布图如图表18-1所示。
图表18-1天气的概率分布图
该图表体现了各种天气出现的频率。我们想要了解的是“该地区的天气情况大致如何”的问题,即“如何用一个数值来表示该地区的天气”。这个数值也就是期待值,计算方法如下:
(概率分布的期待值)=(数值)×(取该数值的概率)的合计
如果将该公式运用到上述天气概率分布的具体例子中,则为:
(天气的概率分布的期待值)=1×0。3+2×0。4+3×0。2+4×0。1=2。1
具体到概率分布图18-1中,即“横轴数值与纵轴数值乘积的合计”。
如果使用语言来解释得到的结果数值2。1的话,那就是“该地区的天气从阴天轻微偏向雨天”。
在期待值的计算中,(数值)×(得到该数值的概率)这一乘法运算意味着“加权”。例如,数值“3”表示“雨天”,其发生比率占整体的0。2,所以“将3的影响力弱化至0。2倍后再相加”,这种计算方式被称为“加权平均”。
18-3长期来看,期待值是与实际情况相符的
首先,对期待值的数值含义进行说明。
就上一节中天气的例子来思考,如果设定每天的天气为:
晴天→1、阴天→2、雨天→3、雪天→4
然后进行N天的长期记录,那么,根据概率为:
p({晴天})=0。3、p({阴天})=0。4、p({雨天})=0。2、p({雪天})=0。1
可以得知,晴天大概有0。3N天、阴天大概有0。4N天、雨天大概有0。2N天、雪天大概有0。1N天。因此,记录下的数值之和合计约为:
1×0。3N+2×0。4N+3×0。2N+4×0。1N
=(1×0。3+2×0。4+3×0。2+4×0。1)N
=2。1N
回想一下之前计算出的期待值也是2。1。因此可以得出:
(实际点数的N天量的合计)≈(N个期待值的合计)
也就是说,“如果每天都对期待值进行统计,那么长期来看,结果与实际情况是基本保持一致的”。这意味着“从长期的角度来看,期待值的合计结果与实际情况一致”。以上就是针对“期待值”含义的最直观的说明。
18-4期待值可以作为使概率分布图保持平衡的支点
以下,针对如何理解期待值的图像进行说明。结论是,期待值可以作为使概率分布图保持平衡的支点。可以使用瓦楞纸板支等制成图表18-2所示的具体天气概率分布图的立体模型,类似两臂平伸姿势的挑担偶人玩具。此时,如果将表示期待值的点作为支点,左右两侧将保持平衡,模型整体会处于稳定状态。
图表18-2期待值处为平衡支点
能够保持平衡的原因如下: