17-2中已经作了说明,α=2、β=1时的贝塔分布为一次函数,即:
y=(常数)x(0≤x≤1)…(3)
如图表17-2所示,函数的图像是一条穿过原点并向右上方延伸的线段。在概率分布图中,由于概率通过面积体现,所有事件的概率p(0≤x≤1)与三角形OAB的面积相一致。那么,基于标准化条件来考虑,该面积必须为1。而三角形的面积=(底边)×(高)÷2,那么,底边为1,则高为2。也就是说,x=1时,y=2。因此,在(3)式中(常数)=2。
换言之,α=2,β=1的贝塔分布为:
y=2x(0≤x≤1)…(6)
图表17-2α=2,β=1时贝塔分布的概率分布图
下面通过一个例子,来帮助大家理解贝塔分布中的概率变化情况。例如,求事件{0。5≤x<0。7}的概率p(0。5≤x<0。7)。观察图表17-3,在概率分布图中,事件的概率通过面积来表示的,而概率p(0。5≤x<0。7)是则为图中涂有颜色部分的梯形的面积。梯形的上底长为x=0。5时的y,则y=2×0。5=1。梯形的下底长为x=0。7时的y,则y=2×0。7=1。4。之前已经讲过,这个并非概率,而是一个被称为概率密度的量。此外,梯形的高度为0。7-0。5=0。2。因此可以求出梯形的面积为:(1+1。4)×0。2÷2=0。24。也就是说,我们可以求出事件{0。5≤x<0。7}的概率为:
p(0。5≤x<0。7)=0。24
图表17-3贝塔分布y=2x时的概率
17-5α=1,β=2的例子
如17-2中所述,α=1、β=2时的贝塔分布为以下一次函数:
y=(常数)(1-x)(0≤x≤1)…(4)
如图表17-4所示,函数的图像是一条穿过A(0,2),并向右下方延伸的线段。在概率分布图中,由于概率通过面积来表示,故所有事件的概率p(0≤x≤1)是与三角形OAB的面积相一致的。基于标准化条件来考虑,该面积必须为1。由于底边为1,故高为2。也就是说,当x=0时,y=2。因此,在(4)式中(常数)=2。换言之,α=1,β=2的贝塔分布为:
y=2(1-x)(0≤x≤1)…(7)
图表17-4α=1,β=2的贝塔分布的概率分布图
17-6α=2,β=2的例子
17-2中已经讲过,当α=2、β=2时,贝塔分布为以下二次函数:
y=(常数)×x(1-x)(0≤x≤1)…(5)
如图表17-5所示,图像为抛物线(二次函数图像)的一部分。在概率分布图中,由于概率通过面积来表示,故所有事件的概率p(0≤x≤1)与抛物线和x轴围成的图形面积是一致的。基于标准化条件来考虑,由于该面积必须为1,那么用积分方法来计算面积,决定了在(5)式中(常数)=6。换言之,α=2、β=2的贝塔分布为
y=6x(1-x)(0≤x≤1)…(8)
在该概率分布中,若要计算出事件{0。5≤x<0。7}的概率p(0。5≤x<0。7),只需计算出图中涂有颜色部分的面积即可。但由于它是一个曲线图形,因此必须使用积分运算,用数学公式来表达,即为:
对于初学者来说,贝叶斯推理有着相当的难度的原因:即使在入门部分,也需要用到微积分的思考方式。当然,在标准的统计学(内曼-皮尔逊统计学)中,微积分的运用也是不可缺少的。不过,一般情况我们需要的推理,不一定会用到微积分,而大部分教科书也是采用的这种写法。另一个原因,在本书的后文部分也会涉及:在贝叶斯推理中,即便是入门阶段也不可避免地需要用到微积分。为此,本书选取了一个折中的方案:对概率密度函数进行解说,但不会涉及更深入的微分概念;此外,会针对概率分布图中,概率即面积这一问题进行解说,但也会省略掉如何具体运用积分理论计算面积的过程。总之,会在最大程度上避免涉及太多的微积分概念。
图表17-5α=2,β=2的贝塔分布的概率分布图
17-7在贝塔分布中,若α、β增大,情况就会变得复杂
截至上一节,我们所讨论过的贝塔分布的例子中,α、β均不大于2,因而图形也相对简单。而如果α、β均大于2,那么就会形成我们不大熟悉的图形。下面,列举一个α、β的数值均比较大的例子,如α=4、β=3时的贝塔分布。
y=60x3(1-x)2(0≤x≤1)…(9)
如图表17-6所示。
图表17-6α=4、β=3的贝塔分布的概率分布图
第17讲·小结
1.贝塔分布,是x的取幂和(1-x)的取幂相乘的形式。
2.在x的0次幂和(1-x)的0次幂的情况下,与均匀分布相一致。
3.在x的1次幂和(1-x)的0次幂、x的0次幂和(1-x)的1次幂的情况下,概率分布图为线段。
4.在x的1次幂和(1-x)的1次幂的情况下,概率分布图为抛物线。
5.常数是由标准化条件(面积之和为1)决定的。
练习题
答案参见此处
当α=3、β=2时,贝塔分布的概率密度表示如下:
y=12x2(1-x)
此时,计算以下关于x的概率密度。
(3)x=1的概率密度