吞噬小说网

吞噬小说网>你一定爱读的极简统计学 > 第16讲 概率分布图帮助我们进行更加通用的推理(第1页)

第16讲 概率分布图帮助我们进行更加通用的推理(第1页)

第16讲“概率分布图”帮助我们进行更加通用的推理

16-1到达到实用水平,需要“概率分布图”和“期待值”

截至上一讲,我们已经完成了对于贝叶斯推理的基本技巧、以及运用常见的概率记号对其进行描述的知识点进行了解说。至此,进行简单设定的推理已经完全不成问题。但如果要对于稍微复杂的设定进行推理、或是进行通用性推理的话,之前所介绍的方法就略显不足了。

对于稍微复杂的设定进行推理、以及进行通用性推理时,需要了解“概率分布图”和“期待值”相关的知识,尤其是在连续性概率分布这种基本事件无限多的情况下,以上背景知识更是不可缺少的。我们从本讲开始学习这个知识点。而在后面几讲中,将会对贝叶斯推理中最有代表性、重要的“贝塔分布”和“正态分布”进行解说。在本讲中,首先为大家解说贝塔分布的出发点——“均匀分布”的相关内容。

16-2思考“同样的可能”型的概率模型

想象一下抛硬币和掷骰子试验的常规概率模型,就很容易理解“均匀分布”的概念了。

正如第14讲中解说的那样,概率模型是根据基本事件和对其概率的分配来进行定义的。以抛硬币为例,其基本事件的集合表示为:

{正面,反面}

为每个基本事件分配相同的概率,即:

这些基本事件被称为“大致相同”。也就是说,可以把“正面”和“反面”设定为基本相同的情况。

而在掷骰子的情况,也正如第14讲中所解说的那样,基本事件的集合可以表示为:

{1,2,3,4,5,6}

而分配概率的方法,则是把点数K出现的概率记为p({k}),那么:

此时,6个基本事件也是“大致相同”的。

用面积图来描述抛硬币和掷骰子的概率模型,如图表16-1所示,由于可能性“大致相同”,所以长方形被分为面积相等的几份。

图表16-1关于硬币和骰子的“大致相同”

接下来我们来设想一个新的模型——赌盘,也就是在赌场里使用的工具的概率模型。它的基本事件为整数1~36,表示为:

{1,2,3,…,35,36}

实际上,在赌场里真正使用的赌盘,每个分区用“0”或“00”等数字来标记。在这里,我们为了简单起见,把赌盘的圆周分为36等分,并用整数1~36分配给每一等份来命名。若把赌盘的概率模型也设定为“大致相同”的情况,那么理所当然地,每个点数出现的概率都是相同的,因而可以表示为:

用图来表示,如图表16-2所示。

图表16-2赌盘上的“大致相同”

在该模型中,可以把“抽取一个满足条件1≤x≤k的整数x”的概率记为p(1≤x≤k)。由于1≤x≤k占了整体中的36分之k的比例,所以可以得出:

16-3把“大致相同”模型转换为成连续化的“均匀分布”

赌盘的概率模型,是把整数1~36出现的概率设定为“大致相同”。而若是把这个模型扩展为(连续的)无限个基本事件,就形成了“均匀分布”的概率模型。

下面我们来想象一下这个虚构出来的赌盘:在圆周上绘制0≤x≤1范围内所有的x。之后,截取截线段中0~1之间的部分,并把它想象成车轮形状的圆形,这就是基本的“均匀分布”的概率模型。本书中,将该模型称为[0,1]-赌盘模型(该名称仅在本书成立)。

在该概率模型中,“在0≤x≤1范围的数值中,随机抽取一个x”,正对应了抛硬币随机出现“正面”或“反面”,以及掷骰子随机出现点数1~6的结果。

但该模型与之前的模型相比有着很大的差异,体现在概率的分配方式上。

如果模仿之前的抛硬币和掷骰子的例子,将0。4或0。73等x的数值作为事件,并将{0。4}或{0。73}等作为基本事件,那么,应该为其分配“大致相同”的概率。然而,对于[0,1]-赌盘模型来说,这种方法并不合适,而这又是为什么呢?

这里需要用到标准化条件的概念。在概率模型中,所有事件的概率之和为1。假设对于每一个x,都为事件{x}分配相同的概率a,由于在0≤x≤1的范围中有无数个x,那么,则必须满足以下公式:

(对于满足条件0≤x≤1的所有x,{x}的概率之和)

=(无限个a的和)=1

并且,如果不满足a=0,就会出现矛盾。但如果a=0的话,就会产生两个困难。

第一个困难:“无限个0相加等于1”的含义是什么?

第二个困难:对满足条件0≤x≤1的每个x,假设它的概率为p({x})=0。那么,应该怎样计算满足条件0≤x≤0。5时,抽取出x的概率呢?

上述两个困难的难度系数都不小,那么,为了避开它们,我们需要调整之前设定概率的方式为以下方式:

在[0,1]-赌盘模型中的概率的设定

在[0,1]-赌盘模型中,t的取值范围为0<t≤1,把[大于0且小于等于1的数值]的集合设为基本的事件。也就是说,将E={满足条件0≤x<t的x}设为基本事件。之后,为事件E分配概率为p(E)=t。最后,把事件E简略地记为(0≤x<t),其概率p(E)简略地记为p(0≤x<t)。

热门小说推荐

最新标签