第2部完全自学!从“概率论”到“正态分布”
第1部仅停留在描述贝叶斯统计学本质的阶段。但由于没有使用概率符号,因而语言表述不够精确。而如果想要真正地深入掌握使用“贝塔分布”等概率分布的复杂推算,必须要通过算式来理解。在前面,我们已经通过“面积图”的方法积累了扎实的基础,所以,再复杂的概率符号,也能够轻松理解。即使从未听说过“正态分布”也不必担心,我会为大家进行清楚细致的讲解。那么,下面就让我们开始学习吧!
第14讲“概率”与“面积”的性质相同概率论的基础
14-1复杂的贝叶斯推理需要用到概率符号
之前的讲义中对于贝叶斯推理进行的讲解,刻意没有使用概率符号。这是因为,从第1讲到第13讲的内容,即使不使用概率符号,也可以针对贝叶斯推理展开讲解,且效果并不会逊色于使用概率符号的讲解方式。实际上确实如此,所有的问题都可以通过使用面积图来解决。而如果使用概率符号来讲解的话,我担心读者朋友们需要在理解贝叶斯推理过程的同时,还要思考概率符号的含义。这样会带来双重负担,导致本来能够理解的知识,也变得无法理解。因此我最终使用了面积图的方法,而这两种方法在本质上其实是相同的。
然而,当我们需要进行更加复杂的贝叶斯推理时,就不得不使用概率符号了,否则,将会遇到一些麻烦。尤其是在采用“连续型先验分布”(第16讲中将详细讲解)的情况下,如果不使用概率符号,是根本无法进行下去的。因此,从第14讲开始,直到第18讲,我将针对概率符号和连续型概率分布进行讲解;从第19讲到第21讲,则步入贝叶斯推理的精髓——贝塔分布和正态分布。
14-2通过函数的形式来记述概率
概率是指,用一个“大于0且小于1的数值”来对应“发生的事情”的数学概念。
“发生的事情”→“数值”(“数值”的取值范围:必须大于0且小于1)。
先确定“发生的事情”,然后决定与之对应的数值分配,这被称为“概率模型”。
例如,“晴天、阴天、雨天、雪天”为4件事情,分别为这4件事情分配一个0到1之间的数值,结果便会得到一个关于“明天的天气”的概率模型。但要注意的是:所分配的4个数值的相加之和必须为1(标准化条件)。以下为该概率模型的一个例子:
晴天→0。3、阴天→0。4、雨天→0。2、雪→0。1
在这里,我们将4个基础事件——晴天、阴天、雨天、雪天称为“基本事件”。所谓“基本事件”,也就是指为了记述需要计算的概率现象的、且不能再往下分解的最基本事件。
把几个基本事件组合起来,便成为一件“发生的事情”。例如“撑伞”这件事情,是在“雨天”和“雪天”这些基本事件发生的时候,才能得以实现。因此,可以使用以下集合来进行记述:
“撑伞”={雨天,雪天}
该集合{雨天、雪天},又可以称为“事件”。而用集合的方式来记录基本事件,则表示为{晴天}、{阴天}、{雨天}、{雪天},那么也可以这样理解:基本事件是现象的一种。
下面,在该概率模型中,使用符号p(A)表示事件A发生的概率。
p是probability(概率)的首字母。根据前文所述,p(A)的取值范围,一定在0到1之间。在刚才的例子中,基本事件可以表示为:
p({晴天})→0。3、p({阴天})→0。4、p({雨天})→0。2、p({雪天})→0。1
在这里,p({晴天})→0。3的含义是:明天的天气为“晴天”的概率是0。3。
而非基本事件的概率的定义则是:构成该事件的基本事件的概率之和。比如,方才的事件“撑伞”的概率为:
p(“撑伞”)=p({雨天,雪天})=p({雨天})+p({雪天})=0。2+0。1=0。3
这可以表述为:发生撑伞这一事件的概率为0。3。大家可以观察这个例子,注意一下:相比文字,使用概率符号进行记述要简单得多。总结一下上述的符号方法,用“事件”来表示“发生的事情”,可以得到如下图表:
概率p:“事件”→“数值”,“数值”=p(事件)
我们再来思考另一个代表性概率模型的例子:“掷骰子出现的点数”的概率模型。该案例中的基本事件为:
{1点,2点,3点,4点,5点,6点}
为了方便起见,“点”字可以省略掉,只写出数字,为:
{1,2,3,4,5,6}
也就是说,可以将基本事件设为数字的集合。那么,事件也将变为数字的集合,例如:
“偶数”={2,4,6}