第一节方差分析的基本原理及步骤
一、方差分析的基本原理:综合的F检验
(一)综合虚无假设与部分虚无假设
方差分析主要处理多于两个以上的平均数之间的差异检验问题。此时,该实验研究就是一个多组设计,需要检验的虚无假设就是“任何一对平均数”之间是否有显著性差异。为此,设定虚无假设为,样本所归属的所有总体的平均数都相等,一般把这一假设称为“综合的虚无假设”(omnibusnullhypothesis)。组间的虚无假设相应的就称为“部分虚无假设”。譬如某个实验设计中有三个实验组,综合虚无假设就可表述为:H0:μ1=μ2=μ3。综合虚无假设和部分虚无假设差异很大。检验综合虚无假设是方差分析的主要任务。如果综合虚无假设被拒绝,紧接着要确定究竟哪两个组之间的平均数之间存在着显著性差异时,需要运用事后检验方法来确定。
(二)方差的可分解性
方差分析依据的基本原理就是方差(或变异)的可加性原则。确切地说,应该是方差的可分解性。作为一种统计方法,方差分析把实验数据的总变异分解为若干个不同来源的分量。不同来源的变异只有当它们可加时,才能保证总变异分解的可能。具体地讲,就是将总平方和分解为几个不同来源的平方和。
比如,假设要探讨噪音对解决数学问题的影响作用。噪音是自变量,划分为三个强度水平:强、中、无。因变量是解决数学问题时产生的错误频数。随机抽取12名被试,再随机把他们分到强、中、无三个实验组。每组被试在接受数学测验时都戴上耳机。强噪音组的被试通过耳机接受100分贝的噪音;中度噪音组的被试接受50分贝的噪音;无噪音组的被试则没有任何噪音。数学测验完毕后,计算每位被试的错误频数。考察这类研究结果的显著性差异就可用方差分析程序问题。实验结果如表9-1所示。
表9-1不同强度噪音下解数学题犯错误频数
图9-1数据变异示意图
把第j组的n个数据的平方和相加,即把这上面这个等式两边平方之后连加:
再利用平均数离差和等于零这一特性,简化得到下式:
然后将K组的这种关系全加起来:
令
则
在上面的公式中,X的下标j表示第几组,i表示某一组中第几个被试,∑的起止标记意思与此相同,本章后面均予以省略。n表示每组的人数,k表示有几种实验处理。其中SS表示平方和(sumofsquare);SST为总平方和(thesumofsquarestotal),表示实验中产生的总变异;SSB为组间平方和(sumofsquaresbetweengroups),表示由于不同的实验处理而造成的变异;SSW为组内平方和(sumofsquareswithingroup),表示由实验误差(包括个体差异)造成的变异。下标T表示全部(total)的意思,B代表组间(betweengroups)之意,W代表组内(withingroup)之意。
这样,总变异就被分解为组间变异和组内变异两部分。总变异的计算是把所有被试的数值作为一个整体考虑时得到的结果,是用所有被试的因变量的值计算得到的。在计算时,它不区分各个数值究竟来自于哪一种实验条件。组间变异主要指由于接受不同的实验处理而造成的各组之间的变异,可以用两个平均数之间的离差表示。两组平均数的差异越大,组间变异也就越大。组间变异可以看做是组间平均数差异大小的一个指标。组内变异则是由组内各被试因变量的差异范围决定的,主要指由实验误差,或组内被试之间的差异造成的变异。由于被试分组是随机分派,个体差异及实验误差带有随机性质,因而组内变异与组间变异相互独立,可以分解。
在方差分析中,如果实验中各个组内部被试之间存在着不同程度的差异,即接受同样处理的被试在因变量上有量的差别,那么组内平方和就会比较大。如果各独立组每组的方差很大,组内平方和也会很大。组内平方和越大,表明实验误差越大。一般情况,组内平方和不会为0。因为,所有被试不可能在实验前都是相同的,而实验者也不可能绝对同等地处理它们。相反,如果组间平方和越大,组内平方和就会越小,各组平均数之间有显著差异的可能性也越大。样本平均数之间的变异和样本内部的变异相差越大,就说明总体处理中平均数之间的差别也越大。这样,从统计角度考虑,缩减样本内部的变异,使样本平均数真正的变异就能显示出来。这是所有实验研究在设计时的一个关键。
平方和除以自由度所得的样本方差可作为其总体方差的无偏估计。那么,方差分析中组间方差和组内方差就分别表示为:
MSB表示组间方差,一般称作组间均方(meaweengroups),有的书中把它用MST表示,指实验处理(treat)的均方,也就是组间均方;dfB为组间自由度。MSW表示组内方差或称组内均方(meahingroup),有的书中把它用MSE表示,指误差的均方,即组内均方;dfW为组内自由度。
在方差分析中,组间变异与组内变异的比较必须用各自的均方,不能直接比较各自的平方和。因为平方和的大小与项数(即k或n)有关,应该将项数的影响去掉求其均方,因此必须除以各自的自由度。
组间自由度dfB=k-1
组内自由度dfW=k(n-1)
总自由度dfT=nk-1
检验两个方差之间的差异用F检验,因此比较MSB与MSW也要用F检验。在讨论方差齐性检验时,指出利用F检验比较两个样本方差的差异要用双侧检验。在方差分析中关心的是组间均方是否显著大于组内均方,如果组间均方小于组内均方,就无须检验其是否小到显著性水平。因而总是将组间均方放在分子位置,进行单侧检验。即
F为组间变异与组内变异比较得出的一个比率数,如果F<1,说明数据的总变异中由分组不同所造成的变异只占很小的比例,大部分由实验误差和个体差异所致,也就是说不同的实验处理之间差异不大,或者说实验处理基本上无效。如果F=1,同样说明实验处理之间的差异不够大。当F>1而且落入F分布的临界区域表明数据的总变异基本上由不同的实验处理所造成,或者说不同的实验处理之间存在着显著差异。