二、四格表独立性检验
最简单的列联表就是四格表,这种形式在心理、教育及社会调查中应用最多。四格表的独立性检验很多情况下与二比率差异显著性检验的统计功用相同。就是说,在有些场合,如其中一个因素属于被试方面的两项分类时,将调查结果可以整理成两个比率,也可以整理成四格表形式。这种情况下,两种不同的统计方法都可达到相同的统计分析目的。下面根据样本的不同情况,分别叙述各种方法。
(一)独立样本四格表χ2检验
独立样本四格表χ2检验,相当于独立样本比率差异的显著性检验。在独立样本的四格表中,当各单元格的理论次数fe≥5时,可用计算χ2值的基本公式求χ2值,查χ2临界值的自由度df=1。或用下面的简捷公式计算χ2值:
式中A,B,C,D分别为四格表内各格的实计数,(A+B),(C+D),(A+C),(D+B)为各边缘次数,自由度df=1。四格表各单元格表示方式具体如下表所示:
【例10-10】随机抽取90人,按男女不同性别分类,将学生成绩分为中等以上及中等以下两类,结果如下。问男女生在学业水平上是否有关联?或男女生在学业中等以上的比率差异是否显著?
解:此题可以用三种方法来计算。
①用χ2基本公式计算各格的理论次数。因为自由度为1,只要求出一个理论次数后,其余各单元格的理论次数可用相应边缘次数减去所计算的理论次数得到。
fe1=40×5190=22。67
fe2=51-22。67=28。33
fe3=40-22。67=17。33
fe4=39-17。33=21。67
将计算的理论次数代入基本公式:
答:性别与学业成绩无关联,或说男女生性别不同在学业成绩上没有显著差异。
②用单元格中的实计数计算。这种方法可不用先计算理论次数,简单方便,还可减少计算误差。
根据列联表自由度计算公式df=(R-1)(C-1),四格表中R=2,C=2,故自由度为1。
③用两比率差异显著性检验方法,先求各样本的比率。
比率差的标准误用第七章公式7-22计算,其临界比率用第八章公式8-37计算:
查正态表,所得尾部端概率乘以2(双侧概率)与用χ2值查χ2表所得概率相同(χ2为双侧概率)。如果将Z值平方,Z2=0。14272=0。02036与上面所计算的χ2值也相同。
本题还可求中等成绩以上(或以下)男生与女生的比率,进行差异显著性检验,回答在学业成绩上是否存在男女生的比率不同。求比率差异显著性检验,需要进行两次比较,而用χ2检验只计算一次就可以了。四格表χ2检验要比比率差异显著性检验在方法与计算方面都简单。
(二)相关样本四格表χ2检验
相关样本四格表χ2检验与相关样本比率差异显著性检验功能相同。其检验公式为:
df=1,式中A,D为四格表中两次实验或调查中分类项目不同的那两个格的实计次数。