卡方检验研究数据的独立性,在分析样本量较少(比如小于40),也或者期望频数出现小于5时,此时使用fisher卡方检验较为适合。SPSSAU医学研究模块中的卡方检验时,有提供2*2即4表格时提供fisher卡方检验p 值,但当为R*C结构时,也或者为汇总表格数据时,可使用fisher卡方按钮单独进行计算。
fisher卡方理论依据为超几何分布,其利用排列的数学原理进行计算,在样本量较大计算量非常大,并且fisher卡方基本上均是针对小样本量数据进行计算,因而SPSSAU在总样本量大于200时依旧不提供fisher卡方检验值。
SPSSAU系统中共有3处(包括通用方法->交叉卡方,医学研究->卡方检验,医学研究->fisher卡方)提供pearson卡方检验值;
SPSSAU系统中共有2处(医学研究->卡方检验,此处仅提供2*2时fisher卡方检验值,医学研究->fisher卡方)提供fisher卡方检验。
当前有一项HBV感染医学研究,并被试分为预防组和非预防组,共两组,并且记录阳性和阴性的数据,汇总如下表,似问两组数据HBV感染率有无差别?数据如下:
组别 | 阳性 | 阴性 | 总计 |
---|---|---|---|
预防组 | 4 | 18 | 22 |
非预防组 | 5 | 6 | 11 |
总计 | 9 | 24 | 33 |
Fisher卡方检验利用超几何分布原理进行计算,共不同与pearson卡方检验会提供卡方值和p 值两项。Fisher卡方检验时仅提供p 值。SPSSAU在医学研究模块->卡方检验方法中提供2*2时卡方检验,如果是汇总表格格式,也或者R*C结构时,可使用fisher卡方按钮完成计算。
本案例操作如下,A1单元格一定要空着,并且放入的数据不包括合计数据,如下图:
SPSSAU共输出3个表格,如下说明:
项 | 说明 |
检验统计量 | 展示fisher卡方、pearson卡方和连续校正卡方统计量 |
期望频数 | 展示期望频数,辅助判断是否使用fisher卡方的必要性 |
实际频数 | 展示实际频数且提示百分比展示切换查看,便于查看数据 |
检验统计量 | ||
---|---|---|
检验 | 卡方值 | p 值 |
Fisher卡方 | - | 0.121 |
Pearson卡方 | 2.750 | 0.097 |
连续校正卡方 | 1.547 | 0.214 |
上表格展示出fisher卡方、pearson卡方和连续校正卡方统计量,从上表可知:fisher卡方时仅提供p 值,而且从pearson卡方和连续校正卡方对应的p 值来看,3个值均呈现出一致性结论即:预防组与非预防组时HPV感染情况无明显差异。
通常情况下:如果总样本量>40且期望频数值全部均大于5时,一般使用pearshon卡方值,如果总样本量大于40,但出现期望频数小于5的单元格时,可优先使用连续校正卡方,也或者使用fisher卡方值,如果总样本量小于40,也或者出现期望频数小于1的单元格时,此时建议使用fisher卡方检验。具体以文献为准即可,可能不同文献的标准不完全一致。
期望频数 | |||
---|---|---|---|
阳性 | 阴性 | 总计 | |
预防组 | 6.0 | 16.0 | 22 |
非预防组 | 3.0 | 8.0 | 11 |
总计 | 9 | 24 | 33 |
上表格展示各单元格的期望频数,上表格可以看到,非预防组阳性的期望频数为3.0<5,并且总样本量为33,因而本案例数据使用fisher卡方检验量较为适合。
上表格展示实际频数,并且可通过下拉选择切换展示效果,按频数或者按百分比展示。
涉及以下几个关键点,分别如下:
如果希望进行卡方多重比较等,需要使用SPSSAU医学研究模块里面的卡方检验功能;
如果总样本量大于200时,此时SPSSAU不提供fisher卡方检验量,但依旧提供perason统计量和连续校统计量。