Fisher卡方

  • 卡方检验研究数据的独立性,在分析样本量较少(比如小于40),也或者期望频数出现小于5时,此时使用fisher卡方检验较为适合。SPSSAU医学研究模块中的卡方检验时,有提供2*2即4表格时提供fisher卡方检验p 值,但当为R*C结构时,也或者为汇总表格数据时,可使用fisher卡方按钮单独进行计算。

    fisher卡方理论依据为超几何分布,其利用排列的数学原理进行计算,在样本量较大计算量非常大,并且fisher卡方基本上均是针对小样本量数据进行计算,因而SPSSAU在总样本量大于200时依旧不提供fisher卡方检验值。

    • 特别提示:
    • SPSSAU系统中共有3处(包括通用方法->交叉卡方,医学研究->卡方检验,医学研究->fisher卡方)提供pearson卡方检验值;

    • SPSSAU系统中共有2处(医学研究->卡方检验,此处仅提供2*2时fisher卡方检验值,医学研究->fisher卡方)提供fisher卡方检验。

Fisher卡方检验案例

  • 1、背景

    当前有一项HBV感染医学研究,并被试分为预防组和非预防组,共两组,并且记录阳性和阴性的数据,汇总如下表,似问两组数据HBV感染率有无差别?数据如下:

    组别 阳性 阴性 总计
    预防组 4 18 22
    非预防组 5 6 11
    总计 9 24 33
  • 2、理论

    Fisher卡方检验利用超几何分布原理进行计算,共不同与pearson卡方检验会提供卡方值和p 值两项。Fisher卡方检验时仅提供p 值。SPSSAU在医学研究模块->卡方检验方法中提供2*2时卡方检验,如果是汇总表格格式,也或者R*C结构时,可使用fisher卡方按钮完成计算。

  • 3、操作

    本案例操作如下,A1单元格一定要空着,并且放入的数据不包括合计数据,如下图:

  • 4、SPSSAU输出结果

    SPSSAU共输出3个表格,如下说明:

    说明
    检验统计量 展示fisher卡方、pearson卡方和连续校正卡方统计量
    期望频数 展示期望频数,辅助判断是否使用fisher卡方的必要性
    实际频数 展示实际频数且提示百分比展示切换查看,便于查看数据
  • 5、文字分析

    检验统计量
    检验 卡方值
    Fisher卡方 - 0.121
    Pearson卡方 2.750 0.097
    连续校正卡方 1.547 0.214

    上表格展示出fisher卡方、pearson卡方和连续校正卡方统计量,从上表可知:fisher卡方时仅提供p 值,而且从pearson卡方和连续校正卡方对应的p 值来看,3个值均呈现出一致性结论即:预防组与非预防组时HPV感染情况无明显差异。

    • 特别提示:
    • 通常情况下:如果总样本量>40且期望频数值全部均大于5时,一般使用pearshon卡方值,如果总样本量大于40,但出现期望频数小于5的单元格时,可优先使用连续校正卡方,也或者使用fisher卡方值,如果总样本量小于40,也或者出现期望频数小于1的单元格时,此时建议使用fisher卡方检验。具体以文献为准即可,可能不同文献的标准不完全一致。

    期望频数
    阳性 阴性 总计
    预防组 6.0 16.0 22
    非预防组 3.0 8.0 11
    总计 9 24 33

    上表格展示各单元格的期望频数,上表格可以看到,非预防组阳性的期望频数为3.0<5,并且总样本量为33,因而本案例数据使用fisher卡方检验量较为适合。

    上表格展示实际频数,并且可通过下拉选择切换展示效果,按频数或者按百分比展示。

  • 6、剖析

    涉及以下几个关键点,分别如下:

    • 如果希望进行卡方多重比较等,需要使用SPSSAU医学研究模块里面的卡方检验功能;

    • 如果总样本量大于200时,此时SPSSAU不提供fisher卡方检验量,但依旧提供perason统计量和连续校统计量。