多样本Friedman检验

  • Friedman检验(弗里德曼检验),用于检测多个(相关)样本是否具有显著性差异的统计检验,它是一种非参数检验方法。

  • 当数据为多相关时,会涉及到多种检验方法,包括Friedman检验,Kendall协调系数,Cochran检验等,下表格详细列出区别:

    编号 研究方法 功能 目的
    1 Friedman检验 研究多相关样本差异性 多相关数据差异性
    2 Cochran's Q 检验 研究多相关样本(且为二分类数据)差异性 多相关(且为二分类数据)样本差异性
    3 Kendall协调系数 研究多相关样本一致性 打分评价一致性情况等

    如果是多相关样本,并且目的在于研究差异性,则有Friedman检验和Cochran's Q 检验两项可用,但特别提示一点,Cochran's Q 检验涉及的数据一定是二分类(即1和0这样的数据);如果是研究多相关样本的一致性情况,则可使用Kendall协调系数。

    针对一致性研究,除Kendall协调系数外,Kappa系数也用于测量一致性。从分析角度上看,二者无法通用,因为二者的数据格式不一样,但二者功能上一致而且容易混淆,它们间的联系和区别如下(共3点):

    • Kendall协调系数是针对多样本一致性情况,而Kappa系数只针对配对数据一致性情况;

    • Kappa系数更加强调一致性情况,而Kendall协调系数相对更强调关联关系程度(关联性越强,也可理解为一致性越强);

    • 使用场景上,Kappa系数在医学相关领域使用相对较多,而Kendall在其它社会科学研究中使用较多,尤其是用于评价一致性时。

多样本Friedman检验案例

  • 1、背景

    当前新出一款激光测量身高的仪器,现希望测试仪器的差异性情况。找好15个身高基本都均是1.7米左右的学生进行测试,并且让仪器分别测量3次,最终得到15行3列的数据。由于3次数据具有相关性,因而需要使用多样本Friedman检验进行分析差异关系。数据结构如下:

    编号 第1次身高 第2次身高 第3次身高
    1 1.66 1.660 1.700
    2 1.61 1.600 1.610
    3 1.72 1.720 1.750
    4 1.71 1.710 1.660
    5 1.68 1.700 1.720
    6 1.73 1.690 1.730
    7 1.75 1.740 1.760
    8 1.73 1.760 1.730
    9 1.69 1.720 1.660
    10 1.74 1.760 1.700
    11 1.69 1.710 1.640
    12 1.61 1.570 1.610
    13 1.77 1.800 1.750
    14 1.71 1.710 1.710
    15 1.68 1.690 1.710
  • 2、理论

    多样本Friedman检验是对多个相关样本(至少3个)的差异性进行研究。且是针对定量数据进行研究。

    多样本Friedman检验的分析共分为两步;第一步是分析显著性值,如果对应的p 值小于0.05,则说明具有差异性;如果对应的p 值大于0.05则说明完全没有差异性。第二步可结合具体数据进一步分析。

  • 3、操作

    本案例为15个学生样本,并且每个学生样本得到3次仪器测量数据,SPSSAU操作截图如下:

  • 4、SPSSAU输出结果

    多样本Friedman分析结
    名称 样本量 中位数 统计量

    p

    第1次身高 15 1.710 0.286 0.867
    第2次身高 15 1.710
    第3次身高 15 1.710
    * p <0.05 ** p <0.01

    上表格中p 值为0.867>0.05,即说明3次测量结果上并不会呈现出显著性差异,而且具体对比中位数可以看出,整体上看第一次测量身高中位数为1.710,第二次也是1.710,第三次还是1.710,因而说明三次测量结果并没有显著性差异。上表格中的样本量为15代表有15个样本。统计量中间过程值,其目的在于计算得到p 值。

    • 特别说明
    • 非参数检验的原理上是看“秩”,即相对排名进行对比。因而如果需要对比差异情况等,一般是针对中位数进行描述,而非平均值。如果说p 值小于0.05显著有差异,但中位数却完全一样;也或者 p 值大于0.05没有显著差异,但中位数却差别很大,这两种情况在现在中是存在,出现此两种情况时则可考虑使用平均值。

  • 5、文字分析

    具体文字分析例子如下:

    本研究数据涉及15身高基本在1.7左右的学生样本,并且使用同一台身高测量仪器,分别进行三次测量,现希望通过数据分析研究测量仪器的结果是否有差异性。使用SPSSAU软件进行分析,利用多样本Friedman检验方法进行研究,从上表可以看到,检验结果呈现出显著性(统计量=0.286,p =0.867>0.05),意味着三次测量结果并不具有差异性,即身高测量仪器三次测量结果没有明显的差异,也即说明测量仪器结果准确无误。

  • 6、剖析

    Friedman检验需要特别注意数据结构。列代表相关性样本,行代表样本。正如本案例中3次代表同一台仪器3次测量结果,也可能是同一个人的3个测量部位,诸如此类均为相关样本数据。

疑难解惑

  • 关于多重比较问题?
  • 1.如果进行实验,随机区组设计(多配对样本)时需要使用Freideman检验方法;

  • 2.如果检验显示具有差异性,则时可继续使用Nemenyi两两比较进行研究【具体这里的多重比较为Nemenyi方法多重比较】,选中“Nemenyi两两比较”即可输出;

  • 3.Freideman检验的原理在于对比数据分布情况的差异性,数据分布情况通过箱线图体现,同时也可使用中位数表示数据分布情况(SPSSAU默认建议使用中位数值);有时候会出现一种情况即“显示有差异性,但是中位数值却一样显示没有差异”,此时可使用箱线图查看差异(而不使用中位数)。