Friedman检验(弗里德曼检验),用于检测多个(相关)样本是否具有显著性差异的统计检验,它是一种非参数检验方法。
编号 | 研究方法 | 功能 | 目的 |
---|---|---|---|
1 | Friedman检验 | 研究多相关样本差异性 | 多相关数据差异性 |
2 | Cochran's Q 检验 | 研究多相关样本(且为二分类数据)差异性 | 多相关(且为二分类数据)样本差异性 |
3 | Kendall协调系数 | 研究多相关样本一致性 | 打分评价一致性情况等 |
如果是多相关样本,并且目的在于研究差异性,则有Friedman检验和Cochran's Q 检验两项可用,但特别提示一点,Cochran's Q 检验涉及的数据一定是二分类(即1和0这样的数据);如果是研究多相关样本的一致性情况,则可使用Kendall协调系数。
针对一致性研究,除Kendall协调系数外,Kappa系数也用于测量一致性。从分析角度上看,二者无法通用,因为二者的数据格式不一样,但二者功能上一致而且容易混淆,它们间的联系和区别如下(共3点):
Kendall协调系数是针对多样本一致性情况,而Kappa系数只针对配对数据一致性情况;
Kappa系数更加强调一致性情况,而Kendall协调系数相对更强调关联关系程度(关联性越强,也可理解为一致性越强);
使用场景上,Kappa系数在医学相关领域使用相对较多,而Kendall在其它社会科学研究中使用较多,尤其是用于评价一致性时。
当前新出一款激光测量身高的仪器,现希望测试仪器的差异性情况。找好15个身高基本都均是1.7米左右的学生进行测试,并且让仪器分别测量3次,最终得到15行3列的数据。由于3次数据具有相关性,因而需要使用多样本Friedman检验进行分析差异关系。数据结构如下:
编号 | 第1次身高 | 第2次身高 | 第3次身高 |
1 | 1.66 | 1.660 | 1.700 |
2 | 1.61 | 1.600 | 1.610 |
3 | 1.72 | 1.720 | 1.750 |
4 | 1.71 | 1.710 | 1.660 |
5 | 1.68 | 1.700 | 1.720 |
6 | 1.73 | 1.690 | 1.730 |
7 | 1.75 | 1.740 | 1.760 |
8 | 1.73 | 1.760 | 1.730 |
9 | 1.69 | 1.720 | 1.660 |
10 | 1.74 | 1.760 | 1.700 |
11 | 1.69 | 1.710 | 1.640 |
12 | 1.61 | 1.570 | 1.610 |
13 | 1.77 | 1.800 | 1.750 |
14 | 1.71 | 1.710 | 1.710 |
15 | 1.68 | 1.690 | 1.710 |
多样本Friedman检验是对多个相关样本(至少3个)的差异性进行研究。且是针对定量数据进行研究。
多样本Friedman检验的分析共分为两步;第一步是分析显著性值,如果对应的p 值小于0.05,则说明具有差异性;如果对应的p 值大于0.05则说明完全没有差异性。第二步可结合具体数据进一步分析。
本案例为15个学生样本,并且每个学生样本得到3次仪器测量数据,SPSSAU操作截图如下:
多样本Friedman分析结 | ||||
名称 | 样本量 | 中位数 | 统计量 |
p |
第1次身高 | 15 | 1.710 | 0.286 | 0.867 |
第2次身高 | 15 | 1.710 | ||
第3次身高 | 15 | 1.710 | ||
* p <0.05 ** p <0.01 |
上表格中p 值为0.867>0.05,即说明3次测量结果上并不会呈现出显著性差异,而且具体对比中位数可以看出,整体上看第一次测量身高中位数为1.710,第二次也是1.710,第三次还是1.710,因而说明三次测量结果并没有显著性差异。上表格中的样本量为15代表有15个样本。统计量中间过程值,其目的在于计算得到p 值。
非参数检验的原理上是看“秩”,即相对排名进行对比。因而如果需要对比差异情况等,一般是针对中位数进行描述,而非平均值。如果说p 值小于0.05显著有差异,但中位数却完全一样;也或者 p 值大于0.05没有显著差异,但中位数却差别很大,这两种情况在现在中是存在,出现此两种情况时则可考虑使用平均值。
具体文字分析例子如下:
本研究数据涉及15身高基本在1.7左右的学生样本,并且使用同一台身高测量仪器,分别进行三次测量,现希望通过数据分析研究测量仪器的结果是否有差异性。使用SPSSAU软件进行分析,利用多样本Friedman检验方法进行研究,从上表可以看到,检验结果呈现出显著性(统计量=0.286,p =0.867>0.05),意味着三次测量结果并不具有差异性,即身高测量仪器三次测量结果没有明显的差异,也即说明测量仪器结果准确无误。
Friedman检验需要特别注意数据结构。列代表相关性样本,行代表样本。正如本案例中3次代表同一台仪器3次测量结果,也可能是同一个人的3个测量部位,诸如此类均为相关样本数据。
1.如果进行实验,随机区组设计(多配对样本)时需要使用Freideman检验方法;
2.如果检验显示具有差异性,则时可继续使用Nemenyi两两比较进行研究【具体这里的多重比较为Nemenyi方法多重比较】,选中“Nemenyi两两比较”即可输出;
3.Freideman检验的原理在于对比数据分布情况的差异性,数据分布情况通过箱线图体现,同时也可使用中位数表示数据分布情况(SPSSAU默认建议使用中位数值);有时候会出现一种情况即“显示有差异性,但是中位数值却一样显示没有差异”,此时可使用箱线图查看差异(而不使用中位数)。