Cochran's Q 检验是用于研究多相关样本数据是否呈现出显著性差异的一种研究方法。它的应用场景为M评价者对于N个选手(或对象,作品等)进行评价上是否呈现出差异性(也即多相关样本数据)。也或者针对问卷多选题数据是否存在差异进行研究。
Cochran's Q 检验时评分上只能为0和1,通常0代表不满意/不认可/不同意/不选择,1代表满意/认可/同意/选择。
在进行Cochran's Q 检验时,需要严格遵循数据格式才能得出正确的结果。比如当前有4任村长,它们针对10位村民的打分情况(1代表认可,0代表不认可);每个村长会对10位村民进行打分,即10位村民是相关样本数据(相当于行代表评价者,列代表评价对象即选手)。当前希望研究10位村民的得分上是否有明显差异性, SPSSAU支持的数据格式如下:
村长 | 村民1 | 村民2 | 村民3 | 村民4 | 村民5 | 村民6 | 村民7 | 村民8 | 村民9 | 村民10 |
村长1 | 0 | 1 | 1 | 0 | 0 | 1 | 1 | 1 | 1 | 1 |
村长2 | 1 | 1 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 |
村长3 | 0 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 1 |
村长4 | 0 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 1 | 0 |
数据格式为:1个评委为1行;1个评价对象即选手为1列; 4个评委(村长)10个评价对象选手(村民),因此共有4行和10列数据;
所有数字全部必须是0和1,上述例子中0代表不认可,1代表认可;在分析时:需要将对应的10列数据放入分析框中(是10列即10个标题)。
SPSSAU操作示例如下:
4任村长对10个村民对于进行评分,1分表示认可,0分表示不认可;现在研究村民的得分上是否有着明显的差异性,使用Cochran's Q 检验进行研究。数据格式如下:
村长 | 村民1 | 村民2 | 村民3 | 村民4 | 村民5 | 村民6 | 村民7 | 村民8 | 村民9 | 村民10 |
村长1 | 0 | 1 | 1 | 0 | 0 | 1 | 1 | 1 | 1 | 1 |
村长2 | 1 | 1 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 |
村长3 | 0 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 1 |
村长4 | 0 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 1 | 0 |
Cochran's Q 检验用于二值品质型数据的分析。如二分的评价:1代表认可,0代表不认可;其原假设是没有差异性。
第一步是分析显著性值,如果对应的p 值小于0.05,则说明具有差异性;如果对应的p 值大于0.05则说明完全没有差异性。
第二步可结合具体汇总数据和图形进一步分析。
本案例为4任村长对10个村民的评分数据(1分表示认可,0分表示不认可),共有10列相关数据分别表示10个村民得分,SPSSAU操作截图如下:
Cochran's Q 检验结果 | |||
样本量 | Cochran's Q 统计量 | df |
p |
4 | 5.727 | 9 | 0.767 |
* p <0.05 ** p <0.01 |
上表格中p 值为0.767>0.05,即说明10个村民的得分上并没有明显的差异性,即在村长眼里10个村民的表现基本一致没有明显的差异性。上表格中的样本量为4,事实上是表示4个评价者(当前案例中为4任村长)。Cochran's Q 统计量和df 值为中间过程值,其目的在于计算得到p 值。
频数分析结果 | ||||
频数 | 百分比 | |||
1 | 0 | 1 | 0 | |
村民1 | 1 | 3 | 25.00% | 75.00% |
村民2 | 3 | 1 | 75.00% | 25.00% |
村民3 | 2 | 2 | 50.00% | 50.00% |
村民4 | 1 | 3 | 25.00% | 75.00% |
村民5 | 2 | 2 | 50.00% | 50.00% |
村民6 | 3 | 1 | 75.00% | 25.00% |
村民7 | 2 | 2 | 50.00% | 50.00% |
村民8 | 2 | 2 | 50.00% | 50.00% |
村民9 | 3 | 1 | 75.00% | 25.00% |
村民10 | 3 | 1 | 75.00% | 25.00% |
上表格展示出具体10个村民的得分情况,比如村民1为1个认可3个不认可;村民2为3个认可和1个不认可。
具体文字分析例子如下:
本研究数据涉及4任村长对10个村民进行打分,1分表示认可,0分表示不认可。使用SPSSAU软件进行分析,利用Cochran's Q 检验方法进行研究,从上表可以看到,检验结果呈现出显著性(Cochran's Q =5.727,p =0.767>0.05),意味着10个村民得分并不具有差异性,即村民的表现在4任村长眼里整体上看是一样,没有明显差异。
Cochran's Q检验需要特别注意数据结构。1个评委为一列,1个被评价者为1行数据。比如10个评委对于4个选手打分,最终需要将10列标题数据放入SPSSAU进行分析。同时Cochran's Q检验研究的数据一定只能是数字0和1,通常情况下0代表不满意/不认可/不同意/不选择,1代表满意/认可/同意/选择。
如果是多选题进行Cochran's Q 检验,其实际意义是研究多选题选项的选择比例是否有着明显的差异。一行代表一个样本,一个样本针对多选题的几个选项进行打分(数字1表示选中,数字0表示没有选中),这种即为多相关数据。相当于一行(一个样本)代表一个评价者,一列代表一个评价对象(选手)。一个评价者同时对‘多个评价对象’进行打分。