如果研究人员想要考察不同的诊断方法是否在结果上具有一致性;也或者两个医生对于同一病例做出病情判断上是否具有一致性;两个医生对于MRI检验结果的一致性情况;也或者两个评委的打分一致性情况。诸如此类,如果想对比两次数据的一致性情况,此时则需要使用Kappa一致性检验。
Kappa一致性检验通常针对于定类数据;如果是定量数据的一致性,可考虑使用相关分析。Kappa一致性检验通常Kappa系数值衡量一致性水平。Kappa系数取值在0~1之间,通常情况下:Kappa <0.2则说明一致性程度较差;0.2~0.4之间说明一致性程度一般;0.4~0.6之间说明一致性程度中等;0.6~0.8之间说明一致性程度较强;0.8~1.0之间说明一致性程度很强。
Kappa一致性共分为两类:简单Kappa和加权Kappa系数;SPSSAU默认使用简单Kappa系数。二者的区别说明如下:
如果评价A、B两种方法对同一批样品的检验结果(轻度、中度、重度)的一致性;试想两种情景:A测试为轻度,而B测试为重度;也或者A测试为轻度,而B测试为中度;明显的,第1种情景时一致性水平会明显低于第2种情景。‘轻度’和‘重度’的距离,要远于‘轻度’和‘中度’的跨度距离。类似于此类数据,则需要使用加权kappa,加权kappa则考虑了上述中距离的远近。加权Kappa可细为线性和二次加权,如果是使用加权Kappa,一般是使用线性加权Kappa。
即简单总结:如果研究数据是绝对的定类数据,此时使用简单Kappa系数;如果数据为等级式定类数据(比如轻度,中度,重度;也或者不同意,中立,同意);此时可使用加权(线性)Kappa系数。
除此之外,如果希望对比2项以上的一致性,比如3个医生的诊断一致性,此时应该使用fleiss Kappa,下拉框选中该参数即可。
两个医生分别对于50个病例进行MRI检查;需要对比两名医生检查结果诊断的一致性水平;MRI检查诊断共分三个等级,分别是轻度,中度和重度。
Kappa一致性检验用于测量数据一致性水平。Kappa系数取值在0~1之间,通常情况下:Kappa <0.2则说明一致性程度较差;0.2~0.4之间说明一致性程度一般;0.4~0.6之间说明一致性程度中等;0.6~0.8之间说明一致性程度较强;0.8~1.0之间说明一致性程度很强。
Kappa一致性共分为两类:简单Kappa和加权Kappa系数;SPSSAU默认使用简单Kappa系数。二者的区别说明如下:
如果研究数据是绝对的定类数据,此时使用简单Kappa系数;如果数据为等级式定类数据(比如轻度,中度,重度;也或者不同意,中立,同意);此时可使用加权(线性)Kappa系数。
除此之外,如果希望对比2项以上的一致性,比如3个医生的诊断一致性,此时应该使用fleiss Kappa,下拉框选中该参数即可。
两个医生的MRI检查结果诊断分别会有三种结论,轻度,中度和重度,因此3*3共有9处组合;单独使用一列数据表示每种组合的数量(即权重),数据结构如下表(数字1表示轻度,2表示中度,3表示重度):
A医生 | B医生 | 权重(病例个数) |
1 | 1 | 8 |
1 | 2 | 2 |
1 | 3 | 0 |
2 | 1 | 0 |
2 | 2 | 17 |
2 | 3 | 3 |
3 | 1 | 0 |
3 | 2 | 5 |
3 | 3 | 15 |
上述结构中,A医生和B医生同时给出轻度为8例;同时给出中度为17例。同时给出重度为15例。其余均为不同的诊断结论,比如A医生诊断为轻度而B医生诊断为中度的病例为2例。
由于上述数据结构中使用‘权重’加权表示,因而在放置分析项时,应该将权重放在‘加权项’处,如下图所示:
如果说数据没有‘加权’,即共50个病例,总共50行;并且只有2列,分别表示A医生或者B医生的诊断结果;此时则没有加权数据,也不需要进行加权项放置。
Kappa系数结果表格 | ||||||
名称 | Kappa值 | 标准误(假定原假设) | z 值 | p 值 | 标准误 | 95% CI |
A医生 & B医生 | 0.684 | 0.103 | 6.611 | 0.000** | 0.091 | 0.505~0.862 |
Kappa一致性检验,事实上结论中仅Kappa值最重要,只需要用该值进行一致性水平判断。
具体文字分析例子如下:
从上表格可以看出,A医生和B医生对于50个病例MRI检验结果的一致性水平情况。MRI诊断分为三级分别是轻度,中度和生度。使用SPSSAU软件进行分析,从上表可以看到,检验结果呈现出显著性(z =6.611,p =0.00 <0.01),意味着Kappa系数值明显偏差0,说明具有一定的一致性水平;具体上看,Kappa系数值为0.684,介于0.6~0.8之间,意味着一致性水平较强;说明A医生和B医生对于MRI检查诊断结论上有着较强的吻合性。
Kappa一致性检验需要特别注意两点,分别是Kappa系数是否加权,以及数据结构。
如果数据为定类,则使用简单Kappa系数即可;如果数据为有等级的定类数据(比如轻度,中度和重度这类有等级区别的类别数据),此时使用加权Kappa系数(通常使用线性加权)。
数据结构中如果有权重,此时应该进行加权处理(分析时将权重项放入对应框中即可)。
除此之外,如果希望对比2项以上的一致性,比如3个医生的诊断一致性,此时应该使用fleiss Kappa,下拉框选中该参数即可。
关于‘加权数据格式’的详细说明参考:https://www.spssau.com/helps/otherdocuments/dataformat.html
如果说想对比2项以上的一致性(比如A疗法、B疗法、C疗法共3种疗法的一致性);此时应该使用Felsis Kappa系数。简单Kappa和加权Kappa系数均是针对2项(比如A疗法和B疗法)的一致性检验。
如果是进行fleiss Kappa,即放置项超过2项时,此时SPSSAU不支持‘加权项’这种数据格式。
进行kappa系数计算时可能会出现2个标准误值,分别是‘标准误(假定原假设)’和‘标准误’,‘标准误(假定原假设)’是用于进行检验原假设(kappa值为0)时使用;而‘标准误’值是用于计算95% CI值使用;如果目的在于检验则报告‘标准误(假定原假设)’,如果仅报告kappa值和95% CI,则报告‘标准误’值;通常情况下是报告‘标准误’值即可。
Fleiss Kappa值95%C = Fleiss Kappa值 +/– 1.95996398454005 * 标准误差 / n,n代表评价对象个数即行数。