当X为定类数据,Y为定量数据时,通常使用的是方差分析进行差异研究。X的个数为一个时,我们称之为单因素方差;X为2个时则为双因素方差;X为3个时则称作三因素方差,依次下去。当X超过1个时,统称为多因素方差。
在实验研究中,比如研究者测试某新药对于胆固醇水平是否有疗效;研究者共招募72名被试,男女分别为36名,以及男女分别再细分使用新药和普通药物;同时高血压患者对于新药可能有干扰,因而研究者将被试是否患高血压也纳入考虑范畴中。因而最终,X共分为三个,分别是药物(旧药和新药)、性别,是否患高血压;Y为胆固醇水平。因而需要进行三因素方差分析即多因素方差分析。
对于双因素方差,三因素方差分析;SPSSAU单独提供研究方法,并且提供更多指标输出比如交互效应或图形等;
如果是实验研究,建议使用双因素,或者三因素方差分析等;
针对X超过3个时,只能直接使用多因素方差分析;
X均为定类数据,Y为定量数据。
多因素方差分析结果 | ||||
平方和 | df | F | p | |
截距 | 511.325 | 1 | 4397.621 | 0.000** |
性别 | 0.340 | 1 | 2.925 | 0.092 |
是否高血压 | 7.825 | 1 | 67.300 | 0.000** |
药物 | 0.824 | 1 | 7.091 | 0.010** |
残差 | 7.907 | 68 | null | null |
R 2=0.547 |
某研究者测试新药对于胆固醇水平是否有疗效;研究者共招募72名被试,男女分别为36名,以及男女分别再细分使用新药和普通药物;同时高血压患者对于新药可能有干扰,因而将被试是否患高血压也纳入考虑范畴中。最终X共分为三个,分别是药物(旧药和新药)、性别,是否患高血压;Y为胆固醇水平。
多因素方差分析,通常用于实验研究,如果某个X呈现出显著性,此时可接着使用单因素方差分析或者事后多重比较,继续对比具体差异情况。
对于双因素方差,三因素方差分析;SPSSAU单独提供研究方法,并且提供更多指标输出比如交互效应或图形等;
如果是实验研究,建议使用双因素,或者三因素方差分析等;
针对X超过3个时,只能直接使用多因素方差分析;
X均为定类数据,Y为定量数据。
本例子中研究3个X对于Y的差异;X分别性别,是否高血压和药物,Y为‘胆固醇水平’,SPSSAU放置如下:
多因素方差分析结果 | ||||
平方和 | df | F | p | |
截距 | 511.325 | 1 | 4397.621 | 0.000** |
性别 | 0.340 | 1 | 2.925 | 0.092 |
是否高血压 | 7.825 | 1 | 67.300 | 0.000** |
药物 | 0.824 | 1 | 7.091 | 0.010** |
残差 | 7.907 | 68 | null | null |
R 2=0.547 |
上表中,R 2值为0.547,意味着性别, 是否高血压, 药物共三项解释胆固醇水平的54.66%变异。研究重点在于药物对于胆固醇水平的帮助,在这里药物呈现出0.05水平的显著性(F =7.091,p =0.010 <0.05),意味着旧药和新药在胆固醇水平上有着显著性差异。具体显著性差异情况,可继续使用单因素方差分析进行探究,以了解新药对于胆固醇水平是否有帮助 。
除此之外,性别并没有呈现出显著性(F =2.925,p =0.092>0.05),是否高血压这项呈现出显著性(F =67.300,p =0.000 <0.05),具体也可以使用单因素方差深入探究是否高血压被试在胆固醇水平上的差异性。
同第4点
对于双因素方差,三因素方差分析;SPSSAU单独提供研究方法,并且提供更多指标输出比如交互效应或图形等;
如果是实验研究,建议使用双因素,或者三因素方差分析等;
针对X超过3个时,只能直接使用多因素方差分析;
X均为定类数据,Y为定量数据。
当前计算均方平方和,算法处理上SPSSAU默认为III型平方和。
通常建议使用Bonferroni校正法较优。如果各组别样本不同时可使用scheffe,如果各组别样本完全相同可使用tukey法等。具体可参考此页面 https://www.spssau.com/helps/advancedmethods/posthosmultiplecomparisons.html
单独进行事后多重比较(进阶方法->事后多重比较法)时,模型实质上为单因素方差,仅考虑1个X的情况,标准误差的计算并不一致,因此结果会不一致,但通常情况下结论会保持一致;以及此处事后多重比较使用的是边际估计均值(偏最小二乘均值)与一般意义上的平均值有所区别,类似于SPSS软件的EMMEANS功能。
在进行事后多重比较时计算的‘均值差值’是基于‘边际估计均值’进行计算,实验研究中,如果为平衡数据,则‘边际估计均值’与平均值完全一样,如果为非平衡数据,‘边际估计均值’为平均值的‘矫正’,其更为科学和准确;通常来看,‘边际估计均值’和平均值应该非常接近,因为它们的测量意义完全一致。
如果选中‘效应量’,则SPSSAU会在方差检验表格中输出偏Eta方(Partial η2),偏Eta方表示效应量大小时,通常情况下效应量小、中、大的区分临界点分别是:0.01,0.06和0.14。与此同时,事后多重表格中会提供cohen d 这一效应量值,通常情况下Cohen's d 值表示效应量大小时,效应量小、中、大的区分临界点分别是:0.20,0.50和0.80。