相关分析用于研究两两变量之间的关系情况,如果有第三个变量,它会影响到这种关系情况,从而导致相关系数无法真实有效地反映变量间的关系情况,比如研究身高与肺活量之间的关系,是否身高越高,肺活量越大呢?如果直接进行相关分析,会出现有相关关系,但真实结论很可能并不应该这样,同样身高的人肺活量很可能明显不一样,原因是体重并不一样。身高与体重有相关性,而肺活量也与体重有相关性。因此研究身高与肺活量的关系时,体重会有干扰作用,因此在研究时应该将体重作为控制变量,以防止其干扰。类似这样的相关关系研究,就应该使用偏相关分析。
另外如果研究工资与受教育年限的关系时,年龄和工作经验也应该是控制变量,因为年龄和工作经验,分别均与工资或受教育年限之间有着相关关系。类似这样的研究时,均需要使用偏相关分析(将控制变量纳入考虑范畴内),才能得到更加科学的结论。
控制变量是指同时与相关分析的两个变量,很可能均有着相关关系的变量。
当前某研究人员想研究员工受教育年限与当前工资之间的关系,以及每个员工的入职工资会起着干扰作用,入职工资与受教育年限有关系,同时入职工资与当前工资也有着相关关系。受教育年限会影响入职工资,入职工资还会影响到当前工资。因此研究受教育年限与当前工资的相关有关系时,需要将入职工资作为控制变量纳入考虑范畴内。
偏相关分析是在相关分析基础上,进一步考虑干扰因素时使用的研究方法。此干扰因素,也称其为“控制变量”,控制变量一般与相关分析的变量之间均有着相关关系,如果控制变量与相关分析的变量之间并没有关系,那么就不会有干扰作用。SPSSAU在偏相关分析输出结果时,默认会输出控制变量分别与相关分析变量之间的相关关系系数,便于考察某项是否为真正的控制变量。
如果明知道某项具有干扰作用但是不作控制,可能无法得到科学的结论。
本例子研究当前工资与受教育年限的关系情况,将入职工资作为控制变量纳入分析中,便于控制入职工资对分析的干扰影响。操作如下图:
SPSSAU共输出2个表格,分别是研究变量之间的相关关系,控制变量与研究变量之间的相关关系表格,分别如下:
偏相关分析结果 | ||||
平均值 | 标准差 | 当前工资 | 受教育年限 | |
当前工资 | 36471.750 | 18634.744 | 1 | |
受教育年限 | 13.765 | 2.818 | 0.327** | 1 |
* p < 0.05 ** p < 0.01 |
分析项和控制变量相关分析结果 | ||
当前工资 | 受教育年限 | |
入职工资 | 0.894** | 0.624** |
* p < 0.05 ** p < 0.01 |
偏相关分析结果 | ||||
平均值 | 标准差 | 当前工资 | 受教育年限 | |
当前工资 | 36471.750 | 18634.744 | 1 | |
受教育年限 | 13.765 | 2.818 | 0.327** | 1 |
* p < 0.05 ** p < 0.01 |
本次研究工资与受教育年限之间的与受教育年限的关系情况,将入职工资作为控制变量纳入分析中,便于控制入职工资对分析的干扰影响。从上表可以看出,当前工资与受教育年限之间的相关系数为0.327,并且呈现出0.01水平的显著性(p < 0.01),说明二者之间有着比较紧密的正向相关关系。
分析项和控制变量相关分析结果 | ||
当前工资 | 受教育年限 | |
入职工资 | 0.894** | 0.624** |
* p < 0.05 ** p < 0.01 |
从上表可以看到:入职工资与当前工资之间有着非常紧密的正相关关系,相关系数值高达0.894,而且入职工资与受教育年限之间的相关系数值为0.624,说明二者之间有着紧密的正向相关关系。也即说明入职工资分别与当前工资,受教育年限之间有着紧密的正相关关系,入职工资作为控制变量纳入分析中较为合适,并且起到控制作用。
本例子中,如果不将入职工资作为控制变量纳入考虑范畴内,而直接进行相关分析,显示为:当前工资与受教育年限之间的相关系数值为0.672(非常紧密的正相关关系),明显高于偏相关分析时的0.327(一般相关),本身受教育年限与当前工资之间的相关关系一般,但是却显示为非常紧密的相关关系,结论不准确。
涉及以下几个关键点,分别如下:
控制变量是指同时与相关分析的两个变量,很可能均有着相关关系的变量;
如果明知道某项具有干扰作用但是不作控制,可能无法得到科学的结论。