分组回归分析

线性回归是使用最为广泛的一种研究方法,其可用于研究X对于Y的研究。而分组回归是线性回归的拓展,其实质就是线性回归。比如研究X对于Y的影响,现在希望查看且对比不同组别(group,比如不同学历)时,X对于Y的影响是否有着不一致等。此种情况即称为分组回归。相当于比如先筛选出学历为本科以下的群体,做一次线性回归;再筛选出学历为本科的群体,做一次线性回归;接着筛选出学历为本科以上的群体,做一次线性回归。得到多次回归结果后,可以对比回归系数的差异性情况,进而研究影响关系的差异情况等。

    特别提示
  • 分组回归用于查看X对于Y的影响(线性回归)时,不同组别(group)情况下,X对于Y的影响差异情况;

  • 学术研究中,分组回归可用于研究调节作用。

分组回归案例

  • 1、背景

    当前有一项员工忠诚度的影响因素研究,人力资源部分使用问卷形式收集200份数据,并且得到3项因素,包括‘薪水’,‘福利’和‘同事关系’态度。现希望研究此3项因素对于员工忠诚度的影响情况,并且分析不同学历水平时,影响情况是否有着明显的差异。便于深入探究不同学历群体的差异性,针对不同学历群体提供建议措施。

  • 2、理论

    分组回归实质上就是线性回归,其可查看不同组别下X对于Y的影响情况。如果样本较少,分组回归会分散每个回归的有效样本量,建议每个组别样本量较多时使用。

    分组回归的实质目的在于查看不同组别时,X对于Y的影响差异。在进行分析时,通常会有两个步骤,第1步是查看X对于Y是否有影响关系;第2步是查看不同组别时X对于Y的影响差异情况。分析时可能出现以下情况,

    • 第1步显示所有组别时X对于Y没有影响(不显著,p 值大于0.05),那么第2步基本无意义。因为无论如何都是X对Y没有影响。

    • 第1步显示部分组别时X对于Y有影响,那么第2步研究差异情况,直接以某组别时X对Y有影响,某组别时X对Y无影响,作为研究结论(即有调节作用)。

    • 第1步显示所有组别时X对于Y有影响,那么第2步可查看影响关系,是否有着明显的差异,即都是影响关系,但是是否存在影响幅度的差异性(即调节作用)。如果说某组别下X对于Y有正向影响,某组别下X对于Y有负向影响,这种情况可直接描述影响方向即说明差异性。

    单独针对回归系数的差异性t 检验,其计算公式如下:

    公式中符号意义如下:

    • b 1和b 2分别表示某2个回归时分别的回归系数(非标准化);

    • SSE 1和SSE 2分别表示某2个回归时分别的残差平方和(该指标可在线性回归里面找到);

    • n 1和n 2分别表示某2个回归时分别的有效样本量;

    • SS 1和SS 2分别表示某X(在进行某组别回归时)的离差平方和(即真实值减去平均值后进行平方,再求和);

    • df 为自由度,n 值表示所有样本量(非某个组别下的样本量)。

      特别提示
    • 分组回归用于查看X对于Y的影响(线性回归)时,不同组别(group)情况下,X对于Y的影响差异情况;

    • 学术研究中,分组回归可用于研究调节作用。同时可使用进阶方法模块的分层回归,也或者SPSSAU系统问卷研究模块的调节作用。

  • 3、操作

    本例子研究3个X(‘薪水’,‘福利’和‘同事关系’态度)对于忠诚度的影响情况。学历作为分组组别,操作如下图:

  • 4、SPSSAU输出结果

    SPSSAU共输出3个表格,分别是‘分组回归模型’,‘回归系数差异检验’和‘分组回归模型简化格式’。

    分组回归模型分别列出整体不区分组别时的线性回归结果,以及区分不同组别时线性回归结果。回归系数差异检验针对某X时,回归系数(非标准化)的差异性t检验。‘分组回归模型简化格式’为‘分组回归模型’的简化格式。

  • 5、文字分析

    上表格列出整体所有样本的回归,以及区分本科以下,本科和本科以上3个组别时的回归结果。从上表可知,在不区别学历情况下,整体来看,薪水会正向影响到样本 的忠诚度。具体区分不同学历情况时,样本本科以下和本科水平时,薪水会正向影响忠诚度;本科以上水平时,薪水不会对忠诚度产生影响。即说明不同学历水平时,薪水对忠诚度的影响情况不一致。

    上表格展示‘薪水’,‘福利’和‘同事关系’分别对于忠诚度的影响,以及区分不同学历情况下时的回归系数差异情况。以及表格中加粗表示有显著影响。

    • 薪水对于忠诚度的影响,本科以下和本科时,薪水对忠诚度都有显著的正向影响,此时可对比此2个回归系数(0.459和0.312)的差异幅度(t =1.268,p =0.207>0.05),说明两个系数没有呈现出显著性差异,即本科以下,本科时,薪水对于忠诚都有正向影响,影响幅度并没有明显的差异。

    • 薪水对于忠诚度的影响,本科以上或本科时,薪水对忠诚度都有显著的正向影响,但是本科以上并没有影响。

    • 同事关系对于忠诚度的影响,本科以下或本科时,同事关系对忠诚度都有着正向影响(回归系数分别是0.290和0.649),而且影响幅度有着显著的差异(t =4.323,p =0.000< 0.01),说明同事关系对忠诚度有着正向影响,而且本科学历(相对本科以下时)这种影响幅度明显更大。

    • 同事关系对于忠诚度的影响,本科以下或本科时,同事关系都会对忠诚度有着正向影响,但是本科以上学历样本时,同事关系对忠诚度不会产生影响。

  • 6、剖析

    涉及以下几个关键点,分别如下:

    • 分组回归用于查看X对于Y的影响(线性回归)时,不同组别(group)情况下,X对于Y的影响差异情况;

    • 学术研究中,分组回归可用于研究调节作用。同时可使用进阶方法模块的分层回归,也或者SPSSAU系统问卷研究模块的调节作用。

疑难解惑

  • 某组别时X对Y有显著影响,但整体却显示X对Y没有影响?
  • 某组别有影响,但整体没有影响,通常是由于不同组别时X对Y的影响‘中和’掉,正常现象。

  • 所有组别时X对Y都有显著影响,但整体却显示没有影响?
  • 如果某组别时X对Y有正向或负向影响,这可能会‘中和’掉导致整体没有影响。

  • 邹志庄检验(chow test)?
  • 在SPSSAU计量研究的分组回归分析时,如果分组项的组别仅为2个时,默认会提供邹志庄检验(Chow Test)表格结果,如果组别个数超过2个时则无法提供(邹志庄检验的原理只针对2个组别时)。

  • 分组回归时回归系数差异性检验具体是?
  • SPSSAU针对分组回归系数进行差异性检验(下称Cohen & Cohen检验),参考文献如下: Cohen, J., & Cohen, P. (1983). Applied Multiple Regression/Correlation Analysis for the Behavioral Sciences (2nd ed.). Hillsdale, NJ: Lawrence Erlbaum.

  • SPSSAU进行分组回归时提示‘有效样本不足’?
  • 如果某个组别时的样本量小于X个数+2,此时不满足回归分析的前提条件因而无法分析,除此之外,分组回归最多支持12个组别。

  • 异质性检验?
  • 异质性检验用于研究不同样本群体(组别)是否有着差异性,通常使用分组回归时,将组别项放入分组框中,分析后对比核心研究变量的回归系数是否存在着显著性变化即可,如果没有显著性变化则说明不存在异质性,反之说明可能存在异质性。