双重差分DID(倍差法)

双重差分(Differences-in-Differences,DID),其常用于政策评估效应研究,比如研究‘鼓励上市政策’,‘开通沪港通’,‘开通高铁’,‘引入新教育模式’等效应时,分析效应带来的影响情况。

比如:两类地区A和B,在2020年A类地区没有开通高铁,B类地区开通高铁。那么开通高铁对于GDP的影响情况如何呢?涉及两个关键数据,分别是Treated和Time,此处Treated为地区(A和B两个地区),以及时间项Time(高铁开通前和开通后)。同时研究‘开通高铁’参于gdp的影响,那么被解释变量Y即为gdp,与此同时还涉及可选的控制变量(控制变量为可选项,多数情况下并不需要),比如教育投入,人口或对外投资情况等,如下表说明。

说明
Treated 地区(0代表A类地区即控制组,1代表B类地区即实验组)
Time 开通高铁前后(0代表开通前, 1代表开通后)
Y gdp
控制变量 教育投入,人口,对外投资等
  • 特别提示
  • Treated只能为数字0或1,且一定包括此2个数字。其用于标识研究‘效应’对应的组别,数字0标识‘控制组’,数字1标识‘实验组’,一定需要这样处理。

  • Time只能为数字0或1,且一定包括此2个数字。其用于标识研究‘时间’对应的组别,数字0标识‘before’(实验前),数字1标识‘after(实验后),一定需要这样处理。

理论上,双重差分研究可在很大程度上避免数据内生性问题。‘政策效应’通常为外生项,因而不存在双向因果关系,比如开通高铁影响gdp,gdp同时影响开通开通。与此同时,双重差分也有着一定的前提性要求,通常其希望满足‘平行趋势假设’(Parallel Trend Assumption),即time项为0时,即比如开通高铁前,A类和B类两类地区的gdp数据需要无明显的差异性。

至于‘平行趋势假设’(共同趋势)的检验,其有多种检验方式。包括t 检验法,‘交叉项’显著性检验法,F 统计量检验法,图示法。具体说明如下:

平行趋势检验方式 思想说明 检验
t 检验法(较严格) SPSSAU默认提供,使用t 检验法,研究before时,treated与被解释变量Y的差异性 如果没有呈现出显著性(一般以P>0.05或0.1作为标准),则说明满足‘平行趋势假设’。反之说明不满足‘平行趋势假设’。
交互项显著性检验法(较严格) 将时间项作哑变量后,将实验前时间项哑变量与treated分别作交互项(比如实验前有5年,那么就有5个交互项),然后做普通线性回归(或ols回归),被解释变量为Y,自变量为5个交互项。最后分别判断5个交互项的显著性。 如果说交互项没有呈现出显著性(理论上希望5个交互项均不显著,实际上大部分不显著即可),则说明满足‘平行趋势假设’。反之说明不满足‘平行趋势假设’。
F 统计量检验法(较严格) 与交互项显著性检验法的思想一致,但使用F 统计量进行检验。 如果说F 统计量没有呈现出显著性(一般以P> 0.1作为标准),则说明满足‘平行趋势假设’。反之说明不满足‘平行趋势假设’。
图示法(使用较多) 横坐标为时间,纵坐标为被解释变量Y(比如gdp),并且展示control/treated两组的被解释变量Y平均值情况,可使用SPSSAU的簇状图完成。 直观查看‘效应’前,两组数据是否有着差异性。如果直观判断没有明显差异,则说明满足‘平行趋势假设’。反之说明不满足‘平行趋势假设’。

针对‘交互项显著性检验法’或‘F 统计量检验法’,时间项可能仅为2期(实验前和实验后),也可能为多期m期(m>2),那么哑变量设置后,放入分析的交互项为‘实验前时的交互项’,如下表说明:

时间项期数 例子 交互项(实验前时间项哑变量*treated)
2期(实验前和实验后) 实验前和实验后 仅1项
3期(实验前为2期,实验后为1期) 实验时间点2020年,有2018/2019和2021共3年数据 仅2项(因为实验前时间项为2项),dummy2018*treated,dummy2019*treated
4期(实验前为2期,实验后为2期) 实验时间点2020年,有2018/2019和2021/2022共4年数据 仅2项(因为实验前时间项为2项), dummy2018*treated,dummy2019*treated

关于哑变量说明点击查看 https://www.spssau.com/helps/otherdocuments/dummy.html

如果是使用t 检验法,SPSSAU在进行DID分析时默认有提供,如果是使用‘交互项显著性检验法’或者‘F 统计量检验法’,可先将时间项作哑变量处理后,与treated项作交互项,然后进行线性回归(SPSSAU通用方法里面的线性回归或计量研究里面的OLS回归均可)。如果是使用‘图示法’,则使用SPSSAU可视化->簇状图完成。

关于使用SPSSAU簇状图查看平行趋势,其适用于多期数据(即有多年的数据),类似操作如下图所示:

簇状图结果如下图:比如2016年是政策点,2016年以前实验组和控制组的“数据走势情况”大体一致则说明满足平行性趋势,图示法比较直观但有一定主观性,通常情况下只要政策点之前的数据走势大致一致即可。

双重差分DID案例

  • 1、背景

    某地区(实验组,B地区)通过法律将最低工资从每小时4.25美元提高到5.05美元,但相邻的另一地区(控制组,A地区)保持不变。某研究人员收集实施新法律前后就业人数数据,使用DID差分法进行研究‘提高最低工资’是否有助于‘就业人数增加’,即提高最低工资是否会提升民众的就业积极性。

    此案例时:treated为地区(数字0为控制组即A地区,数字1为实验组即B地区)。Time为时间(数字0为法律实施前,数字1为法律实施后)。研究的效应项即被解释变量Y为‘就业人数’。与此同时还有另外3个控制变量。

  • 2、理论

    • 双重差分法DID,其通常用于政策效应类研究。共涉及两项,分别是实验组别treated(数字0表示控制组,数字1表示实验组),和时间项time(数字0表示实验前,数字1表示实验后)。一般希望在实验前即time为0时,实验组别数据基本保持一致性,即满足‘平行趋势假设’。‘平行趋势假设’检验有多种方式,建议查看本页面中相关说明。

    • 比如本案例可使用SPSSAU的簇状图进行‘平行趋势假设’查看,如下图可以看到,实验前时两个组别的‘从业人数’即效应水平基本完全一致,说明满足‘平行趋势假设’,因而可以继续分析,当然也可使用实验前时,控制组和实验组效应值的差异情况进行检验,SPSSAU默认有提供。

  • 3、操作

    本案例操作截图如下,案例中带3个控制变量,如果没有控制变量可直接不放入即可,如下:

  • 4、SPSSAU输出结果

    SPSSAU共输出5类表格,分别是DID模型描述统计,DID模型结果汇总,t 检验(Before),t 检验(After),OLS回归分析结果。说明如下:

    表格名称 说明
    DID模型描述统计 汇总不同组别的样本量情况
    DID模型结果汇总 DID模型的结果表格
    t  检验(Before) 实验前时,控制组和实验组效应值差异对比
    t  检验(After) 实验后时,控制组和实验组效应值差异对比
    OLS回归分析结果 OLS回归展示DID结果,DID的实质性数学原理为OLS回归
  • 5、文字分析

    上表格展示不同实验组别,以及实验前后时的样本分布情况。本案例共有155个实验样本,77个为实验前,78个为实验后。

    上表格展示DID模型最终结果。分别包括实验前和实验后时,控制组或实验组的效应值水平(特别提示,效应值是一种量化指标,并非被解释变量从业人数的平均值(但通常接近于平均值),数学原理上其为ols回归的回归系数值)。

    上表格显示:在实验前before状态时,实验组和控制组的差分效应量为-0.611,并且没有呈现出显著性(p = -0.556>0.1),即说明实验前时,实验组和控制组的效应水平基本一致并没有明显的差异性,也即说明满足‘平行趋势假设’。

    实验后after状态时,实验组和控制组的差分效应量为2.324,并且呈现出显著性(p = 0.024 < 0.05),即说明在实验后时间点时,实验组的效应值明显高于控制组效应值。

    最终查看应该以diff-in-diff,即最终的双重差分值,上表格时,双重差分效应值为2.935且呈现出显著性(p = 0.045 < 0.05),也即说明双重差分效应显著,即说明‘提高最低工资’是否有助于‘就业人数增加’,提高的平均效应水平为2.935。

    上表格展示实验前状态时,控制组和实验组两类别下被解释变量或控制变量的差异情况。通常仅关注被解释变量的差异性即可,从上表格可知,控制组和实验组并没有呈现出显著性(p = 0.978 > 0.05),也即说明实验前时控制组和实验组的‘从业人数’并没有明显的差异性,即说明数据通过‘平行趋势假设’。

    上表格展示实验后状态时,控制组和实验组两类别下被解释变量或控制变量的差异情况。通常仅关注被解释变量的差异性即可,从上表格可知,控制组和实验组呈现出显著性(p = 0. 043 < 0.05),也即说明实验前时控制组和实验组的‘从业人数’呈现出明显的差异性,说明实验后状态下实验组和控制组的平均水平有着显著性差异,而且实验组(19.949)明显高于控制组(17.065)。

    上表格展示OLS回归结果,其为DID差分模型的数学原理,比如上表格中treate*time这一交互项的回归系数值为2.935即为‘DID模型结果汇总’表格中的Diff-in-Diff效应值。

  • 6、剖析

    涉及以下几个关键点,分别如下:

    • 如果为多期数据,比如实验前为2018/2019共2年数据,实验后为2021/2022共2年数据。那么需要处理成time为0和1,即实验前和实验后的数据格式;

    • Treated只能为数字0或1,且一定包括此2个数字。其用于标识研究‘效应’对应的组别,数字0标识‘控制组’,数字1标识‘实验组’,一定需要这样处理。

    • Time只能为数字0或1,且一定包括此2个数字。其用于标识研究‘时间’对应的组别,数字0标识‘before’(实验前),数字1标识‘after(实验后),一定需要这样处理。

    • ‘平行趋势假设’(共同趋势)的检验,其有多种检验方式。包括t 检验法,‘交叉项’显著性检验法,F 统计量检验法,图示法等,可查阅本页面上方说明。

疑难解惑

  • 提示某组合样本量不足?
  • DID共4种组合,即实验组别(control和treated)与实验时间点(before和after),共2*2=4种组合,每种组合一定要有数据才可以。