单位根检验可用于检验时间序列是否存在单位根,如果存在单位根就说明为非平衡时间序列。如果存在单位根即时间序列数据不平稳,通常不能进行后续的分析比如ARIMA模型。此时可通过对数据进行差分,差分即相减的意思,比如2019年的数据减去2018年的数据,一阶差分其实就是增长的意思。二阶差分是在一阶差分的基础上再次进行差分,物理意义相当于加速度。如果二阶差分依旧不平稳,那说明数据比较糟糕,通常不会再进行进一步差分,因为其已经失去实际意义。
SPSSAU默认会自动进行单位根检验并且提供建议,如果原始数据序列不平稳,SPSSAU默认会进行一阶差分并且检验单位根,如果一阶差分依旧不平稳,SPSSAU会进行二阶差分并且检验。如果二阶差分依旧不平稳,SPSSAU则最终以二阶差分为结点。
如果研究人员自行设置差分阶数,SPSSAU则按照研究人员设置进行检验。
SPSSAU默认会智能分析单位根检验,如果原始数据存在单位根,SPSSAU则进行一阶差分并且检验单位根,如果一阶差分存在单位根,SPSSAU则会进行二阶差分并且检验单位根,并且以二阶差分结果作为终点。
如果研究人员自行设置差分阶数或者检验类型(通常不需要设置),SPSSAU默认以研究人员设置进行单位根检验。
当前已经有阿里“双十一”历年(2009~2019年)的销售数据(时间序列数据),现希望对数据平稳性情况进行检验。数据如下:
年份 | 阿里双十一销售额(亿元) |
2009 | 0.5 |
2010 | 9.36 |
2011 | 52 |
2012 | 191 |
2013 | 350 |
2014 | 571 |
2015 | 912 |
2016 | 1207 |
2017 | 1682.69 |
2018 | 2135 |
2019 | 2684 |
时间序列的数据格式上,一定是时间从上至下递增,而且不能有间隔,比如2015,2017,2018这种数据少了2016,这类数据不能称为时间序列数据。
时间序列的单位一般是年,比如我国历年的GDP数据,也或者我国历年人口数据等。当然如果单位是月或者季度,也或者周等,可以体现出数据的变化规律,也一样可以作为时间序列数据使用。
单位根检验可用于检验时间序列是否存在单位根,如果存在单位根就说明为非平衡时间序列。如果存在单位根即时间序列数据不平稳,通常不能进行后续的分析比如ARIMA模型。此时可通过对数据进行差分,差分即相减的意思,比如2019年的数据减去2018年的数据,一阶差分其实就是增长的意思。二阶差分是在一阶差分的基础上再次进行差分,物理意义相当于加速度。如果二阶差分依旧不平稳,那说明数据比较糟糕,通常不会再进行进一步差分,因为其已经失去实际意义。
本次研究希望SPSSAU自动进行ADF检验,因此不设置任何的参数,操作如下图:
SPSSAU共输出一个表格即ADF检验表格,分别列出检验的t 值,p 值,以及3个显著性水平时的t 值临界值。
ADF检验表 | |||||
差分阶数 | t | p | 临界值 | ||
1% | 5% | 10% | |||
0 | 0.351 | 0.98 | -4.939 | -3.478 | -2.844 |
1 | 1.653 | 0.998 | -5.354 | -3.646 | -2.901 |
2 | -8.336 | 0.000 | -4.939 | -3.478 | -2.844 |
由上表可见,针对阿里双十一销售额(亿元),该时间序列数据ADF检验的t统计量为0.351,p 值为1.000,1%、5%、10%临界值分别为-4.939、-3.478、-2.844。p =0.980>0.1,不能拒绝原假设,序列不平稳。对序列进行一阶差分再进行ADF检验。
一阶差分后数据ADF检验结果显示p =0.998>0.1,不能拒绝原假设,序列不平稳,对序列进行二阶差分再进行ADF检验。二阶差分后数据ADF检验结果显示p =0.000 <0.01,有高于99%的把握拒绝原假设,此时序列平稳。
因此在后续进行分析时,应该基于2阶差分数据进行分析才可以。
涉及以下几个关键点,分别如下:
SPSSAU默认会智能分析单位根检验,如果原始数据存在单位根,SPSSAU则进行一阶差分并且检验单位根,如果一阶差分存在单位根,SPSSAU则会进行二阶差分并且检验单位根,并且以二阶差分结果作为终点。
如果研究人员自行设置差分阶数或者检验类型(通常不需要设置),SPSSAU默认以研究人员设置进行单位根检验。
绝大多数情况下,SPSSAU与Eviews保持一致的结论。如果出现gap,则可能原因是滞后阶数的判断标准和最大滞后阶数设置不同。SPSSAU默认以AIC为判断标准,而Eviews默认以SIC为标准(当然Eviews可选择为AIC准则);除此之外,SPSSAU最大滞后阶数的默认算法为:向上取整【12*(nobs/100)^0.25】;比如样本量为15,那么12*(15/100)^0.25=7.468,向上取整后为8;SPSSAU以8为最大滞后阶数,但Eviews可自行进行设置。
与此同时,SPSSAU默认输出算法中实际使用的lags参数,即使用AIC信息准则判断的最佳滞后阶数lags,可用于对比测试。
ADF检验时,共有三种类型可以选择,分别是截距(即常数),截距和趋势(即线性),无。其常见选择标准有两种,分别是‘主观判断法’和‘信息准则判断法’。
关于‘主观判断法’,说明如下表:
类型 | 说明 |
常数 | 如果序列均值明显不为0且也没有明显的长期趋势,则为常数。 |
线性 | 如果序列均值明显不为0且有明显长期趋势,则为‘截距和趋势’。类似GDP一般应包括趋势,比如利率/汇率等一般不应该有时间趋势。建议可通过时序图查看,是否有长期变化趋势,如果有则有趋势,反之则无趋势。 |
无 | 序列均值接近为0且也没有长期趋势,则为无。 |
关于‘信息准则判断法’,说明如下:
可结合SPSSAU输入的信息准则比如AIC值判断,比如分别使用3种类型得到3个不同的AIC值,然后对比找到AIC值最小时对应的类型使用即可。