ARIMA模型分析

ARIMA模型(移动平均自回归模型),其是最常见的时间序列预测分析方法。利用历史数据可以预测前来的情况。ARIMA模型可拆分为3项,分别是AR模型,I即差分,和MA模型。SPSSAU智能地找出最佳的AR模型,I即差分值和MA模型,并且最终给出最佳模型预测结果,SPSSAU智能找出最佳模型的原理在于利用AIC值最小这一规则,遍历出各种可能的模型组合进行模型构建,并且结合AIC最小这一规则,最终得到最佳模型。

当然,研究人员也可以自行设置AR模型,差分阶数和MA模型,即分别设置自回归阶数p,差分阶数d值和移动平均阶数q,然后进行模型构建。至于自回归阶数p,差分阶数d值和移动平均阶数q值应该设置多少合适,建议研究人员分别使用偏(自)相关图进行分析(SPSSAU也智能提供p值或q值建议),以及使用ADF检验分析得出合适的差分阶数d值(SPSSAU也智能提供最佳差分阶数d值建议)。

    特别提示
  • SPSSAU默认智能地找出最佳的ARIMA模型并且进行预测。

  • 如果研究人员自己设置自回归阶数p,差分阶数d值和移动平均阶数q这3个参数,SPSSAU则按照研究人员设置进行模型构建。

ARIMA模型案例

  • 1、背景

    当前已经有阿里“双十一”历年(2009~2019年)的销售数据,现希望通过历史数据预测2020年阿里“双十一”的销售额情况。数据如下:

    年份 阿里双十一销售额(亿元)
    2009 0.5
    2010 9.36
    2011 52
    2012 191
    2013 350
    2014 571
    2015 912
    2016 1207
    2017 1682.69
    2018 2135
    2019 2684
      特别提示
    • 时间序列的数据格式上,一定是时间从上至下递增,而且不能有间隔,比如2015,2017,2018这种数据少了2016,这类数据不能称为时间序列数据。

    • 时间序列的单位一般是年,比如我国历年的GDP数据,也或者我国历年人口数据等。当然如果单位是月或者季度,也或者周等,可以体现出数据的变化规律,也一样可以作为时间序列数据使用。

  • 2、理论

    ARIMA模型可拆分为3项,分别是AR模型,I即差分,和MA模型。SPSSAU智能地找出最佳的AR模型,I即差分值和MA模型。当然,研究人员如果自行设置AR模型,差分阶数和MA模型,即分别设置自回归阶数p,差分阶数d值和移动平均阶数q,此时SPSSAU则按照研究人员的设置进行模型构建。建议用户直接使用SPSSAU的智能分析即可。

  • 3、操作

    本次研究希望SPSSAU自动拟合出最佳的ARIMA模型,因此不设置3个参数(自回归阶数p,差分阶数d值和移动平均阶数q)。操作如下图:

  • 4、SPSSAU输出结果

    SPSSAU共输出2个表格,第1个表格是拟合模型参数表格(即SPSSAU拟合出的最佳模型表格),如果研究人员自行设置了参数,则按照研究人员设置的模型进行构建。第2个表格是模型预测值(共往后12期的模型预测值)。

    同时SPSSAU还输出模型拟合、预测的折线图,便于直观展示拟合效果和预测情况。

  • 5、文字分析

    上表格展示本次模型构建结果,包括模型参数、Q统计量和信息准则共三项。本次模型构建时,SPSSAU自动构建出模型为:AR(3),其模型公式为:y(t)=5008.364+1.168*y(t-1)+0.623*y(t-2)-0.816*y(t-3)。

    除此之外,SPSSAU还输出Q统计量值,AIRMA模型构建后一般要求模型残差为白噪声,即残差不存在自相关性,可通过Q统计量检验进行白噪声检验(原假设:残差是白噪声);比如Q6用于检验残差前6阶自相关系数是否满足白噪声,通常其对应p值大于0.1则说明满足白噪声检验(反之则说明不是白噪声),常见情况下可直接针对Q6进行分析即可;从Q统计量结果看,Q6的p值为0.987大于0.1,则在0.1的显著性水平下不能拒绝原假设,模型的残差是白噪声,模型基本满足要求。

    如果研究人员希望自己进行模型构建并且进行对比,此时可结合信息准则AIC和BIC值进行对比,该两值越小越好。当然SPSSAU智能构建模型的原理即是通过AIC值进行对比选出,当前的AIC值已经是各种潜在可能模型的最小值而已。

    上表格预测值表格研究者最关心的表格,因为ARIMA模型目的就在于预测以后的数据情况。向后1期即指2020年,向后2期是指2021年的数据。从经验上看,ARIMA模型向后预期的1期和向后2期相对较为可靠,如果向后期数过多,则准确性会较低。建议研究人员更多参考向后1期或向后2期的数据。即本次利用阿里“双十一”历年(2009~2019)的数据进行预测,使用ARIMA模型进行预测,最终预测出阿里“双十一”2020年的销售额应该为3217.028亿元。

    SPSSAU默认展示时间序列最近1000期的实际值和拟合值、以及最近12期数据预测数据。从上图可以看到,真实数据和拟合数据基本上完全吻合,也即说明模型拟合非常好。而且整体上看,模型预测值呈现出缓慢增长的趋势。

  • 6、剖析

    涉及以下几个关键点,分别如下:

    • SPSSAU默认智能地找出最佳的ARIMA模型并且进行预测(智能拟合模型的原理在于利用AIC值越小越好这一规则,从众多潜在的模型中进行对比选择出最佳模型)。

    • 如果研究人员自己设置自回归阶数p,差分阶数d值和移动平均阶数q这3个参数,SPSSAU则按照研究人员设置进行模型构建。

    • SPSSAU自动提供未来12期的预测数据,但针对ARIMA模型来讲,一般情况下未来1期或者未来2期的预测较为准确,更远的预测数据预测准确率较低,通常作为参考即可。

    • 如果数据具有周期性波动,而且比较规律,则需要使用SARIMA模型,则季节性ARIMA模型,SPSSAU暂未提供此算法。