曲线回归

  • 曲线回归(curvilinear regression)是指对于非线性关系的变量进行回归分析的方法。曲线回归在关系形式上是非线性关系,但可通过各类转换变成线性关系,最终建立回归模型。特别提示的地方在于:曲线回归实际上是将数学关系表达式,转换成线性表达式,然后进行线性回归分析,SPSSAU默认给出转换后的模型结果。

    • SPSSAU当前提供7类曲线拟合模型,关于此7类曲线模型的线性关系转换,如下表:

      比如建立二次曲线拟合,最终模型表达式为:y = β0+β1*x+β2*x2

      比如建立指数曲线拟合,最终模型表达式为:ln(y)= ln(β0)+β1*x

      由于曲线拟合的特殊性,比如指数曲线,是指一个X与一个Y之间建立指数关系,因而曲线拟合时仅针对一个X。

曲线回归案例

  • 1、背景

    随着通风时间的增加,密闭空间内污染物的深度会呈现出指数下降趋势。当前为了考察某通风设备的效果情况,在室内放置某种挥发物质,待其充分分散到室内空气中后开通通风,并且记录下毒物浓度。因而此处建立时间与毒物浓度之间的指数拟合模型。

  • 2、理论

    曲线拟合实质还是线性回归模型,曲线拟合时会加入一次模型转换,将曲线关系转换成线性关系,然后建立模型,SPSSAU会默认给出转换后的模型结果。

  • 3、操作

    • 本案例中自变量为时间,因变量为毒物浓度,SPSSAU操作截图如下:

  • 4、SPSSAU输出结果

    SPSSAU会输出一个曲线拟合图,以及三个表格;分别如下:

    曲线拟合图直观展示出数据间的拟合关系,上图可以明显的看出,时间和毒物浓度之间确实呈现出指数拟合关系。因而也说明数据基本呈现出指数拟合。

    模型汇总
    R 2 调整R 2 标准误 AIC BIC 有效样本
    0.961 0.958 0.299 8.178 9.595 15

    上表格展示出模型的R 2值,以及SPSSAU提供模型的AIC,BIC 值。R 2值表示模型的拟合情况,比如此处为0.961,意味着模型拟合中有96.1%的数据基本都呈现出指数曲线拟合关系。调整R 2值和标准误这两个指标意义较小。

    如果需要拟合多种类型的曲线,并且进行对比具体那个模型更优,此时可使用AIC或BIC指标进行,AIC或BIC指标是模型对比时使用的常用指标,此两个指标值越小越好。

    有效样本数量是指进入模型后的分析样本数量,曲线拟合是将非线性关系转换成线性关系后再拟合,再转换过程中,可能某些原始数据会变成NULL值,比如负数取对数,此时就会出现缺失数据,因而有效样本数量有可能低于实际样本数量。

    ANOVA表格
    平方和 自由度 均方 F p
    回归 28.588 1 28.588 320.287 0.000**
    残差 1.160 13 0.089
    总计 29.749 14
    * p <0.05 ** p <0.01

    上表格呈现出ANOVA分析结果,上表格意义在于检测模型是否有意义,此处p =0.000< 0.01,意味着模型具有拟合意义。如果此处p > 0.05则说明模型拟合没有意义,无需进行下表格分析。上表格中其它的指标数据均为中间计算过程值,基本无意义

    回归系数汇总表
    非标准化系数 标准化系数 t p
    B 标准误 Beta
    常数 1.271 0.162 - 7.831 0.000**
    时间 -0.320 0.018 -0.980 -17.897 0.000**
    * p <0.05 ** p <0.01
    因变量:In(毒物浓度)

    上表展示出模型最终的关系情况,指数曲线拟合最终的模型表达式为:ln(y)= ln(β0)+β1*x。因而在此处最终为:ln(毒物浓度) = 1.171 - 0.320*时间;其中ln为取对数。

    具体分析时间对于毒物浓度的影响情况来看,自变量时间呈现出0.01水平的显著性(t =-17.897,p =0.000 < 0.01),意味着时间会对于毒物浓度产生指数关系的影响,同时回归系数值为-0.320,也即说明时间与毒物浓度之间具有负向的指数关系拟合,随着时间的推移,毒物浓度呈现出指数曲线下降。

  • 5、文字分析

    具体文字分析例子如下:

    本次研究时间与毒物浓度之间的指数曲线关系拟合,从曲线拟合图上看,可以看出时间与毒物浓度之间呈现明显的曲线拟合关系,同时模型R 2值为0.961,意味着模型拟合中有96.1%的数据基本都呈现出指数曲线拟合关系。并且模型通过ANOVA检验,p 值为0.000,意味着曲线拟合模型具有意义。

    最终模型关系表达式为:ln(毒物浓度) = 1.171 - 0.320*时间;其中ln为取对数。具体分析时间对于毒物浓度的影响情况来看,自变量时间呈现出0.01水平的显著性(t =-17.897,p =0.000 < 0.01),意味着时间会对于毒物浓度产生指数关系的影响,同时回归系数值为-0.320,也即说明时间与毒物浓度之间具有负向的指数关系拟合,随着时间的推移,毒物浓度呈现出指数曲线下降。

  • 6、剖析

    曲线拟合实际上是将曲线关系表达式,转换成线性关系表达式,然后进行模型拟合。在转换过程中,有可能会出现无效样本数据。建议进行曲线模型拟合时,首先查看曲线拟合图,如果曲线拟合图显示数据间确实呈现出对应的曲线拟合关系,此时再进行曲线拟合较好。