曲线回归(curvilinear regression)是指对于非线性关系的变量进行回归分析的方法。曲线回归在关系形式上是非线性关系,但可通过各类转换变成线性关系,最终建立回归模型。特别提示的地方在于:曲线回归实际上是将数学关系表达式,转换成线性表达式,然后进行线性回归分析,SPSSAU默认给出转换后的模型结果。
SPSSAU当前提供7类曲线拟合模型,关于此7类曲线模型的线性关系转换,如下表:
比如建立二次曲线拟合,最终模型表达式为:y = β0+β1*x+β2*x2
比如建立指数曲线拟合,最终模型表达式为:ln(y)= ln(β0)+β1*x
由于曲线拟合的特殊性,比如指数曲线,是指一个X与一个Y之间建立指数关系,因而曲线拟合时仅针对一个X。
随着通风时间的增加,密闭空间内污染物的深度会呈现出指数下降趋势。当前为了考察某通风设备的效果情况,在室内放置某种挥发物质,待其充分分散到室内空气中后开通通风,并且记录下毒物浓度。因而此处建立时间与毒物浓度之间的指数拟合模型。
曲线拟合实质还是线性回归模型,曲线拟合时会加入一次模型转换,将曲线关系转换成线性关系,然后建立模型,SPSSAU会默认给出转换后的模型结果。
本案例中自变量为时间,因变量为毒物浓度,SPSSAU操作截图如下:
SPSSAU会输出一个曲线拟合图,以及三个表格;分别如下:
曲线拟合图直观展示出数据间的拟合关系,上图可以明显的看出,时间和毒物浓度之间确实呈现出指数拟合关系。因而也说明数据基本呈现出指数拟合。
模型汇总 | |||||
R 2 | 调整R 2 | 标准误 | AIC | BIC | 有效样本 |
0.961 | 0.958 | 0.299 | 8.178 | 9.595 | 15 |
上表格展示出模型的R 2值,以及SPSSAU提供模型的AIC,BIC 值。R 2值表示模型的拟合情况,比如此处为0.961,意味着模型拟合中有96.1%的数据基本都呈现出指数曲线拟合关系。调整R 2值和标准误这两个指标意义较小。
如果需要拟合多种类型的曲线,并且进行对比具体那个模型更优,此时可使用AIC或BIC指标进行,AIC或BIC指标是模型对比时使用的常用指标,此两个指标值越小越好。
有效样本数量是指进入模型后的分析样本数量,曲线拟合是将非线性关系转换成线性关系后再拟合,再转换过程中,可能某些原始数据会变成NULL值,比如负数取对数,此时就会出现缺失数据,因而有效样本数量有可能低于实际样本数量。
ANOVA表格 | |||||
平方和 | 自由度 | 均方 | F | p | |
回归 | 28.588 | 1 | 28.588 | 320.287 | 0.000** |
残差 | 1.160 | 13 | 0.089 | ||
总计 | 29.749 | 14 | |||
* p <0.05 ** p <0.01 |
上表格呈现出ANOVA分析结果,上表格意义在于检测模型是否有意义,此处p =0.000< 0.01,意味着模型具有拟合意义。如果此处p > 0.05则说明模型拟合没有意义,无需进行下表格分析。上表格中其它的指标数据均为中间计算过程值,基本无意义
回归系数汇总表 | |||||
非标准化系数 | 标准化系数 | t | p | ||
B | 标准误 | Beta | |||
常数 | 1.271 | 0.162 | - | 7.831 | 0.000** |
时间 | -0.320 | 0.018 | -0.980 | -17.897 | 0.000** |
* p <0.05 ** p <0.01 | |||||
因变量:In(毒物浓度) |
上表展示出模型最终的关系情况,指数曲线拟合最终的模型表达式为:ln(y)= ln(β0)+β1*x。因而在此处最终为:ln(毒物浓度) = 1.171 - 0.320*时间;其中ln为取对数。
具体分析时间对于毒物浓度的影响情况来看,自变量时间呈现出0.01水平的显著性(t =-17.897,p =0.000 < 0.01),意味着时间会对于毒物浓度产生指数关系的影响,同时回归系数值为-0.320,也即说明时间与毒物浓度之间具有负向的指数关系拟合,随着时间的推移,毒物浓度呈现出指数曲线下降。
具体文字分析例子如下:
本次研究时间与毒物浓度之间的指数曲线关系拟合,从曲线拟合图上看,可以看出时间与毒物浓度之间呈现明显的曲线拟合关系,同时模型R 2值为0.961,意味着模型拟合中有96.1%的数据基本都呈现出指数曲线拟合关系。并且模型通过ANOVA检验,p 值为0.000,意味着曲线拟合模型具有意义。
最终模型关系表达式为:ln(毒物浓度) = 1.171 - 0.320*时间;其中ln为取对数。具体分析时间对于毒物浓度的影响情况来看,自变量时间呈现出0.01水平的显著性(t =-17.897,p =0.000 < 0.01),意味着时间会对于毒物浓度产生指数关系的影响,同时回归系数值为-0.320,也即说明时间与毒物浓度之间具有负向的指数关系拟合,随着时间的推移,毒物浓度呈现出指数曲线下降。
曲线拟合实际上是将曲线关系表达式,转换成线性关系表达式,然后进行模型拟合。在转换过程中,有可能会出现无效样本数据。建议进行曲线模型拟合时,首先查看曲线拟合图,如果曲线拟合图显示数据间确实呈现出对应的曲线拟合关系,此时再进行曲线拟合较好。