散点图用于考察定量数据之间的关联关系,即查看X和Y之间的关系情况。散点图通常用于探索性研究,直观展示出数据间的关联关系情况。
散点图的常见使用场景如下:
相关分析之前,查看X和Y之间的关系情况。
回归分析后模型检验,查看残差分别与自变量间的关联性【回归模型假定残差不应该与自变量有关联性,即异方差性】。
其它用于直观展示数据关系的场景。
SPSSAU操作截图如下:
SPSSAU输出散点图说明:
上图是回归分析保存的残差值与自变量作散点图,用于检测异方差性,上图可以看出,数据基本上没有规律可循,X变化时,Y并不会变大或者变小,因而说明无关联性,也即说明没有异方差性。
上图可以看出,X增大时,Y会明显的减少,也即说明X和Y之间有着负向相关关系。
上图区分不同性别群体时,X和Y的散点图。需要让性别放入“颜色区分项”框即可,可直观展示不同类别时,数据间的关系差异情况。
如果说分析项只包括几个数字,通常分析项并非连续数据时,此很可能出现本身有几百个样本,但仅出现几个点。原因在于很多点都重合在一起了。建议用户可使用频数分析查看下分析项对应有几个不同数字。
另外,如果不同数字过多,此时SPSSAU会自动进行bins处理,这也可能会导致输出的散点个数小于实际不同数字的样本量。
Bins是一种散点数据处理方式,当散点过多时可通过bins处理更清晰的查看散点数据关系情况,当散点数量>1000时,SPSSAU自动会进行bins处理(bins=100),与此同时,研究者也可自主设置bins数量。与此同时,此种处理在SPSSAU系统的曲线回归,非线性回归中均有涉及且均会自动进行处理。