数据结果一致性问题

在进行SPSSAU分析(或其它分析软件)时,有可能出现gap,当出现此类问题时,需要从以下几个方面进行排查和解决:

问题原因 检查 解决办法
1 分析数据不一致 免费版问题;
使用描述分析查看平均值是否完全一模一样。
确保会员权益;
使用完全相同数据和分析操作。
2 分析项放置不一致 放到右侧框分析项是否绝对一致,包括个数和顺序等。 确保分析项个数和顺序等绝对一致。
3 算法之ML极大似然法 查看分析方法是否使用ML极大似然法 正常现象
4 算法之参数配置 参数设置 确保正确的参数配置
5 算法之随机过程 算法本身就有随机性,比如聚类分析和中介作用Bootstrap 正常现象
6 哑变量设置 哑变量的原理 确保参考项完全一致
7 其它
  • 1、分析数据不一致

    如果是免费版,SPSSAU会限制分析样本量(限50个样本);出现此种情况下,开通会员即可。

    如果是会员,建议使用‘通用方法>描述’进行分析,查看平均值是否完全一致,以检查分析的数据是否完全一致。

    分析数据不一致是人为原因,一定需要人为进行处理。

  • 2、分析项放置不一致

    放到右侧框的分析项需要确保一致,包括分析项的数量和顺序;如果是分析项放置不一致,那肯定会出现不一样,因为分析的数据都不一样,这是人工原因需要仔细检查。

    除此之外,分析项放的顺序不一致,也可能带来gap,比如在进行验证性因子分析时,放到框中的第一项默认会作为参考项,但其它软件比如AMOS、R、Mplus等是自己手工设定参考项,当参考项不一致时,结果会不一致。此种情况是正常现象而且完全正确,不用理会即可。

  • 3、算法之ML极大似然法

    从算法角度上,ML极大似然法估计是非常常见和通用的模型参数估计方法。有很多研究方法均会使用ML极大似然法,它是一种数据迭代算法。如果迭代最后收敛,结果会完全一致,但是如果数据质量不太好,有可能会出现迭代不收敛,最终导致数据不一致。这是一种正常现象,因为收敛的标准可能不一致,比如有的软件以10的-5次方作为收敛标准,而有的以10的-3次方作为标准。通常情况下SPSSAU以10的-5次方作为收敛标准。

    在实务研究中,绝大多数情况下数据均为收敛,因此会保持一致性结果,但也有极小可能会出现数据不收敛因而不同软件(比如SPSS、Stata、R、SPSSAU、Mplus、LISREL软件等)等出现不一致的结果,每个软件出来的结果均会有一定的gap,此种gap是正常现象,此种不一致会带来结果的不一致,但结论上通常是一致并无区别。

    SPSSAU中涉及到ML极大似然法的方法包括以下:验证性因子分析CFA、路径分析、结构方程模型SEM、二元Logit、多分类Logit、有序Logit、二元Probit、Cox回归等。上述分析方法有可能出现数据结果的不一致,但整体结论或结果通常会保持一致。

    建议点击查看数学原理文档,点击查看

  • 4、算法之参数配置

    通常情况下,分析方法需要进行一些参数配置,比如说因子分析时,SPSSAU默认输出KMO值和Barelett值等,但其它很多软件并不会默认输出,需要自己手工设置。也比如因子分析时SPSSAU默认以varimax方法进行旋转,并且在分析结果中进行说明。但其它软件比如SPSS需要手工进行配置。另外,SPSSAU面板模型默认输出个体固定和个体随机效应,但相关软件比如Stata、Eviews等需要手工进行设置。

    诸如上述情况时,不同的参考配置会导致不一致的结果,当出现此类情况时,建议查阅SPSSAU对应的帮助手册里面会有详细说明。

  • 5、算法之随机过程

    有的时候,算法本身就自带‘随机性’,比如聚类算法时第一步就需要随机找到聚类中心,这就是算法本身的要求,因此当出现此类情况下,最终的结果有可能有gap,这种gap是正常而且是必须,不同的软件第一步随机种子不会一致,因而最终的结果很可能不会完全一致;但这本身就是算法本身的要求,结论一致即可。

    除此之外,SPSSAU生成变量里面有‘随机编号’功能,以及问卷研究>中介作用里面的bootstrap抽样法,都是一种随机抽样的过程,结论上会保持一致,但具体结果数字上不会完全一致,这是一定的现象。

  • 6、哑变量设置

    如果定类数据进行影响关系研究,很可能会涉及到哑变量,那么参照项的选择上会不一致。SPSSAU是手工放置参照项,但SPSS、Stata软件等会默认以数字最小或数字最大项作为参考项。这种情况一定会导致结果不一致。具体建议以自己的需要进行设置参考项(即不放入模型的那一项),而不能随意让软件控制思想。

    诸如上述情况时,不同的参考配置会导致不一致的结果,当出现此类情况时,建议查阅SPSSAU对应的帮助手册里面会有详细说明。

    关于虚拟哑变量,可参考此文档: https://www.spssau.com/helps/otherdocuments/dummy.html

  • 7、反馈

    数据的不一致是人为原因,需要人为处理。如果是其它问题,需要首先确定问题然后进行查看,如果是正常现象则不用理会。如果确定不是正常现象,欢迎发送2项资料(1是数据(在SPSSAU右上角“我的数据”点击“分享”按钮得到数据链接发送),2是操作截图)提交人工客服反馈,会由人工客服查看后回复。谢谢。