SPSSAU算法手册

  • 一、基本说明

    • 关于 p 值*标示:

    • SPSSAU对于 p 值的标注规则统一为: p <0.01使用两个*号表示, p <0.05则使用1个*号表示。并且在表格下方有备注。除非特别说明,默认使用双侧检验。

    • SPSSAU智能文字分析算法:

    • SPSSAU智能文字算法时,统一按照 p <0.05则显著这一标准进行。

    • 关于页面展示中的 XY说明:

    • 分析方法研究中通常称自变量,因变量等,为便于描述和用户理解, SPSSAU通常称 X或者 Y等,比如研究不同性别人群身高差异,则描述为“ X(性别)和 Y(身高)的差异关系”。

    • 关于数据类型说明:

    • SPSSAU中仅定义两类数据,分别是定类和定量数据;通常统计知识中分为定类,定序和定量, SPSSAU将定序和定量这两类数据合称定量数据。便于用户进行研究理解和使用。

    • 关于筛选功能:

    • 筛选是针对记录进行,比如用户仅希望分析男性样本等;系统默认会保留用户筛先操作,如果希望去除筛选,点击“放弃筛选”按钮。

    • 筛选条件仅最多为 3个,提供“等于”,“大于”,“小于”,“不等于”共四类运算符,以及筛选条件之间的逻辑可选为“并且”和“或者”。

  • 二、数据处理(生成变量)

    SPSSAU当前提供的数据处理方法共 10种,分别为:平均值,求和,乘积,标准化,中心化,平方,根号,自然对数, 10为底对数,绝对值。 SPSSAU后续会进一步加入更多数据处理方法。

  • 三、分析算法

    SPSSAU当前共提供 30类算法(含算法拆分),后续版本会陆续多重响应(多选/单选-多选/多选-单选/多选-多选)深入功能,主成分分析,事后多重比较 SNK( q检验)和 Dunnett( t 检验)等,卡方检验 Fisher检验量,散点图,回归残差检验图,正态检验图,高级算法(比如一般线性模型,多分类 Logit),熵值法,医学分析算法(比如生存分析, Cox回归, ROC曲线),以及其余常见统计算法等。

  • 1、频数分析

    计算各个数字的 有效频数有效百分比;如果有缺失数据, SPSSAU并不会单独标识出缺失个数,处理方法是‘标题’之后加入总样本数量,类似下图:总共样本为 99个,学历有 1个缺失数据,因此学历的有效样本数量为 98。频数和百分比均基于有效样本 98进行计算,并且在学历后面加入( n=98)进行标识。

    名称 选项 频数 百分比(%)
    学历(n=98) 本科以下 1 1.0
    本科 94 95.9
    硕士及以上 3 3.1
    合计 99 100.0

    频数分析默认输出饼图,圆环图,柱形图和条形图。

  • 2、交叉(卡方)分析

    交叉分析时使用的 χ2值为 Pearson χ2值。(后续会提供 Fisher确切概率检验等)

    默认输出柱形图,条形图,堆积柱形图和堆积条形图。

  • 3、描述分析

    输出有效样本的最小值,最大值,平均值,标准差和中位数。

    默认输出条形图和雷达图。

    SPSSAU后续会提供四分位数点,峰度,偏度等指标。

  • 4、分类汇总

    分类汇总是频数,交叉,描述,方差分析的集合,根据具体情况对应得到不同的结果;方差分析和卡方分析时,不提供统计量和 p 值。

    X的放置情况 汇总类型 对应方法
    X(不放置) 平均值(默认) 描述分析
    X(不放置) 百分比 频数分析
    X(放置) 平均值(默认) 方差分析
    X(放置) 百分比 交叉(卡方)分析
  • 5、相关分析

    相关分析共提供两类相关系数,分别是 Pearson相关系数和 Spearman相关系数。以及默认提供两种规范化输出格式。默认不输出p 值,使用*号进行表示。

  • 6、回归分析

    回归分析算法使用通用的最小二乘法( OLS)进行指标估计,默认会输出 VIF值。回归分析提供残差或预测值保存可选功能。

  • 7、方差分析

    方差分析输出:平均值,标准差, F 值和 p 值。

    方差齐检验使用通用的Levene统计量。

    默认输出折线图。

  • 8、t 检验

    t 检验时中间使用的方差齐检验为 Levene统计量;如果方差齐则使用混合方差,方差不齐则使用成组 t 检验;方差齐检验,方差齐或者方差不齐的中间检验过程, SPSSAU已经默认进行判断处理,直接输出最终的检验统计量和 p 值。

    默认输出折线图。

  • 9、单样本t 检验

    输出有效样本的最小值,最大值,平均值,标准差,中位数, t 检验统计量值和 p 值,提供对比数字设置或选功能(默认为 0)。

  • 10、配对t 检验

    输出有效样本的平均值,标准差,配对数据平均值差值, t 检验统计量值和 p 值。

  • 11、正态性检验

    正态性检验使用 Kolmogorov-Smirnov检验和 Shapiro-Wilk检验两种检验统计量, SPSSAU建议样本量小于等于50时使用 Shapiro-Wilk检验,样本量大于50时使用 Kolmogorov-Smirnov检验。 智能化文字默认以此为标准进行智能分析。

  • 12、非参数检验

    非参数检验共提供 mannWhitney检验统计量和 Kruskal-Wallis检验统计量;如果数据组别为两组则使用 mannWhitney检验,数据组合超过两组则使用 Kruskal-Wallis检验统计量; SPSSAU默认进行判断并且输出,不需要用户进行选择。

    SPSSAU智能化文字算法也默认进行中间过程判断,勿需用户干预判断。

  • 13、信度分析

    信度分析提供校正项总计相关性( CITC),项删除后 α系数, α系数共三个指标。

  • 14、效度分析

    效度分析即为因子分析,主成分法,以及方差旋转法为“最大方差旋转”,最大迭代次数为 1000,以及因子个数设置可选功能(默认以特征根大于 1作为因子个数输出,可设置因子个数区间为 1~15)。

  • 15、多选题

    多选题分析针对问卷研究,提供响应率和普及率等指标。

  • 16、单选-多选

    1个单选题和 1个多选题进行交叉分析,提供交叉频数和百分比等指标。

  • 17、多选-单选

    1个多选题和 1个单选题进行交叉分析,提供交叉频数和百分比等指标。

  • 18、多选-多选

    1个多选题和 1个多选题进行交叉分析,提供交叉频数和百分比等指标。。

  • 19、聚类分析

    聚类分析使用 K均值( K-means)算法,并且聚类分析后默认输出不同类别数据与分析项的方差分析结果,并提供聚类个数设置可选功能(默认为 3,可设置聚类个数为 23456)。

    默认输出饼图,圆环图,柱形图和条形图,折线图等。

    SPSSAU后续会提供分层聚类算法。

  • 20、因子分析

    因子分析使用主成分法,以及方差旋转法为“最大方差旋转”,最大迭代次数为 1000。生成结果提供 KMOBartlett 球形度检验,方差解释表格,旋转后因子得分系数表格,成份得分系数表格和碎石图。因子分析提供因子得分保存可选功能,以及因子个数设置可选功能(默认以特征根大于 1作为因子个数输出,可设置因子个数区间为 1~15)。

    SPSSAU后续会单独提供主成分分析。

  • 21、多重响应(多选/单选-多选/多选-单选/多选-多选)(单-多)

    多重响应(多选/单选-多选/多选-单选/多选-多选)共输出响应率和普及率等指标,提供计数项设置可选功能(默认为 1)。

    默认输出饼图,圆环图,柱形图和条形图,折线图。

    SPSSAU后续会提供多重响应(多选/单选-多选/多选-单选/多选-多选)(多-多)分析,多重响应(多选/单选-多选/多选-单选/多选-多选)(多-单)分析。

  • 22、事后多重比较

    事后多重比较默认使用 LSD方法。后续会加入 SNK( q检验)和 Dunnett( t 检验)等事后多重比较方法。默认智能化输出事后多重比较对比规范化结果,不单独输出 p 值。

  • 24、分层回归分析

    分层回归会输出R 2变化值, F 变化值。默认不输出 p 值,使用*号进行表示;提供 Sobel检验网页( quantpsy.org)。

  • 25、双因素方差分析

    双因素方差分析使用类型 III算法。

  • 26、二元Logit分析

    二元 Logit分析使用极大似然法估计,使用 z 检验,以及默认会输出 OR值,以及回归系数的 95% CI,以及伪 R方值。二元 Logit提供残差或预测值保存可选功能。