t 检验

  • t 检验(独立样本t 检验),用于分析定类数据与定量数据之间的关系情况.例如研究人员想知道两组学生的智商平均值是否有显著差异.t 检验仅可对比两组数据的差异,如果为三组或更多,则使用方差分析.如果刚好仅两组,建议样本较少(低于100时)使用t 检验,反之使用方差分析。

    • 首先判断p 值是否呈现出显著性,如果呈现出显著性,则说明两组数据具有显著性差异,具体差异可通过平均值进行对比判断。

    分析项 t 检验说明
    性别,网购满意度 不同性别的两类人群,他们网购满意度是否有差异?
  • 分析结果表格示例如下(SPSSAU同时会生成折线图等):

    性别(平均值±标准差) t p
    男(n=67) 女(n=53)
    分析项1 3.23±1.33 2.88±0.73 3.73 0.03*
    分析项2 2.62±1.48 2.57±1.21 0.56 0.58
    * p <0.05 ** p <0.01
    • 特别提示
    • 备注:方差分析,t 检验和交叉(卡方),共三个分析方法,均是对比差异性。

    X数据类型 X组别 Y 分析方法
    定类 2组或者多组 定量 方差
    定类 仅仅2组 定量 t 检验
    定类 2组或者多组 定类 卡方
    • 特别提示
    • t 检验一定只能对比两组数据的差异。如果提示“X的组别只能为两组(比如男和女)!”,说明不是2个组别。

    • 检查方法为:将X进行频数分析,即可发现X有几个组别。

    • 解决办法为:可使用方差分析,也或者将X多个组别组合成两个组别,使用数据编码功能。

    SPSSAU操作截图如下:

t 检验案例

  • 1、背景

    当前有一份数据。想研究不同性别人群对“淘宝客服服务态度”,“淘宝商家服务质量”,这两项的差异性,“淘宝客服服务态度”,“淘宝商家服务质量”这两项均是定量数据,因而可使用t 检验,通过平均值进行差异性对比。

  • 2、理论

    t 检验时研究X对Y的差异性,其中X为定类数据,Y为定量数据。t 检验时分析时,首先分析p 值,如果此值小于0.05,说明呈现出差异性;具体差异再对比平均值即可。如果p 值大于0.05则说明没有差异性产生。t 值属于中间过程值,想要计算p 值,一定要先计算t 值,因而SPSSAU也将t 值结果输出。

    • 特别提示
    • 如果X和Y均为定类数据,想对比差异性,此时需要使用卡方分析。

    • 如果X为定类,Y为定量;且X只能为两组,比如男和女;如果超过三组,比如本科以下,本科,本科以上,此时需要使用方差分析进行差异对比。

  • 3、操作

    本例子中研究X对于Y的差异;X为性别,Y为两项,分别是“淘宝客服服务态度”,“淘宝商家服务质量”。放置如下:

  • 4、SPSSAU输出结果

    性别(平均值±标准差) t p
    男(n=40) 女(n=160)
    分析项1 3.44±0.65 4.19±0.61 -6.86 0.00*
    分析项2 3.53±0.64 4.22±0.64 -6.13 0.00*
    * p <0.05 **p <0.01

    共输出t 值和p 值,以及还有平均值与标准差值。t 值和平均值才更有意义;但需要输出t 值和标准差值,原因在于p 值需要通过t 值计算得到,以及原理上是否有差异会与标准差值有关联性。

  • 5、文字分析

    • 使用t 检验去研究性别分别与“淘宝客服服务态度”,“淘宝商家服务质量”这两项的差异关系,结果显示,不同性别群体样本对于“淘宝客服服务态度”,“淘宝商家服务质量”均呈现出显著性差异(p <0.05)。具体对比可知:

    • 不同性别人群对于“淘宝客服服务态度”呈现出0.01水平的显著性差异差异态度(t =-6.86,p =0.00 <0.01),具体通过平均值对比差异可知:相对男性群体,女性群体对于 “淘宝客服服务态度”的认可态度会越高。

    • 不同性别人群对于““淘宝商家服务质量”” 呈现出0.01水平的显著性差异(t =-6.13,p =0.00 <0.01),具体通过平均值对比差异可知:相对男性群体,女性群体对于,他们对于““淘宝商家服务质量””的认可态度会越高。

    • 特别提示
    • 如果X共有三组,分别是本科以下,本科和本科以上;此时不能使用t 检验,而需要使用方差分析,t 检验仅对比两组间的差异。

  • 6、剖析

    t 检验涉及以下几个关键点,分别如下:

    t 检验分析X对Y的差异性;X只能分为两组;如果X为三组,比如本科以下,本科,本科以上;此时需要使用方差分析。

疑难解惑

  • 什么样的数据格式才适合?
  • 有时候数据是手工录入,如果此时需要进行t 检验,则需要录入数据格式如下:

  • 一定有1列表示叫‘组别’,而且里面只能为2种文字(或2个数字)。这样X就是‘组别’,Y是‘成绩’。

  • X的组别只能为两组(比如男和女)!?
  • t 检验的原理就是对比两组数据,因此X的数据中只能且一定包括两个数字。如果出现此提示,建议使用频数分析进行检查。如果是多数的差异对比应该使用方差分析。当然如果一定要使用t 检验,可使用‘筛选样本’功能,筛选出两组后进行分析即可。

  • 关于效应量(effect size)说明?
  • t 检验分析时,通常使用Cohen's d 值表示效应量,其计算公式为:Cohen's d =|M1-M2| / Sqrt(S2pool),即差值绝对值 / 标准差, 标准差=Sqrt(联合方差)。M1表示第一组数据的平均值,M2表示第二组数据的平均值,联合方差S2pool为中间过程值,Sqrt指开根号;

  • Cohen's d 值介于0~1之间,该值越大说明差异幅度越大;

  • 0 < Cohen's d <=0.2时,说明效应较小(差异幅度较小);

  • 0.2 < Cohen's d <=0.8时,即 0.5附近时,说明效应中等(差异幅度中等);

  • Cohen's d > 0.8时,说明效应较大(差异幅度较大)。