t 检验(独立样本t 检验),用于分析定类数据与定量数据之间的关系情况.例如研究人员想知道两组学生的智商平均值是否有显著差异.t 检验仅可对比两组数据的差异,如果为三组或更多,则使用方差分析.如果刚好仅两组,建议样本较少(低于100时)使用t 检验,反之使用方差分析。
首先判断p 值是否呈现出显著性,如果呈现出显著性,则说明两组数据具有显著性差异,具体差异可通过平均值进行对比判断。
分析项 | t 检验说明 |
---|---|
性别,网购满意度 | 不同性别的两类人群,他们网购满意度是否有差异? |
分析结果表格示例如下(SPSSAU同时会生成折线图等):
性别(平均值±标准差) | t | p | |||
男(n=67) | 女(n=53) | ||||
分析项1 | 3.23±1.33 | 2.88±0.73 | 3.73 | 0.03* | |
分析项2 | 2.62±1.48 | 2.57±1.21 | 0.56 | 0.58 | |
* p <0.05 ** p <0.01 |
备注:方差分析,t 检验和交叉(卡方),共三个分析方法,均是对比差异性。
X数据类型 | X组别 | Y | 分析方法 |
定类 | 2组或者多组 | 定量 | 方差 |
定类 | 仅仅2组 | 定量 | t 检验 |
定类 | 2组或者多组 | 定类 | 卡方 |
t 检验一定只能对比两组数据的差异。如果提示“X的组别只能为两组(比如男和女)!”,说明不是2个组别。
检查方法为:将X进行频数分析,即可发现X有几个组别。
解决办法为:可使用方差分析,也或者将X多个组别组合成两个组别,使用数据编码功能。
当前有一份数据。想研究不同性别人群对“淘宝客服服务态度”,“淘宝商家服务质量”,这两项的差异性,“淘宝客服服务态度”,“淘宝商家服务质量”这两项均是定量数据,因而可使用t 检验,通过平均值进行差异性对比。
t 检验时研究X对Y的差异性,其中X为定类数据,Y为定量数据。t 检验时分析时,首先分析p 值,如果此值小于0.05,说明呈现出差异性;具体差异再对比平均值即可。如果p 值大于0.05则说明没有差异性产生。t 值属于中间过程值,想要计算p 值,一定要先计算t 值,因而SPSSAU也将t 值结果输出。
如果X和Y均为定类数据,想对比差异性,此时需要使用卡方分析。
如果X为定类,Y为定量;且X只能为两组,比如男和女;如果超过三组,比如本科以下,本科,本科以上,此时需要使用方差分析进行差异对比。
本例子中研究X对于Y的差异;X为性别,Y为两项,分别是“淘宝客服服务态度”,“淘宝商家服务质量”。放置如下:
性别(平均值±标准差) | t | p | |||
男(n=40) | 女(n=160) | ||||
分析项1 | 3.44±0.65 | 4.19±0.61 | -6.86 | 0.00* | |
分析项2 | 3.53±0.64 | 4.22±0.64 | -6.13 | 0.00* | |
* p <0.05 **p <0.01 |
共输出t 值和p 值,以及还有平均值与标准差值。t 值和平均值才更有意义;但需要输出t 值和标准差值,原因在于p 值需要通过t 值计算得到,以及原理上是否有差异会与标准差值有关联性。
使用t 检验去研究性别分别与“淘宝客服服务态度”,“淘宝商家服务质量”这两项的差异关系,结果显示,不同性别群体样本对于“淘宝客服服务态度”,“淘宝商家服务质量”均呈现出显著性差异(p <0.05)。具体对比可知:
不同性别人群对于“淘宝客服服务态度”呈现出0.01水平的显著性差异差异态度(t =-6.86,p =0.00 <0.01),具体通过平均值对比差异可知:相对男性群体,女性群体对于 “淘宝客服服务态度”的认可态度会越高。
不同性别人群对于““淘宝商家服务质量”” 呈现出0.01水平的显著性差异(t =-6.13,p =0.00 <0.01),具体通过平均值对比差异可知:相对男性群体,女性群体对于,他们对于““淘宝商家服务质量””的认可态度会越高。
如果X共有三组,分别是本科以下,本科和本科以上;此时不能使用t 检验,而需要使用方差分析,t 检验仅对比两组间的差异。
t 检验涉及以下几个关键点,分别如下:
t 检验分析X对Y的差异性;X只能分为两组;如果X为三组,比如本科以下,本科,本科以上;此时需要使用方差分析。
有时候数据是手工录入,如果此时需要进行t 检验,则需要录入数据格式如下:
一定有1列表示叫‘组别’,而且里面只能为2种文字(或2个数字)。这样X就是‘组别’,Y是‘成绩’。
t 检验的原理就是对比两组数据,因此X的数据中只能且一定包括两个数字。如果出现此提示,建议使用频数分析进行检查。如果是多数的差异对比应该使用方差分析。当然如果一定要使用t 检验,可使用‘筛选样本’功能,筛选出两组后进行分析即可。
t 检验分析时,通常使用Cohen's d 值表示效应量,其计算公式为:Cohen's d =|M1-M2| / Sqrt(S2pool),即差值绝对值 / 标准差, 标准差=Sqrt(联合方差)。M1表示第一组数据的平均值,M2表示第二组数据的平均值,联合方差S2pool为中间过程值,Sqrt指开根号;
Cohen's d 值介于0~1之间,该值越大说明差异幅度越大;
0 < Cohen's d <=0.2时,说明效应较小(差异幅度较小);
0.2 < Cohen's d <=0.8时,即 0.5附近时,说明效应中等(差异幅度中等);
Cohen's d > 0.8时,说明效应较大(差异幅度较大)。
如果对于分析使用的原始数据格式有疑问,请参考下面链接说明: https://www.spssau.com/helps/otherdocuments/methodsdataformat.html