如果希望进行t 检验,通常可使用SPSSAU通用方法里面的t 检验功能进行,但如果只有汇总好的统计数据(包括平均值,标准差和样本量),此时可使用概要t 检验进行分析。
概要t 检验针对汇总数据(包括平均值,标准差和样本量)进行分析;
概要t 检验细分为两种,分别是单样本t 检验和独立样本t 检验。
单样本t 检验:一组数据与某数字的差异性;独立样本t 检验:两组数据的平均值差异性。
收集某地区100名,20岁男子身高数据,平均身高为168cm,标准差为14cm。资料显示该地区10年前平均身高为165cm,分析当前身高是否明显比10年前更高?
本案例原假设是:168cm>165cm,只对比一个数字的差异性;此为单样本t 检验。
收集某A地区100名,20岁男子身高数据,平均身高为168cm,标准差为14cm。收集B地区200名,20岁男子身高数据,平均身高为170cm,标准差为13cm。分析A地区和B地区身高是否有明显差异?
本案例原假设是:168cm=170cm(差值对比为0),只对两组数据的均值差异;此为独立样本t 检验。
无论是单样本t 检验,还是独立样本t 检验,均是对比数据的差异性,区别在于单样本t 检验和一个已知数字进行对比;独立样本t 检验进行两组数据的均值差异对比。进行t 检验时,需要输入三项数据,分别是平均值,标准差和样本量。
除此之外,t 检验还需要知道以下三个术语,分别是差值对比、置信水平和假设检验。
对比均值(差值对比):独立t 检验时,对比数字是指两组数据均值差,与某个数字进行对比,通常情况下是0(即两组数据平均值差值,与数字0进行对比PK)。
置信水平:指在多大程度上对假设有把握,通常为95%,可选为99%和90%。
假设检验:原假设是等于,小于,还是大于,通常情况下等于(即直接对比是否相等,即是否有差异)。
针对独立样本t 检验,从原理上,其需要先判断方差齐,方差齐和不齐时计算标准误的公式并不一样。此检验过程已经被SPSSAU进行自动判断,并且自动给出对应的计算结果。
从理论上看,t 检验更适用于小样本(样本量< 30),大样本时适用于z 检验。但当样本量加大时,T分布与正态分布基本没有区别,因此大样本时也直接使用t 检验即可。如果希望使用z 检验,请直接使用SPSSAU‘均值z 检验’方法即可。
本次涉及两个例子,分别操作如下:
上图显示收集数据与165cm进行对比,因此对比均值为165;默认置信水平为95%,即对此次分析结论有95%的把握;以及研究假设为均值168cm是否明显大于165cm,因而假设检验选择为大于。
上图显示两组身高进行对比,研究的是两组身高平均值相等(即差值与数字0进行对比),因此差值对比处输入数字0;【如果是研究A地区身高,明显低出B地区身高2cm,那么差值对比值则输入2】;默认置信水平为95%,即对此次分析结论有95%的把握;以及研究假设为均值168cm是否明显等于170cm,因而假设检验选择为等于。
针对单样本t 检验,SPSSAU共输出两个表格,分别是区间估计和假设检验【置信区间仅列出区间估计意义较小,假设检验针对原假设进行验证】,分别如下:
单样本t 检验置信区间 | ||||||
项 | 样本量 | 平均值 | 标准差 | 标准误 | 95% CI(LL) | 95% CI(UL) |
值 | 100 | 168.000 | 14.000 | 1.400 | 165.222 | 170.778 |
本次收集样本为100个20岁男子身高,平均值为168cm,标准差为14cm,分析显示身高的95% CI为:165.222cm~170.778cm。即有95%的把握身高应该介于165.222cm到170.778cm之间。
单样本t 检验假设检验 | |||||||
项 | 样本量 | 平均值 | 检验均值 | 假设 | t | p | 检验结论 |
值 | 100 | 168.000 | 165.000 | 168.000>165.000 | 2.143 | 0.983 | 假设成立 |
本次研究假设为100名20岁男子身高168cm,是否明显高于165cm,因此原假设为168cm>165cm,检验显示在0.05水平上接受原假设(t =2.143,p =0.983>0.05),即意味着当前168cm的身高明显比10年前165cm身高有明显的提升,这一说法无法被论证错误,即说明当前168cm身高明显比10年前165cm要高。
针对独立样本t 检验,SPSSAU共输出两个表格,分别是区间估计和假设检验【置信区间仅列出区间估计意义较小,假设检验针对原假设进行验证】,分别如下:
独立样本t 检验差值置信区间 | ||||||||
项 | 第一组(n=100) | 第二组(n=200) | 均值差值 | 差值标准误 | 95% CI(LL) | 95% CI(UL) | ||
平均值 | 标准差 | 平均值 | 标准差 | |||||
值 | 168.000 | 14.000 | 170.000 | 13.000 | -2.000 | 1.634 | -5.215 | 1.215 |
本次收集A地区和B地区20岁男子身高数据,A地区为168cm,B地区为170cm,A地区与B地区的身高差值为-2cm,而且差值95% CI为:-5.215cm~1.215cm。即有95%的把握两个地区身高差值,应该介于-5.215cm到1.215cm之间。
独立样本t 检验差值假设检验 | ||||||
项 | 均值差值 | 差值检验值 | 假设 | t | p | 检验结论 |
值 | -2.000 | 0.000 | -2.000=0.000 | -1.224 | 0.222 | 假设成立 |
本次研究假设为A地区168cm的男子身高,是否与B地区170cm男子身高,有没有明显的差异性。上表格显示,从数字上看,A地区身高会低于B地区身高2cm,检验2cm是否与数字0相等。检验显示在0.05水平上接受原假设(t =-1.224,p =0.222 >0.05),即意味着2cm的身高差值,与没有身高差异,二者之间无统计学意义;也即说明此2cm的身高差异并不明显,也即验证说明A地区和B地区男子身高并没有非常明显的差异性。
涉及以下几个关键点,分别如下:
t 检验涉及以下三个术语,分别是差值对比、置信水平和假设检验。
对比均值(差值对比):独立t 检验时,对比数字是指两组数据均值差,与某个数字进行对比,通常情况下是0(即两组数据平均值差值,与数字0进行对比PK)。
置信水平:指在多大程度上对假设有把握,通常为95%,可选为99%和90%。
假设检验:原假设是等于,小于,还是大于,通常情况下等于(即直接对比是否相等,即是否有差异)。
针对独立样本t 检验,从原理上,其需要先判断方差齐,方差齐和不齐时计算标准误的公式并不一样。此检验过程已经被SPSSAU进行自动判断,并且自动给出对应的计算结果。
从理论上看,t 检验更适用于小样本(样本量< 30),大样本时适用于z 检验。但当样本量加大时,T分布与正态分布基本没有区别,因此大样本时也直接使用t 检验即可。如果希望使用z 检验,请直接使用SPSSAU‘均值z 检验’方法即可。
置信区间表格列出区间估计信息意义较小,通常情况下针对假设检验表格进行分析即可。
分析常模时,通常只会有汇总的平均值,标准差和样本量数据等。此时可手工输入对应的汇总值进行对比。当然如果样本量很大时,也可以使用概要Z检验进行分析。