在进行数据分析时,通常有两种数据格式。一种是常规格式(非加权格式),另外一种是加权数据格式。分别说明如下:
第一种常规格式(非加权格式);
一行代表一个样本,如果有100个样本即为100行;一列代表一个属性;这类格式最为常见,而且此类数据格式可以做任何的分析。因为其携带着所有最原始的数据信息。类似如下表:
样本编号 | 性别 | 年龄 | … |
---|---|---|---|
1 | 1 | 24 | … |
2 | 2 | 22 | … |
3 | 1 | 21 | … |
… | 2 | 25 | … |
100 | 2 | 28 | … |
第二种加权数据格式;
比如收集100个样本,最终男性40名,女性60名,录入的数据为汇总统计数据,单独一列(或多列)表示各类别的样本数量;如下表:
性别 | 数量(加权) |
---|---|
1 | 40 |
2 | 60 |
比如实验样本量为200个,分为实验和对照组;并且治疗方式分为中药和西药;那么组别与治疗方式就有2*2=4种组合,因此为4行,单独使用一列标识各种组合的样本量,如下表:
组别 | 治疗方式 | 样本量(加权) |
---|---|---|
实验组 | 中药 | 50 |
实验组 | 西药 | 50 |
对照组 | 中药 | 60 |
对照组 | 西药 | 40 |
‘加权数据格式’其实是一种已经统计好的数据,其体现出各类别群体的数量,单独一列(或多列等)表示类别,使用一列表示‘权重’,其表示该行时各类别的样本数量。
‘加权数据格式’丢失掉原始的数据信息,并且此类数据格式只针对于‘定类’数据才能这样(比如性别,是否购买等),因此此类数据只能应用在一部分研究方法上。通常是医学相关研究,并且一定是涉及到定类数据的研究方法才可能使用‘加权格式’,SPSSAU支持的加权数据研究方法如下:
【可视化】词云
【实验/医学研究】卡方检验
【实验/医学研究】Kappa
【实验/医学研究】配对卡方
【实验/医学研究】Poisson回归
【实验/医学研究】Ridit分析
【实验/医学研究】卡方拟合优度
【实验/医学研究】Poisson检验
如果是手工进行录入数据,请参考上述第一点说明。如果是手工录入问卷数据,可参考录入格式模板如下:https://pubimage.spssau.com/data-entering.xlsx
SPSSAU当前支持的数据格式为:EXCEL(xls、xlsx)、CSV、SPSS格式(.sav)
如果是使用问卷平台,比如国外的Surveymonkey,Qualtrics,也或者国内的问卷星、腾讯问卷、问卷网等。它们均可直接下载数字格式的EXCEL/CSV格式数据(请勿使用‘文本格式’的EXCEL数据等,因为算法只认识数字不认识文字);同时这几个平台也支持.sav格式数据下载可直接上传SPSSAU。
如果是使用数据库下载的数据,一般为EXCEL或者CSV格式数据,请直接上传到SPSSAU即可使用。
更多关于数据上传的说明参考页面:https://www.spssau.com/helps/basics/uploaddatas.html
其它涉及上传数据问题,请提交人工客服反馈,会由人工服务回复处理。