SPSS数据文件的建立和管理
SPSS数据文件的结构和定义
SPSS数据文件是一种有结构的数据文件,它包括文件结构和数据两部分
数据
文件结构
Spss13.0中变量定义的操作
单击Variable View 进入;
单击,
定义
变量
名
单击,定义变量类型
定义变量标签
变量标签值
定义测度层次
定义变量宽度
定义对齐方式
定义变量类型对话框
定义变量标签值对话框
定义变量定义缺省值对话框
变量名(Variable Name)
变量名是变量存取的唯一标志.在定义SPSS数据文件结构时应首先给出每列变量的变量名.为了方便记忆,变量名最好与其代表的数据含义相对应.
注意:不能含数字
变量的类型表
显示
输入
believe
believe
一串字符串
一串字符串
无
8
String
Custom Currency
$12343
$12343
有效数值前带$以逗点为分割符
可带$或不带$输入或科学记数法
2
8
Dollar
显示格式非常多
日期格式非常多
Date
457.8E4
457.8E4
科学记数法
科学记数法
标准格式或
2
8
Scietific notation
3.434,34
34,3434E2
逗点做小数点,原点做三位分割符的数值
带圆点的数值或科学记数法
2
8
Dot
1,343,438.1
1,343,438.1
原点做小数点,逗点做三位分割符的数值
带逗点的数值或科学记数法
2
8
Comma
38.42
38.42
标准格式数值变量原点表示小数点的数值
标准格式或科学记数法
2
8
Numeric
范例
显示方式
输入方式
小数位数
系统默认长度
SPSS变量类型
列宽度
列宽度的数值为变量值显示时占用的宽度.变量的列宽度只影响变量值在数据编辑窗口中的显示效果,对所定义的变量的总宽度和变量的值均无影响.
如果指定的显示列宽度小于所定义的变量总宽度或单元格中实际的数据宽度,此时,数据显示为"****".
可用鼠标拖拽变量的列边界改变列宽度.
列宽度
变量标签与变量值标签
变量标签(Variable Labels)
为为进一步描述变量所表示的意义,特别是当变量名不能充分描述变量所表述的意义时.
变量值标签 (Value Labels)
为进一步说明变量的可能取值,它可以定义,也可不定义.
如:变量取值为:grade1, grade2, grade3, grade4,其表示年级,则变量标签为年级,而变量值标签对应变量取值为:本科一年级,本科二年级,本科三年级,本科四年级.
变量名标签
值标签
通过定义变量的值标签可以对变量的每一个取值作进一步的说明.通常我们只对分类变量定义其值标签.例如"性别","民族" , "产品等级"等.
缺失值
通过定义缺失值,可以对其进行限制.在数据分析时对缺失值作特别处理,绝大部分情况下都将缺失值排除在数据分析的范围之外.
定义缺失值的方式有如下三种:
无缺失值
离散型缺失值
一个数值范围加一个离散值
缺失值
对齐方式
Align属性仅仅影响变量值(或值标签)在数据编辑视图中的 显示方式.对数值型变量,系统默认状态为右对齐;对字符型变量,系统默认状态是左对齐的.
测度标准
定距型数据(Scale)通常是指诸如身高,体重等连续型变量
定序型(Ordinal)具有内在固有大小或高低顺序 .如职称变量可以有高级,中级和低级三个取值,可以分别用1,2和3表示.
定类型数据(Nominal)没有内在固有大小或高低顺序,一般是以数值或字符表示的分类数据.如性别变量中的男,女取值,可以分别用1,2表示.
变量名
数据类型
标签
变量名标签
变量值标签
缺失值
度量尺度
SPSS数据的结构
(虚线中的内容可省略)
实验2.1:一张居民储蓄调查问卷 ,请设计该调查数据在SPSS中的数据结构.
1,您的户口属于:(1)城镇户口 (2)农村户口
A1 户口
Measurement Level: Nominal
Column Width:8 Alignment:Right
Value Label
1 城镇户口
2 农村户口
3,您的年龄是:(1)20岁以下 (2)20—35岁 (3)35—50岁 (4)50以上
A3 年龄
Measurement Level: Ordinal
Column Width: 8 Alignment: Right
Value Label
1 20岁以下
2 20-35岁
3 35-50岁
4 50以上
7,您本次存款的金额是多少 ( )元
A7 存款金额
Measurement Level: Scale
Column Width: 8 Alignment: Right
8,存款的目的是什么 (多选)(1)买高档消费品 (2)结婚用 (3)正常生活零用(4)做生意 (5)购买农业生产资料 (6)其他
A8-1 目的一 Measurement Level: Nominal Column Width: 8 Alignment: Right
Label Value
1 买高档消费品
2 结婚用
3 正常生活零用
4 做生意
5 购买农业生产资料
6 其 他
SPSS数据文件的录入与获取
SPSS的数据录入操作在数据编辑窗口中的Data View卡片中实现.其操作方法与Excel基本类似,也是以电子表格的方式进行录入,数据录入可以逐行进行.录入完一个数据后按Tab键,于是当前单元的右边一个单元便自动成为当前单元;数据录入也可以逐列进行,录入完一个数据后按Enter键,于是当前单元下方的单元便自动成为当前单元.
SPSS数据文件的导入
SPSS可读入其他格式的数据文件
基本操作步骤是:
第一步:选择菜单File→Open→Data;
第二步:选择数据文件的类型,输入数据文件名;
或者:采用文本向导
实验2.2
1.将数据2-1.xls导入到SPSS中.
2.A1列的数据表示居民的户口,请在SPSS中用相应的数据结构表示出来;同时,在A1列中有几个异常数据,您能找出来吗 该如何处理
3.A3列的数据表示居民的年龄,请在SPSS中用相应的数据结构表示出来;同时该列数据有缺失值,该如何处理
保存数据
保存和导出分析结果
保存:在结果浏览窗口中(注意:一定要在结果浏览窗口中)选择菜单File==>Save
导出: SPSS提供了将结果导出为纯文本格式或网页格式的功能,在结果浏览窗口中选择菜单File==>Export,系统会弹出Exprot Output对话框
SPSS数据的预处理
已知文件2-1.sav表示实验2-1中的居民储蓄调查数据.请利用SPSS分别完成下列操作:
1.为了统计需要,请将原始数据进行转置.
2.请计算不同年龄阶段的居民每月存款金额的平均数;计算以户口为分组标志,每月存款金额在100圆到1000圆的居民百分比.
3.按职业类别顺序显示调查数据.
4.从原数据样本中选择35-50岁人中有城镇户口的每月存款金额超过500圆的居民样本数据.
SPSS数据的预处理
5.在原数据样本中加入另外一个调查小组调查的数据资料,见数据2-2.sav.并要把这两个小组的调查样本数据给区分开来.
6.考虑通货膨胀因素,设通货膨胀率为3%,则居民的实际存款金额为多少,请建立sjck变量表示.
7.由于统计员的粗心将户口的选项代码弄错,应为0表示城镇户口,1表示农村户口,请帮忙调整过来.
8.分不同年龄段给出居民存款金额按从大到小的排列次序.