发布时间:2020-12-08 13: 48: 56
在进行数据录入时,以数值型数据录入会更有利于后续的统计计算。但如果在录入时,采用了字符串值的录入方式,该如何将其转化为可计算的数值呢?在这种情况下,可以使用IBM SPSS Statistics的重新编码功能,将字符串重新编码为数值。
IBM SPSS Statistics自动重新编码功能,可自动为变量创建编码,同时保留变量定义的标签和值标签,对未定义值标签的任何值,将使用原值作为重新编码后的值标签。
一、打开数据文件
首先,打开一组数据,该数据包含了性别、客单价、地区等变量。我们需要对地区与来源进行重新编码,方便后期的数据处理。
二、使用自动编码功能
如图2所示,打开IBM SPSS Statistics转换菜单中的“自动重新编码”功能。
如图3所示,设置面板中包含变量新名称、编码起点、编码模板等选项。接下来,我们使用示例的数据逐步操作。
1、选择变量
首先,如图4所示,将需要重新编码的地区变量从左侧添加到右侧方框中。
2、编辑新名称
然后,如图5所示,选中已添加的地区变量,在新名词处输入重新编码后的变量名称:地区编码,并将其添加为新名称。
3、设置编码方式
完成变量的设置后,再进一步设置如下选项:
1. 编码起点,设置从最小值或最大值处开始编码
2. 对所有变量使用同一种重新编码方案,即添加的所有重新编码变量都采用同一套编码方案,下文我们会使用实例解释
3. 将空值设为用户缺失值
4. 应用模板或另存为模板(作为码表方便后续使用)
如果我们添加了两个变量为重新编码的变量,比如地区和来源,同时还勾选了“对所有变量使用同一种重新编码方案”选项的话,就会出现如图7所示的结果,地区与来源的变量会混合起来重新编码。
但实际上,我们应该要将两个变量的编码值分开,因此,本例不能勾选“对所有变量使用同一种重新编码方案”选项。
取消选项勾选后,再次运行,如图8所示,可以看到,地区与来源的码表已经分开了。
返回数据集,如图9所示,可以看到,数据中出现了两个新的变量,分别是“地区编码”与“来源编码”。
以上就是IBM SPSS Statistics自动重新编码功能的应用介绍。如果变量中包含较多不同字符串值的话,该功能就能很好地减轻编码的负担,并能自动形成码表供后续使用。
作者:泽洋
展开阅读全文
︾
读者也喜欢这些内容:
spss多元线性回归分析操作步骤,spss多元线性回归分析结果解读
spss多元线性回归分析操作步骤,本文会以客流量、销售量与销售额的线性关系演示spss的多元线性回归分析操作步骤,并进行spss多元线性回归分析结果解读。...
阅读全文 >
如何使用SPSS进行双变量分析 SPSS双变量分析实例
双变量分析的目的是确定两个变量之间的相关性,测量它们之间的预测和解释能力。这种分析方法常常被用于经济和统计学科的模拟计算中。今天,我就向大家演示一下,如何使用SPSS进行双变量分析,SPSS双变量分析实例。...
阅读全文 >
想成为数据分析师需要掌握哪些技能和软件
在大数据被广泛运用的今天,数据已经成为企业之间非常重要的竞争点之一。而作为与数据打交道最密切的职业——数据分析师,也将迎来了黄金就业期。据艾瑞研究统计,在过去的两年中,由于各行各业新聘用了80万名数据科学家,数据科学岗位的短缺问题已大大缓解;但是今天市场上仍然有成千上万的空缺职位,其中大部分在美国和中国。...
阅读全文 >
spss卡方趋势检验怎么做 spss卡方趋势检验步骤
对于两组定类变量,如果想了解它们之间是否存在线性相关关系,可以借助趋势卡方检验(Trend χ2 Test),根据趋势卡方检验结果可以判断变量间是否存在相关关系,并且可以进一步了解变量间相关关系是否为线性相关关系。关于SPSS卡方趋势检验怎么做,SPSS卡方趋势检验步骤是怎样的,本文结合实例向大家做简单的介绍。...
阅读全文 >