发布时间:2020-11-13 10: 57: 32
在存在多个数据源的情况下,经常会使用到IBM SPSS Statistics的数据合并功能,对多个数据源的数据进行合并。
比如在收集地区数据时,需要不同地区的人员分开收集,而在数据汇总的阶段,就需要使用到数据合并的功能将这些不同来源的数据合并汇总。本节,我们将会重点学习变量的合并。
一、打开需合并的数据
变量合并的作用是将不同数据文件中,相同个案的不同变量数据进行合并。比如数据A包含了年龄、性别等数据,而数据B包含了地区、收入等数据,而这些数据都是来自同一批个案,就可以通过变量合并数据。
首先,在SPSS中分别打开两个需要合并的数据文件。
如图2所示,可以看到,两个数据文件中存在着账号、性别、客单价三个相同变量,以及Area、地区、来源、点击页面数四个不同变量,其中地区与Area实际为同一个变量,但命名方式不同。
二、使用变量合并功能
接着,如图3所示,依次打开数据-合并文件-添加变量,针对数据文件的异同点进行变量合并。
由于当前打开的是数据集2,因此最终的数据会合并到数据集2中。如图4所示,以数据集2为基础,与之前已打开的数据集3进行合并。
接着,如图5所示,打开变量选项卡,进行变量合并的设置。
其中,变量括号中含+的是数据集2中不包含的变量,而含*的是数据集2中包含的变量。设置的变量含义如下:
排除的变量,即两个数据文件中存在差异的,但在合并数据过程中需要剔除的变量。
包含的变量,即两个数据文件中存在差异的,但在合并数据过程中需要保留的变量。
键变量,即两个数据文件同时包含的变量。
由于变量“地区”与“Area”实际为同一变量,可将其中一个添加为“包含的变量”,另外,还可以通过重命名的方法,将“Area”重命名为“地区”。
如图6所示,可以看到“Area”已重命名为“地区”,将其添加为“包含的变量”。
如图7所示,在包含的变量中,“Area”变量已经重命名为“地区”变量。当然,我们也可以直接使用数据集2中包含的“地区”变量。
完成以上操作后,如图8所示,可以看到,变量已经合并完成。后续,可对数据作进一步的整理,如排序等。
以上就是SPSS数据合并中的变量合并操作演示。除了变量合并外,数据合并中还包含了个案合并的功能,如需获取该功能的介绍,可前往IBM SPSS Statistics中文网进一步探索。
展开阅读全文
︾
读者也喜欢这些内容:
spss合并文件的操作步骤 spss合并文件变量怎么配对
可以使用两种方式合并两个数据文件中的数据,一是包含相同个案但不同变量的数据集,另一个是包含相同变量但不同个案的数据集,本文主要向大家介绍如何合并包含相同个案但不同变量的数据集。关于SPSS合并文件的操作步骤是什么,SPSS合并文件变量怎么配对,结合实例,向大家作简单介绍。...
阅读全文 >
spss卡方检验结果线性关联是什么 spss卡方检验结果没有连续性校正
对于两组连续性变量,一般通过回归分析判断两者是否存在相关关系。对于离散型变量,则需借助卡方检验判断两者之间是否存在相关关系。变量数据类型不同,SPSS卡方检验提供的结果形式也有所不同,因此很多用户会感到不解。本文结合实例向大家介绍SPSS卡方检验结果线性关联是什么,SPSS卡方检验结果没有连续性校正原因是什么。...
阅读全文 >
spss回归分析如何操作 spss回归分析的基本步骤
通过回归分析,可以了解变量间是否存在相互依赖的定量关系。根据方程类型,回归分析可以分为线性回归和非线性回归。根据变量的数目多少,回归分析可以分为一元回归分析和多元回归分析。本文以最简单的一元线性回归分析为例向大家介绍SPSS回归分析如何操作,SPSS回归分析的基本步骤。...
阅读全文 >
spss计算平均值和标准差 spss计算平均值的置信区间
平均值和标准差反应了数据的集中趋势和分布特点。对于符合正态分布的少量数据(小于20),在一定的置信水平下,还可以通过t分布,了解总体平均值的分布区间。通过SPSS计算变量功能,可以完成数据平均值和标准差的计算,进而计算总体平均值的置信区间。如何使用SPSS计算平均值和标准差,SPSS计算平均值的置信区间如何操作,本文结合实例,向大家作简单介绍。...
阅读全文 >