
发布时间:2020/12/14 11:03:01
面对庞大的数据库,如何才能进行更加精准的分析?除了对整体数据进行分析外,我们还可以使用IBM SPSS Statistics的选择个案分析方法,指定数据的分析范围,比如以条件筛选的方式选择个案,以获得更精准的数据分析结果。
接下来,本文将分为两节,详细介绍IBM SPSS Statistics的选择个案分析方法。事不宜迟,一起来学习下吧。
一、打开数据文件
首先,打开一组包含定性与定量变量的数据,其中包含了账号、性别、地区三个定性变量,以及客单价、点击页面数两个定量变量,因后续需演示个案的条件筛选功能。
二、使用选择个案功能
接着,在IBM SPSS Statistics的数据菜单中,选择“选择个案”选项。
在打开的“选择个案”功能面板中,可使用选择所有个案、条件满足个案、随机个案等选项。其中所有个案,即不作任何筛选的选项,后续使用过滤输出时,可通过“所有个案”选项恢复已过滤的数据。
在输出方式的设置上,如果后续数据集还需要进行其他的分析操作,建议选择“将选定个案复制到新数据集”的方式。
过滤选项是将被筛选掉的个案暂时锁定,可在输出数据集中看到这些个案被划一斜线,而且数据集的末端会生成一个新的过滤变量(filter_$),保留的个案标记为1,锁定的个案标记为0。
由于个案只是暂时锁定的状态,如需恢复数据,只需选择“所有个案”,即可恢复。
接下来,我们使用实例逐一讲解不同的个案选项。
三、实例演示条件筛选
条件筛选选项,即通过函数、复杂方程式等设置条件,筛选个案范围的选项。如图5所示,单击“如果”按钮。
接着,在弹出的“if”函数面板中设置筛选条件。如图6所示,以筛选“点击页面数为1”的个案为例,需先将“点击页面数”添加到编辑框中,然后再分别单击“=”、“1”,完成“点击页面数=1”函数的编辑。
接着,在输出的数据集中,就可以获得仅包含“点击页面数为1”的个案。
四、实例演示随机个案样本
在进行数据研究时,经常需要获取数据的自然分布规律,比如地区的年龄分布、性别分布等。在分析自然分布规律时,需剔除各种人为因素,尽可能地做到随机性。
如需获取变量值的随机分布数据的话,随机个案样本就能很好地确保随机性。如图8所示,单击“样本”开启设置面板。
如图9所示,随机个案样本的百分比选项的随机性会更好,但如果是要获取早期录入数据的随机样本,可以选取第二种随机方式,即抽取N个个案,来自前N1个个案。
我们以抽取10%的所有个案为例,随机抽取个案。
如图10所示,可以看到,输出的数据集中仅包含了12个个案,且个案的序号都是随机的。
本节中,我们主要学习了选择个案中的条件筛选与随机选取个案的功能,下一节,将会继续讲解基于时间或个案范围、使用过滤变量两种选择个案的功能。如需获取下一节内容,欢迎访问IBM SPSS Statistics中文网站。
作者:泽洋
读者也喜欢这些内容:
spss pearson相关性分析步骤 spss pearson相关性分析结果怎么看
Pearson(皮尔逊)相关性指的是联合分布服从二维正态分布的随机变量X,Y之间的简单线性相关关系,X,Y之间的相关关系由简单相关系数r表示。利用IBM SPSS Statistics可以非常快速地完成两个随机变量X,Y间的Pearson(皮尔逊)相关性分析,SPSS Pearson相关性分析步骤是什么,SPSS Pearson相关性分析结果怎么看,本文结合实例,向大家做简单的介绍。...
阅读全文 >
spss缺失值处理方法 spss缺失值怎么设置
我们在使用SPSS处理数据时,会遇到中间的数值缺失的状况,处理数据的首要前提便是需要确保我们输入数据的准确。因此,就需要对缺失的数值进行找回,那么下面就来给大家介绍SPSS缺失值处理方法,SPSS缺失值怎么设置。...
阅读全文 >
spss缺失值可以不处理吗 spss缺失值填补方法
SPSS的缺失值是指现有的数据集中某些属性是不完全的,而这些不完全的数据可能导致数据处理的结果出现偏差。在实际操作中,数据处理的内容同样与缺失值数据的缺失比例有关。所以使用SPSS遇到缺失值时,要了解正确的处理步骤,那么下面就来给大家介绍SPSS缺失值可以不处理吗,SPSS缺失值填补方法。...
阅读全文 >
spss中位数怎么求 spss中位数的置信区间怎么求
中位数是统计学中的常用统计量,是按顺序排列的一组数据中居于中间位置的数,并且中位数在统计中不受数列的极大值或者极小值影响,因此提高了中位数对分布数列的代表性。那么下面就来给大家介绍SPSS中位数怎么求,SPSS中位数的置信区间怎么求。...
阅读全文 >