发布时间:2021-06-01 11: 33: 16
“分箱法”相信学过统计学的小伙伴们都不会陌生,它的主要作用就在于对噪音数据进行剔除,同时将连续型数据进行离散处理。在模型分析开始前,我们经常需要使用到分箱法来处理和清洗数据。
作为一款功能全面、专业性强的统计分析软件,IBM SPSS Statistic同样具备分箱功能,下面我们一起来通过一篇教程了解一下。
图1是我们准备要分箱的数据,我们将对年龄列进行分箱,按照每10岁为一个标准进行分箱。
点击“转换”中的“可视分箱”,进入分箱设置界面。
将“年龄”拉入到“要分箱的变量”中,然后点击“继续”。
在图4所示界面,我们可以看到要扫描的个案数共34个,其中最大的变量值为67,最小为22,也就是说要分箱的数据年龄段在22到67岁之间。
我们在“分箱化变量”中,填入“年龄段”,作为一个之后新生成的变量,随后点击“生成分割点”按钮。
按照我们的分箱目的,我们要每隔10岁分组一次,最小的年龄为22岁,则我们需要在第一个分割点位置填写“20”,然后在宽度填写“10”,此时点击键盘Tap键,SPSS会自动生成分割点数的值为“5”,如图5所示。
这样子SPSS会自动帮我们将20到30、30到40、40到50、50到60、60到70的年龄段进行分组,一共5组。
点击“应用”按钮后,回到“可视分箱”界面中,我们可以在图6红框位置看到后续的分箱值,标签栏默认是空值,我们可以进行自定义填写,如设置20的分箱标签为2。
最后点击“确定”按钮,开始进行数据分箱,分箱后的新数据结果如图7所示,生成了新的“年龄段”列,数据也非常正确地进行了分箱,如年龄为27的那行数据,被正确地设置到了标签为2的分箱中。
以上就是使用IBM SPSS Statistic对演示数据中的年龄指标,按照每隔10岁的标准,进行分箱的全部教程,上述演示的是等距分箱,小伙伴也可以自己动手在IBM SPSS Statistic中尝试一下不等距分箱哦。
作者:包纸
展开阅读全文
︾
微信公众号
读者也喜欢这些内容:
SPSS求中位数的步骤 SPSS如何计算四分位数间距
在数据统计工作中,对数据进行中位数分析和四分位数分析是比较常用的数据分析方法,也是学习数据统计分析小伙伴最先掌握的数据统计分析方法,不过还是有一些小伙伴对此表示不是很理解,下面通过SPSS给大家详细讲解,SPSS求中位数的步骤,以及SPSS如何计算四分位数间距。...
阅读全文 >
SPSS数据拆分有什么用 SPSS数据拆分有哪些步骤
作为一款专业的数据分析软件,SPSS提供了灵活且高效的数据拆分功能。使用SPSS拆分包含多个变量的大型数据集,可以帮助研究人员简化分析对象,显著提高数据处理的效率。有关SPSS数据拆分有什么用,SPSS数据拆分有哪些步骤的问题,本文将进行详细介绍。...
阅读全文 >
SPSS变量怎么定义 SPSS变量怎么赋值
每次打开新的SPSS数据集,我都会先检查变量属性。只有正确定义变量的名称、类型、赋值等参数,才能确保接下来数据计算的准确性。变量属性的定义错误,不仅会导致分析结果出错,还会造成某些功能无法使用。有关SPSS变量怎么定义,SPSS变量怎么赋值的问题,本文将进行详细介绍。...
阅读全文 >
SPSS正态性分析怎么做 SPSS正态性检验结果分析
SPSS是一款功能强大的数据统计分析软件,支持数据统计、数据分析和数据可视化三大功能。在SPSS中,正态性分析是数据分析功能的一部分,是一种基础的数据分析操作。大家在用SPSS进行正态性分析时,可能会遇到一些问题,本文将为大家介绍SPSS正态性分析怎么做,SPSS正态性检验结果分析的相关内容。...
阅读全文 >