发布时间:2021-06-01 11: 33: 16
“分箱法”相信学过统计学的小伙伴们都不会陌生,它的主要作用就在于对噪音数据进行剔除,同时将连续型数据进行离散处理。在模型分析开始前,我们经常需要使用到分箱法来处理和清洗数据。
作为一款功能全面、专业性强的统计分析软件,IBM SPSS Statistic同样具备分箱功能,下面我们一起来通过一篇教程了解一下。
图1是我们准备要分箱的数据,我们将对年龄列进行分箱,按照每10岁为一个标准进行分箱。
点击“转换”中的“可视分箱”,进入分箱设置界面。
将“年龄”拉入到“要分箱的变量”中,然后点击“继续”。
在图4所示界面,我们可以看到要扫描的个案数共34个,其中最大的变量值为67,最小为22,也就是说要分箱的数据年龄段在22到67岁之间。
我们在“分箱化变量”中,填入“年龄段”,作为一个之后新生成的变量,随后点击“生成分割点”按钮。
按照我们的分箱目的,我们要每隔10岁分组一次,最小的年龄为22岁,则我们需要在第一个分割点位置填写“20”,然后在宽度填写“10”,此时点击键盘Tap键,SPSS会自动生成分割点数的值为“5”,如图5所示。
这样子SPSS会自动帮我们将20到30、30到40、40到50、50到60、60到70的年龄段进行分组,一共5组。
点击“应用”按钮后,回到“可视分箱”界面中,我们可以在图6红框位置看到后续的分箱值,标签栏默认是空值,我们可以进行自定义填写,如设置20的分箱标签为2。
最后点击“确定”按钮,开始进行数据分箱,分箱后的新数据结果如图7所示,生成了新的“年龄段”列,数据也非常正确地进行了分箱,如年龄为27的那行数据,被正确地设置到了标签为2的分箱中。
以上就是使用IBM SPSS Statistic对演示数据中的年龄指标,按照每隔10岁的标准,进行分箱的全部教程,上述演示的是等距分箱,小伙伴也可以自己动手在IBM SPSS Statistic中尝试一下不等距分箱哦。
作者:包纸
展开阅读全文
︾
读者也喜欢这些内容:
spss怎么把变量分组 spss怎么定义分类变量
在进行数据分析时,变量分组是一种常见的方法,用于将一组数据分成多个子组,以便进行更加细致和深入的数据分析和解释。SPSS是一种常见的统计学软件,也提供了变量分组的功能。本文将介绍SPSS怎么把变量分组,SPSS怎么定义分类变量的内容。...
阅读全文 >
IBM SPSS Statistics云版本登录使用教程
感谢您订阅IBM SPSS Statistics云版本服务,IBM SPSS Statistics云版本是由思杰马克丁+IBM+阿里云联合推出,帮助用户解决短时间使用正版软件的需求,提供周付费、月付费两种购买模式,性价比极高。那么在购买了IBM SPSS Statistics云版本之后,应该如何登陆使用呢,本篇教程就来告诉大家使用方法。...
阅读全文 >
SPSS缺失值怎么输入 SPSS缺失值怎么自动填充
有时候导入SPSS中的数据资料,会因为人为原因或者设备原因出现缺失数据,遇到这种情况如果是一些调研数据资料,想再重新进行调研收集数据资料,显然是不可能的,所以需要对缺失的数据进行处理。本文就和大家详细介绍一下,SPSS缺失值怎么输入,以及SPSS缺失值怎么自动填充。...
阅读全文 >
spss缺失值分析怎么做 spss缺失值分析结果怎么看
我们进行统计分析工作时,会遇到样本数据丢失地问题。如果直接对缺失样本的数据进行分析,会造成统计结果的偏差,甚至得出相反的结论,因此,进行缺失值分析和处理非常有必要。SPSS可以对数据进行回归估计,拟合迭代,直至估计出恰当的缺失值,因此可以借助SPSS进行缺失值分析处理。SPSS缺失值分析怎么做,SPSS缺失值分析结果怎么看,本文结合实例向大家做简单的介绍。...
阅读全文 >