发布时间:2021-09-18 14: 08: 29
IBM SPSS Statistics的K均值聚类分析,是一种采用欧式距离作为分类指标的迭代聚类分析方法。其优点是操作简单,运算速度快,但由于其聚类原理是将欧式距离相似的数据归为一个类别,因此需采用连续型的数据变量。
接下来,我们通过实例来演示一下K均值聚类分析。
一、数据准备
本例使用的是一组店铺的销售数据,包含客流量、销售额与销售量三个连续型变量。我们会使用到以上三个连续变量对数据个案进行K均值聚类分析。
二、K均值聚类参数设置
K均值聚类分析是SPSS分类分析法中的一种,由于其运算的快速性,也被称为“快速聚类”。
如图3所示,K均值聚类分析设置面板包含变量、聚类中心等设置参数。
按照数据分析目的,如图4所示,我们需将客流量、销售额、销售量添加为变量,然后再单击右侧的“保存”按钮,保存“聚类成员”与“与聚类中心的距离”两个新变量。
接着,打开“迭代”设置,设置最大迭代次数,一般按照默认即可,如果默认次数过小,应尽量调大。
最后,设置分析的选项,如图6所示,勾选“初始聚类中心”与“每个个案的聚类信息”,以了解初始聚类与最终聚类的个案数目;勾选“ANOVA表”,检验分析的置信水平。
三、结果解读
运行分析后,回到数据表,如图7所示,原数据表末端出现了两个新变量,分别是“聚类成员”与“与聚类中心的距离”。我们可以从中观察到每个个案所属的聚类,以及该个案与聚类中心的距离。
而从分析结果看到,SPSS初始设定了两个聚类。
而经过2次迭代运算后,最终聚类中心仍设定为两个不变。
而从ANOVA分析表看到,客流量、销售额、销售量的显著性都小于0.001,说明这三个变量都能很好地区分各个分类。
最后,从“每个聚类中的个案数目”可得到每一类别包含的个案数量。
四、小结
综上所述,K均值聚类分析,可利用欧式距离的测量,快速地将距离相似的个案归总为一个类别,但也要注意到的是,K均值聚类分析受异常值影响较大。
除K均值聚类,SPSS还提供了系统聚类、二阶聚类的分类方法,可前往SPSS中文网站获取更加系统的演示分享。
作者:泽洋
展开阅读全文
︾
读者也喜欢这些内容:
spss输出窗口要另存为吗 spss输出窗口数据怎么删除
SPSS(Statistical Package for the Social Sciences)是一款广泛应用于社会科学和商业领域的统计分析软件,它可以帮助用户进行数据处理、数据分析和生成各种统计报告。在SPSS中,输出窗口是一个重要的界面,它会显示您运行的分析结果、数据摘要、图表和报告等内容。在进行数据分析时,用户常常会有一个疑问:SPSS输出窗口中的结果是否需要另存为?在本文中,我们将解答这个问题,并介绍如何在SPSS中删除输出窗口中的数据。...
阅读全文 >
spss数据分析用处大么 spss数据分析的原理
借助SPSS我们可以完成数据统计,分析和挖掘,从而把握数据变化规律,积极人为干预,提高经济和社会效益。对于很多数据分析初学者来说,常常有SPSS数据分析用处大么?SPSS数据分析的原理是什么的疑问,本文向大家做简单介绍。...
阅读全文 >
spss计算变量是干什么的 spss计算变量怎么用
在数据分析过程中,SPSS软件的计算变量功能是一个重要且实用的工具。本文将重点讨论SPSS计算变量的作用,以及如何使用计算变量功能。首先,我们将介绍SPSS计算变量的基本概念,然后详细阐述如何在SPSS中使用计算变量功能。...
阅读全文 >
SPSS数值如何变为绝对值 SPSS数值如何标准化
在数据统计分析过程中,通常会收集大量的不同指标变量,每个指标的数量级以及性质等特征,都会存在一些差异化,如果直接进行数据统计分析,可能会导致最后的分析结果存在偏差。为了让各个指标变量之间的能够统一标准,要对数值进行标准化处理,以消除各个指标变量之间属性的差异,下面本文就和大家详细介绍一下,SPSS数值如何变为绝对值,以及SPSS数值如何标准化。...
阅读全文 >