如何在IBM SPSS Statistics中进行K均值聚类分析

发布时间：2021-09-18 14: 08: 29

IBM SPSS Statistics的K均值聚类分析，是一种采用欧式距离作为分类指标的迭代聚类分析方法。其优点是操作简单，运算速度快，但由于其聚类原理是将欧式距离相似的数据归为一个类别，因此需采用连续型的数据变量。

接下来，我们通过实例来演示一下K均值聚类分析。

一、数据准备

本例使用的是一组店铺的销售数据，包含客流量、销售额与销售量三个连续型变量。我们会使用到以上三个连续变量对数据个案进行K均值聚类分析。

二、K均值聚类参数设置

K均值聚类分析是SPSS分类分析法中的一种，由于其运算的快速性，也被称为“快速聚类”。

如图3所示，K均值聚类分析设置面板包含变量、聚类中心等设置参数。

按照数据分析目的，如图4所示，我们需将客流量、销售额、销售量添加为变量，然后再单击右侧的“保存”按钮，保存“聚类成员”与“与聚类中心的距离”两个新变量。

接着，打开“迭代”设置，设置最大迭代次数，一般按照默认即可，如果默认次数过小，应尽量调大。

最后，设置分析的选项，如图6所示，勾选“初始聚类中心”与“每个个案的聚类信息”，以了解初始聚类与最终聚类的个案数目；勾选“ANOVA表”，检验分析的置信水平。

三、结果解读

运行分析后，回到数据表，如图7所示，原数据表末端出现了两个新变量，分别是“聚类成员”与“与聚类中心的距离”。我们可以从中观察到每个个案所属的聚类，以及该个案与聚类中心的距离。

而从分析结果看到，SPSS初始设定了两个聚类。

而经过2次迭代运算后，最终聚类中心仍设定为两个不变。

而从ANOVA分析表看到，客流量、销售额、销售量的显著性都小于0.001，说明这三个变量都能很好地区分各个分类。

最后，从“每个聚类中的个案数目”可得到每一类别包含的个案数量。

四、小结

综上所述，K均值聚类分析，可利用欧式距离的测量，快速地将距离相似的个案归总为一个类别，但也要注意到的是，K均值聚类分析受异常值影响较大。

除K均值聚类，SPSS还提供了系统聚类、二阶聚类的分类方法，可前往SPSS中文网站获取更加系统的演示分享。

作者：泽洋

展开阅读全文

︾

标签：SPSS，聚类分析

上一篇：如何在IBM SPSS Statistics中使用简单对应分析两定性变量间关系
下一篇：IBM SPSS Statistics中分层聚类法的实际应用

读者也访问过这里:

SPSS Statistics

强大的数据分析平台

立即购买

微信群

官方微信群立即加群

400-8765-888

kefu@makeding.com

下载试用

最新文章

SPSS变量值设定为0却变成00 SPSS计算变量为什么有空值

我们在处理数据样本的过程中，有时候会遇到变量设定错误的问题。就是在设置变量值的时候把变量设定为0，但是实际在数据分析运算的过程中却变成了00，并且在计算变量过程中又出现了空值。出现这种情况可能会直接影响数据分析结果的精准度，因此需通过调整变量类型修正数据。下面以SPSS为例，给大家介绍SPSS变量值设定为0却变成00，SPSS计算变量为什么有空值的具体内容。

2026-07-02

SPSS中如何将年龄分段筛选出来 SPSS如何将年龄从字符串改为数字

在进行社会科学研究时，往往会需要进行调研。在调研之后，我们做调研数据处理时，可能会遇到格式不整齐的情况，例如变量并非单纯的数字，而是包含了“岁”等单位。这样的字符串格式的年龄不能直接用于数据分析，而是必须先转换成纯数字。接下来我将为大家介绍：SPSS 中如何将年龄分段筛选出来，SPSS如何将年龄从字符串改为数字的相关内容。

2026-07-02

SPSS中如何将字符串变量转换为数值 SPSS字符串数据怎么处理

我们在用问卷收集数据的时候，难免要设置一些开放题。由于开放题没有固定的答案，所以比较难事先做好编码，一般都是将答案收集好后再整理。因此，将数据导入SPSS后，可能会有一些字符串的变量，需要进行二次处理。接下来我们会介绍SPSS中如何将字符串变量转换为数值，SPSS字符串数据怎么处理的相关内容。

2026-07-02

SPSS的检验方法有哪些 SPSS如何做z检验

在做研究分析时，我们可能要做各种数据的检验运算，比如看数据是否满足正态性、方差齐性，看各种组别的数值是否有统计学差异等。SPSS提供了很多实用的分析方法、参考图表等功能，可以快速而简单地做好数据的检验，接下来我们会介绍SPSS的检验方法有哪些，SPSS如何做z检验的相关内容。

2026-07-02

SPSS中的F值是什么 SPSS中P值和F值如何计算

在SPSS得出的运算结果中，会出现一些F值、P值等结果，对于初学者来说，这些统计量可能会有点陌生，但它们在数据研究中，有着重要的意义。其实不仅是SPSS，其他同类型的统计软件也会出现这些统计量。接下来我们会介绍SPSS中的F值是什么，SPSS中P值和F值如何计算的相关内容，让大家可以更熟悉这方面的内容。

2026-07-02

SPSS验证假设需要什么分析 SPSS假设检验模型一模型二模型三是什么意思

假设验证，是很多数据研究里面会用到分析方法，可以用来看数据是否有差异、是否满足正态性、方差是不是相等等。验证假设用到的分析方法，会因为不同的数据类型、研究方向等而有所不同，它们会影响到我们要选择的方法，比如t检验、ANOVA等。接下来我们会介绍SPSS验证假设需要什么分析，SPSS假设检验模型一模型二模型三是什么意思的相关内容。

2026-07-02

微信公众号

欢迎加入 SPSS 产品的大家庭，立即扫码关注，获取更多软件动态和资源福利。

读者也喜欢这些内容: