发布时间:2021-09-18 14: 08: 29
IBM SPSS Statistics的K均值聚类分析,是一种采用欧式距离作为分类指标的迭代聚类分析方法。其优点是操作简单,运算速度快,但由于其聚类原理是将欧式距离相似的数据归为一个类别,因此需采用连续型的数据变量。
接下来,我们通过实例来演示一下K均值聚类分析。
一、数据准备
本例使用的是一组店铺的销售数据,包含客流量、销售额与销售量三个连续型变量。我们会使用到以上三个连续变量对数据个案进行K均值聚类分析。

二、K均值聚类参数设置
K均值聚类分析是SPSS分类分析法中的一种,由于其运算的快速性,也被称为“快速聚类”。

如图3所示,K均值聚类分析设置面板包含变量、聚类中心等设置参数。

按照数据分析目的,如图4所示,我们需将客流量、销售额、销售量添加为变量,然后再单击右侧的“保存”按钮,保存“聚类成员”与“与聚类中心的距离”两个新变量。

接着,打开“迭代”设置,设置最大迭代次数,一般按照默认即可,如果默认次数过小,应尽量调大。

最后,设置分析的选项,如图6所示,勾选“初始聚类中心”与“每个个案的聚类信息”,以了解初始聚类与最终聚类的个案数目;勾选“ANOVA表”,检验分析的置信水平。

三、结果解读
运行分析后,回到数据表,如图7所示,原数据表末端出现了两个新变量,分别是“聚类成员”与“与聚类中心的距离”。我们可以从中观察到每个个案所属的聚类,以及该个案与聚类中心的距离。

而从分析结果看到,SPSS初始设定了两个聚类。

而经过2次迭代运算后,最终聚类中心仍设定为两个不变。

而从ANOVA分析表看到,客流量、销售额、销售量的显著性都小于0.001,说明这三个变量都能很好地区分各个分类。

最后,从“每个聚类中的个案数目”可得到每一类别包含的个案数量。

四、小结
综上所述,K均值聚类分析,可利用欧式距离的测量,快速地将距离相似的个案归总为一个类别,但也要注意到的是,K均值聚类分析受异常值影响较大。
除K均值聚类,SPSS还提供了系统聚类、二阶聚类的分类方法,可前往SPSS中文网站获取更加系统的演示分享。
作者:泽洋
展开阅读全文
︾
微信公众号
读者也喜欢这些内容:
SPSS怎么计算Z分数 SPSS标准化后原始值怎么还原
假设小明在期末考试中语文考了90分、数学考了85分,我们可以很轻易地比较出小明的语文分数是高于数学的,但是这就能说明他的语文比数学要好吗?显然不能,我们还需要比较小明所在班级的平均分,假如数学平均分为70标准差为10、语文平均分为82标准差为8,那么实际上小明的数学z分数为1.5,语文成绩为1.0,因此小明的数学成绩在班级中的排名是高于语文成绩在班级中的排名的,即实际上小明的数学成绩考得更好。Z分数就是这样帮助我们比较不同维度数据的一种统计工具。接下来我就给大家介绍一下SPSS怎么计算Z分数,SPSS标准化后原始值怎么还原。...
阅读全文 >
SPSS K-means聚类分析怎么做 SPSS K-means聚类分析结果解读
在数据分析领域,如果需要对数据进行组别或者集合的分类,我们可以使用SPSS的K-means聚类分析的方法,这属于质心的聚类算法,可以优化数据集合的形式和定义。本文以SPSS K-means聚类分析怎么做,SPSS K-means聚类分析结果解读这两个问题为例,带大家了解一下SPSS的K-means聚类分析的知识。...
阅读全文 >
SPSS数据转置什么意思 SPSS数据转置怎么操作
在进行SPSS数据计算和分析之前,研究者通常运用SPSS数据转置的方法,借此对繁杂数据进行行列互换,适用于EXCEL、CSV、文本数据、SAS等各类形式的数据文本,便于研究者清晰全面地了解数据信息。本文以SPSS数据转置什么意思,SPSS数据转置怎么操作这两个问题为例,带大家了解一下SPSS数据转置的相关知识。...
阅读全文 >
SPSS数据正态性检验怎么做 SPSS非正态分布数据转换方法
在SPSS统计分析软件中,有些统计分析方法的使用前提是数据集中的数据分布满足正态分布或者近似正态分布,所以这就要就在进行数据统计分析之前,对数据进行正态性检验,接下来给大家详细介绍,SPSS数据正态性检验怎么做,SPSS非正态分布数据转换方法。...
阅读全文 >