
发布时间:2021/09/22 16:08:52
IBM SPSS Statistics中的分层聚类法,也称作系统聚类法,是按照度量数据距离的远近,对预先设定的分类范围进行聚类的分析方法。其优点是可设定分类的范围、可处理分类变量与连续变量、可选择的数据距离计算方法多等。
但需要注意的是,分层聚类法无法同时处理两种变量类型,即单次分析只能在同一种变量类型中进行。接下来,我们通过实例具体演示下操作方法。
一、数据准备
本文使用到的是一组包含连续变量(销售额、销售量等)与分类变量(店铺类型、星级等)的店铺数据。
二、系统聚类参数设置
如图2所示,依次打开SPSS的分类-系统聚类分析。
如图3所示,SPSS的系统聚类可进行个案与变量的聚类分析。本例选择个案的系统聚类分析。
系统聚类单次只可分析一种变量类型,如图4所示,本例进行的是客流量、销售额、销售量的连续型变量系统聚类分析,以账号作为标注依据。
在统计设置中,如图5所示,勾选“解的范围”,并将范围设定为2-5。
在图设置中,勾选“谱系图”选项,以观察聚类的过程。
在计算方法中,根据连续变量使用欧氏距离法,分类变量使用计数型卡方测量法的原则,设置区间的平方欧式距离法。
最后,在保存设置中,保存“解的范围”,以在数据表中生成解范围的新变量。
三、结果解读
运行分析后,返回到数据集,如图9所示,在原数据集的末端生成了新的变量,分别展示的是解在2-5范围时,个案所属的聚类。
本次系统聚类分析了23个个案,从集中计划表看到,在第5阶段,15与16聚合为一类,15在第4个阶段中出现了,16则是第一次出现,因此在聚类中分别记为“4”与“0”。
在进行22个阶段后,所有个案完成聚类。
如图11所示,在谱系图中画红色竖线并向左观察,可将个案分为三大类。当然,也可以移动红色竖线,将个案分为两大类、四大类、五大类,并观察其个案的组成。
四、小结
综上所述,SPSS分层聚类分析可进行连续型与分类型变量的聚类分析,并设定解的范围,使得数据在预设的范围内进行聚类。
但另一方面来说,分层聚类主要是依靠图形,如谱系图进行聚类结果的输出,因此,如果个案数目过大,将不利于结果的观察。
作者:泽洋
读者也喜欢这些内容:
spss决策树分析 spss决策树分析结果解读
SPSS的决策树分析是以树状图为基础的分类模型,它将个体分成若干个小组,或者依据自变量的数值推测出因变量的相关信息,在数据处理任务中占据重要地位。决策树分析不仅能够生成数据的理解准则,还可以处理连续的种类和字段,并且还能够广泛应用与小数集中。那么下面就来介绍spss决策树分析,spss决策树分析结果解读。...
阅读全文 >
SPSS回归分析控制变量怎么设置 SPSS回归分析系数表怎么看
回归分析过程中,应该加入控制变量,以评估其他因素对因变量的影响,从而提升数据分析研究的可信度。借助专业的数据分析软件IBM SPSS Statistics可以快速实现带控制变量的多元线性回归分析,并给出是否接受该控制变量的判断,那么SPSS回归分析控制变量怎么设置,SPSS回归分析系数表怎么看?本文将向大家作简单介绍。...
阅读全文 >
spssk均值聚类分析步骤 spssk均值聚类分析结果解读
spssk均值聚类分析步骤,spssk均值聚类分析需事先指定聚类数目k,然后再依照该聚类数目进行迭代运算,本文会应用例子演示分析步骤,同时也会进行spssk均值聚类分析结果解读,以加深理解。...
阅读全文 >
数据挖掘需要哪些知识 数据挖掘工具有哪些
数据挖掘需要哪些知识?数据挖掘需要使用到统计学知识、编程知识、数据挖掘工具操作知识、行业相关知识等。数据挖掘工具有哪些,本文将会介绍常用的三款数据挖掘工具,供大家参考使用。...
阅读全文 >