发布时间:2021-09-22 16: 08: 52
IBM SPSS Statistics中的分层聚类法,也称作系统聚类法,是按照度量数据距离的远近,对预先设定的分类范围进行聚类的分析方法。其优点是可设定分类的范围、可处理分类变量与连续变量、可选择的数据距离计算方法多等。
但需要注意的是,分层聚类法无法同时处理两种变量类型,即单次分析只能在同一种变量类型中进行。接下来,我们通过实例具体演示下操作方法。
一、数据准备
本文使用到的是一组包含连续变量(销售额、销售量等)与分类变量(店铺类型、星级等)的店铺数据。
二、系统聚类参数设置
如图2所示,依次打开SPSS的分类-系统聚类分析。
如图3所示,SPSS的系统聚类可进行个案与变量的聚类分析。本例选择个案的系统聚类分析。
系统聚类单次只可分析一种变量类型,如图4所示,本例进行的是客流量、销售额、销售量的连续型变量系统聚类分析,以账号作为标注依据。
在统计设置中,如图5所示,勾选“解的范围”,并将范围设定为2-5。
在图设置中,勾选“谱系图”选项,以观察聚类的过程。
在计算方法中,根据连续变量使用欧氏距离法,分类变量使用计数型卡方测量法的原则,设置区间的平方欧式距离法。
最后,在保存设置中,保存“解的范围”,以在数据表中生成解范围的新变量。
三、结果解读
运行分析后,返回到数据集,如图9所示,在原数据集的末端生成了新的变量,分别展示的是解在2-5范围时,个案所属的聚类。
本次系统聚类分析了23个个案,从集中计划表看到,在第5阶段,15与16聚合为一类,15在第4个阶段中出现了,16则是第一次出现,因此在聚类中分别记为“4”与“0”。
在进行22个阶段后,所有个案完成聚类。
如图11所示,在谱系图中画红色竖线并向左观察,可将个案分为三大类。当然,也可以移动红色竖线,将个案分为两大类、四大类、五大类,并观察其个案的组成。
四、小结
综上所述,SPSS分层聚类分析可进行连续型与分类型变量的聚类分析,并设定解的范围,使得数据在预设的范围内进行聚类。
但另一方面来说,分层聚类主要是依靠图形,如谱系图进行聚类结果的输出,因此,如果个案数目过大,将不利于结果的观察。
作者:泽洋
展开阅读全文
︾
微信公众号
读者也喜欢这些内容:
SPSS树状图Y轴标签是什么 SPSS树状图如何修改
SPSS树状图Y轴标签是什么?如果是以个案聚类的话,SPSS树状图Y轴标签指的是个案标注变量,即进行聚类研究的变量。SPSS树状图如何修改?可通过变量设置或图表编辑的方式修改SPSS树状图的内容。...
阅读全文 >
SPSS软件安装与注册教程
IBM SPSS Statistics作为一款全球知名的数据统计分析软件,无论是在学术研究领域,还是商业经营领域,都起着举足轻重的作用。其推出的一系列统计分析方法,可用于数据的分析运算、挖掘、模型预测等多个方面。...
阅读全文 >
如何在SPSS中设置逻辑回归的哑变量
哑变量,是一个人为设定的变量,通常取值为0到N,以职业分类来说,0代表学生,1代表工人,2代表老师等等,哑变量就是通过这种取值方式,以此来反映某个变量的不同属性。...
阅读全文 >
数据分析工具有哪些 数据分析工具优缺点
随着大数据时代的来临,统计分析在社会各个领域发挥的作用越来越大,无论是专业的数据分析人员,科研工作者,还是普通的职员,都应具备数据分析处理能力,以适应社会发展。数据分析处理除了要了解一定的数学知识,还应熟悉数据分析工具软件的使用,数据分析工具有哪些,数据分析工具优缺点有哪些,本文向大家做简单的介绍。...
阅读全文 >