发布时间:2021-09-22 16: 08: 52
IBM SPSS Statistics中的分层聚类法,也称作系统聚类法,是按照度量数据距离的远近,对预先设定的分类范围进行聚类的分析方法。其优点是可设定分类的范围、可处理分类变量与连续变量、可选择的数据距离计算方法多等。
但需要注意的是,分层聚类法无法同时处理两种变量类型,即单次分析只能在同一种变量类型中进行。接下来,我们通过实例具体演示下操作方法。
一、数据准备
本文使用到的是一组包含连续变量(销售额、销售量等)与分类变量(店铺类型、星级等)的店铺数据。

二、系统聚类参数设置
如图2所示,依次打开SPSS的分类-系统聚类分析。

如图3所示,SPSS的系统聚类可进行个案与变量的聚类分析。本例选择个案的系统聚类分析。

系统聚类单次只可分析一种变量类型,如图4所示,本例进行的是客流量、销售额、销售量的连续型变量系统聚类分析,以账号作为标注依据。

在统计设置中,如图5所示,勾选“解的范围”,并将范围设定为2-5。

在图设置中,勾选“谱系图”选项,以观察聚类的过程。

在计算方法中,根据连续变量使用欧氏距离法,分类变量使用计数型卡方测量法的原则,设置区间的平方欧式距离法。

最后,在保存设置中,保存“解的范围”,以在数据表中生成解范围的新变量。

三、结果解读
运行分析后,返回到数据集,如图9所示,在原数据集的末端生成了新的变量,分别展示的是解在2-5范围时,个案所属的聚类。

本次系统聚类分析了23个个案,从集中计划表看到,在第5阶段,15与16聚合为一类,15在第4个阶段中出现了,16则是第一次出现,因此在聚类中分别记为“4”与“0”。
在进行22个阶段后,所有个案完成聚类。

如图11所示,在谱系图中画红色竖线并向左观察,可将个案分为三大类。当然,也可以移动红色竖线,将个案分为两大类、四大类、五大类,并观察其个案的组成。

四、小结
综上所述,SPSS分层聚类分析可进行连续型与分类型变量的聚类分析,并设定解的范围,使得数据在预设的范围内进行聚类。
但另一方面来说,分层聚类主要是依靠图形,如谱系图进行聚类结果的输出,因此,如果个案数目过大,将不利于结果的观察。
作者:泽洋
展开阅读全文
︾
微信公众号
读者也喜欢这些内容:
SPSS数据转置什么意思 SPSS数据转置怎么操作
在进行SPSS数据计算和分析之前,研究者通常运用SPSS数据转置的方法,借此对繁杂数据进行行列互换,适用于EXCEL、CSV、文本数据、SAS等各类形式的数据文本,便于研究者清晰全面地了解数据信息。本文以SPSS数据转置什么意思,SPSS数据转置怎么操作这两个问题为例,带大家了解一下SPSS数据转置的相关知识。...
阅读全文 >
SPSS协方差分析操作步骤 SPSS协方差分析变量怎么选择
在数据统计中,我们可能会遇到多个变量存在相关关系的情况,可以运用SPSS协方差的方法来分析庞杂数据组的多类自变量以及因变量之间的关系,有助于减弱变量共线性等问题。今天,我们以SPSS协方差分析操作步骤,SPSS协方差分析变量怎么选择这两个问题为例,带大家了解一下SPSS协方差分析的相关知识。...
阅读全文 >
SPSS怎么排除无效数据 SPSS怎么排除无效问卷
在做调查问卷时,如果用户遇到不想回答问卷而又不得不回答的情况时,他们可能就会重复选择某个选项,这种重复选择的问卷就是无效样本。所以我们在做问卷调查结果分析时,首先需要对数据进行预处理,检查数据中是不是存在无效样本,那在SPSS中怎么排除无效数据,SPSS怎么排除无效问卷呢?我们一起来看下。...
阅读全文 >
SPSS数据输入百分数怎么输入 SPSS百分比数据如何进行处理
SPSS不仅是一款功能比较强大的数据统计分析软件,还应用于很多研究领域,像是社会学科、教育学科、医疗研究等领域,都会使用SPSS进行数据统计分析。为了让大家对SPSS有更进一步的了解,下面给大家详细讲解,SPSS数据输入百分数怎么输入,以及SPSS百分比数据如何进行处理。...
阅读全文 >