SPSS > 使用技巧 > spss层次聚类分析步骤 spss层次聚类分析结果解读

spss层次聚类分析步骤 spss层次聚类分析结果解读

发布时间:2022-06-27 11: 07: 26

品牌型号:联想GeekPro 2020

系统: Windows 10 64位专业版

软件版本: IBM SPSS Statistics

spss层次聚类分析步骤,层次聚类分析可使用spss的系统聚类分析方法,本文会举例演示分析步骤。spss层次聚类分析结果解读,主要是通过冰柱图与树状图(谱系图)来确定聚类数目,并以此确认各样本的聚类归属。

一、spss层次聚类分析步骤

spss层次聚类分析是一种通过分析样本间的相似性与距离来组成树状图层次结构的分析方法,也称为为系统聚类,可通过spss的系统聚类分析功能获得层次聚类的分析结果。

接下来,通过一组店铺类型的层次聚类分析例子,具体演示spss层次聚类分析步骤。

数据示例
数据示例

 

如图2所示,依次单击spss的分析-分类-系统聚类选项。

系统聚类
系统聚类

 

1.确认分析变量

层次聚类(系统聚类)是通过聚类变量的分析来确定不同样本的相似性,其变量需要是数值型的变量,如果聚类变量中包含字符串变量,需通过重新编码的方式,为字符串上码,将其转换为数值型变量。

不允许添加字符串
不允许添加字符串

 

本例已将字符串变量“标准e”转变为数值型变量,可直接将其选入到“变量”列表框,其他数值型变量也一同选入“变量”。

同时可选入“个案标注依据”,以便在冰柱图、谱系图中查看个案的名称。

变量设置
变量设置

 

2.设置解的范围

由于层次聚类无明确的聚类结果,为了避免聚类的数据过多,可对“解的范围”进行设置,可根据研究预设的分类数目,以往的分析经验等确定解的范围。

本例将范围设置为2-6个聚类数。

解的范围
解的范围

 

3.设置分析图表

在图表设置中,选入谱系图(树状图)与冰柱图,其中冰柱图可设定图表方向,本例使用默认的“垂直”方向。

图表设置
图表设置

 

二、spss层次聚类分析结果解读

接下来,针对以上设置进行spss层次聚类分析结果解读。

首先看到,按照预先设置的“解的范围”,可观察到2-6个聚类数目下,不同店铺分别属于哪个聚类。比如店铺3,在2-4个聚类时,属于第一个聚类,而在5-6个聚类时,属于第三个聚类。

聚类情况
聚类情况

 

得到每个个案在不同聚类数目所属的类别后,接下来,需要进一步确认聚类的树木。层次聚类不能得出确定的聚类数目,需要分析者运用经验自行选择聚类数目。

比如,本例确认5个聚类的结果,如图8所示,可在冰柱图纵坐标的“5”处绘制横向参考线,以此可得到不同店铺分属的聚类。

冰柱图
冰柱图

 

而相似地,也可借助谱系图确定聚类数目,谱系图使用的是距离标度结果,通过绘制X轴参考线,可从参考线与横向树状图线条得到聚类结果,其聚类结果跟冰柱图一致。

谱系图
谱系图

 

三、spss层次聚类与k均值聚类区别

层次聚类与k均值聚类都是常用的聚类分析方法。与spss层次聚类的模糊性不同,k均值聚类具有确定性,可得出确定的聚类数目与聚类中心,因其在初始就会将样本分为k组,并设定k个聚类中心测量各个样本与聚类中心的距离,因此,可得出清晰的聚类结果。

spss层次聚类是借助冰柱图或谱系图进行数据的解读,往往需要加入分析者的分析经验,因此结果具有不确定性。

而k均值的聚类结果,比如图10所示的例子,能得到确定的聚类数量为4,并确定了4个聚类中心的数值,并以数值衡量聚类中心的距离。

k均值聚类结果
k均值聚类结果

 

四、小结

以上就是关于spss层次聚类分析步骤,spss层次聚类分析结果解读的相关内容。spss层次聚类,又称为系统聚类,通过分析各样本分析变量间的距离来得到聚类分析结果,其结果具有模糊性,可通过spss的冰柱图、树状图,以及自身经验、分析问题来确定聚类数目。

 

作者:泽洋

展开阅读全文

标签:IBM SPSS StatisticsSPSS教程快速聚类分析聚类分析SPSS聚类分析SPSS系统聚类分析SPSS聚类分析步骤

读者也访问过这里:
SPSS Statistics
强大的数据分析平台
立即购买
微信群
官方微信群 立即加群
400-8765-888 kefu@makeding.com
热门文章
SPSS数据分析显著性差异分析步骤 SPSS显著性差异分析结果怎么看
数据的显著性差异分析主要有三种方法,分别是卡方检验、T检验和方差分析。这三种方法都有具体的数据要求:卡方检验是对多个类别的数据进行分析,T检验是对两组数据进行分析,方差分析是对多组数据进行检验。下面,小编具体说明一下SPSS数据分析显著性差异分析步骤,SPSS显著性差异分析结果怎么看。
2022-01-07
实践SPSS单因素方差分析之检验结果解读
在《实践SPSS单因素方差分析之变量与检验方法设置》一文中,我们已经详细地演示了IBM SPSS Statistics单因素方差分析方法的变量选择以及相关的选项、对比设置。
2021-01-11
spss如何做显著性分析 spss显著性差异分析怎么标abc
在统计分析中,显著性分析是分析相关因素之间是否存在显著影响关系的关键性指标,通过它可以说明分析结论是否由抽样误差引起还是实际相关的,可论证分析结果的准确性。下面大家一起来看看用spss如何做显著性分析,spss显著性差异分析怎么标abc。
2022-03-14
SPSS回归分析中的f值是什么 SPSS回归分析F值在什么范围合适
回归分析中以R表示相关性程度的高低,以F评价回归分析是否有统计学的意义,使用IBM SPSS Statistics进行回归分析,可以非常快速的完成R,F的计算,并且给出回归曲线方程,那么,SPSS回归分析中f值是什么?SPSS回归分析F值在什么范围合适,本文结合实例向大家作简单的说明。
2022-07-22
SPSS多元logistic回归分析的使用技巧
回归分析是数据处理中较为常用的一类方法,它可以找出数据变量之间的未知关系,得到较为符合变量关系的数学表达式,以帮助用户完成数据分析。
2021-04-26
SPSS相关性分析结果怎么看
相关性分析是对变量或个案之间相关度的测量,在SPSS中可以选择三种方法来进行相关性分析:双变量、偏相关和距离。
2021-04-23
最新文章
SPSS生存分析怎么输入删失的数据 SPSS生存分析步骤
对于经常与数据分析打交道的用户来说,一款好用的数据分析软件既可以提高我们的数据分析效率,还可以快速将分析完成的数据进行导出,便于对数据后续的开发和利用。这里给大家介绍一款我自己常用的数据分析软件—SPSS,同时带来SPSS生存分析怎么输入删失的数据,SPSS生存分析步骤的具体内容。
2024-11-20
SPSS生成变量功能在哪里 SPSS生成变量功能怎么用
在SPSS导入数据后,由于各种原因可能需要在原数据表上添加新变量。这些新变量可能是全新的,也可能是通过原有变量计算而得。虽然可以重新导入数据,但如果能在原数据表基础上添加会更方便。SPSS的生成变量功能可满足以上需求,那么,SPSS生成变量功能在哪里,SPSS生成变量功能怎么用?接下来,让我们详细来学习下相关的内容。
2024-11-19
SPSS数据变换是什么意思 SPSS数据变换方法
SPSS是一款功能强大的统计分析软件,支持数据处理、数据分析和数据可视化等多种操作,被广泛应用于各类研究和数据统计。很多用户在使用SPSS时,可能会遇到不知道什么是数据变换和如何进行数据变换等问题。本文将为大家介绍关于SPSS数据变换是什么意思,SPSS数据变换方法的相关内容。
2024-11-19
论文SPSS标准差大于1合理吗 SPSS怎么计算平均值
在进行论文写作中,通常需要用到平均值、样本差等指标。平均值就是所收集到的样本均值,代表了样本的集中程度。而标准差则是反映所收集到的样本距离其平均值,也就是距离集中位置的距离。下面我给大家介绍一下论文SPSS标准差大于1合理吗,SPSS怎么计算平均值的相关内容。
2024-11-18
SPSS计算标准偏差公式怎么算 SPSS标准误差怎么看
标准偏差,也称为SD,是一种统计学上常用的分析指标,用于衡量一组数值的变异性或离散程度。与标准偏差紧密相关的另一个概念是标准误差,简称SE。标准误差是用来计算收集到的样本均值的变异性的统计指标。本文会指导大家SPSS计算标准偏差公式怎么算,SPSS标准误差怎么看。希望用户对数据的离散程度和样本统计量的可靠性有一个清晰的认识。
2024-11-18
虚拟变量转换是什么意思 SPSS如何设置虚拟变量操作步骤
虚拟变量转换是什么意思?虚拟变量转换指的是将分类变量创建为虚拟变量的过程。为了满足后续统计运算的需求,很多时候要将分类变量转换为数字型的变量,而虚拟变量转换就能满足这一操作需求。本文会给大家演示SPSS如何设置虚拟变量操作步骤,帮助大家更好地理解相关概念。
2024-11-16

微信公众号

欢迎加入 SPSS 产品的大家庭,立即扫码关注,获取更多软件动态和资源福利。

读者也喜欢这些内容: