
发布时间:2021/04/21 10:36:11
作为广受数据分析师青睐的一款数据统计和分析软件,IBM SPSS Statistics中有全面的数据分析方法,今天我们要介绍的是它的聚类分析中的快速聚类分析。
一、方法概述
聚类分析是将研究对象按照一定的标准进行分类的方法,分类结果是每一组的对象都具有较高的相似度,组间的对象具有较大的差异。
这类分析方法多用于对于数据样本没有特定的分类依据的情况,IBM SPSS Statistics会通过对数据的观察为用户做出较为完善的分类。
快速聚类是聚类分析的一种,使用到的功能在“分析”——“分类”中的“K-均值聚类”。
二、案例分享
1.样本数据
我们这里选择的数据样本是一部分学生的各科期末成绩,使用快速聚类方法可以分析各个学生成绩分布的差异和共性。
2.变量设置
我们将学生的所有单科成绩作为分析变量,移入到“变量”窗口中,将学生的编号变量移入到下侧的“个案标记依据”窗口。
聚类数设置的是分类的数目,这个需要根据数据样本的特点来设置,我们这里设置为4类。
聚类方法有两类,即迭代和分类,前者较为复杂,会在分析过程中不断移动凝聚点,后者则始终使用初始凝聚点,我们选择两类都有的第一种分析方法。
3.聚类中心
用户可以选择从外部文件或数据文件中写入或读取聚类中心,本案例中我们不使用这个功能。
4.迭代设置
我们可以设置迭代的终止条件,即到达设定的最大值后将停止迭代分析,输出聚类分析结果。
收敛性标准设置的是凝聚点改变的最大距离小于初始凝聚点的比例,小于设定值时,也会停止迭代,输出结果。
使用运行均值表示每次观测后都重新计算凝聚点,这些设置保持默认即可。
5.保存
这是用来设置保存形式的,勾选“聚类成员”将保存SPSS的分类结果,勾选“与聚类中心的距离”将保存观测值和所属类别的欧氏距离,我们不做设置。
6.选项
这个对话框设置的是输出的统计量和个案缺失处理方法,勾选“初始聚类中心”和“每个个案的聚类信息”。
7.结果输出
在输出日志中可以看到,这些学生根据他们的单科成绩被分成了四类,SPSS输出了多个表格,包括初始聚类中心、迭代历史记录、聚类成员、最终聚类中心、最终聚类中心之间的距离和每个聚类中的个案数目,完整详细,可信度较高。
三、小结
使用IBM SPSS Statistics进行快速聚类的方法和案例分享就是这么多啦,这是一个较为常用的分类分析法,适用程度很高,希望可以对大家有所帮助!
如果您对SPSS也有兴趣,欢迎进入IBM SPSS Statistics中文网站下载试用!
作者:参商
读者也喜欢这些内容:
spss决策树分析 spss决策树分析结果解读
SPSS的决策树分析是以树状图为基础的分类模型,它将个体分成若干个小组,或者依据自变量的数值推测出因变量的相关信息,在数据处理任务中占据重要地位。决策树分析不仅能够生成数据的理解准则,还可以处理连续的种类和字段,并且还能够广泛应用与小数集中。那么下面就来介绍spss决策树分析,spss决策树分析结果解读。...
阅读全文 >
SPSS结构方程怎么做SPSS结构方程模型教程
结构方程模型的前身是Sewall Wright所提出的最初的路径分析,后来这方法在社会科学研究中广泛应用。在不断地借鉴学习中,结合社会学数据资料的特点,学者们对这个方法进行了改进,在日积月累地改进下得到了现在的结构方程模型。接下来就来谈谈SPSS结构方程怎么做,SPSS结构方程模型教程。...
阅读全文 >
SPSS效度分析个案数不足两个 SPSS效度分析相关系数大概多少合适
初学者使用IBM SPSS Statistics进行效度分析常常不能正确理解相关系数含义,或者问题设置不正确出现很多的错误,这是非常正常的,坚持多学习,多了解就能很好的解决此类问题,本文就常见的问题如SPSS效度分析个案数不足两个,SPSS效度分析相关系数大概多少合适向大家作简单介绍。...
阅读全文 >
spss聚类分析谱系图怎么画 spss聚类分析谱系图结果解读
spss聚类分析谱系图怎么画?聚类分析谱系图是spss系统聚类的辅助图表之一,软件可自动生成,不用自己画。本文会以实际例子演示spss画谱系图的方法以及进行spss聚类分析谱系图结果解读。...
阅读全文 >