发布时间:2021-04-21 10: 36: 11
作为广受数据分析师青睐的一款数据统计和分析软件,IBM SPSS Statistics中有全面的数据分析方法,今天我们要介绍的是它的聚类分析中的快速聚类分析。
一、方法概述
聚类分析是将研究对象按照一定的标准进行分类的方法,分类结果是每一组的对象都具有较高的相似度,组间的对象具有较大的差异。
这类分析方法多用于对于数据样本没有特定的分类依据的情况,IBM SPSS Statistics会通过对数据的观察为用户做出较为完善的分类。
快速聚类是聚类分析的一种,使用到的功能在“分析”——“分类”中的“K-均值聚类”。
二、案例分享
1.样本数据
我们这里选择的数据样本是一部分学生的各科期末成绩,使用快速聚类方法可以分析各个学生成绩分布的差异和共性。
2.变量设置
我们将学生的所有单科成绩作为分析变量,移入到“变量”窗口中,将学生的编号变量移入到下侧的“个案标记依据”窗口。
聚类数设置的是分类的数目,这个需要根据数据样本的特点来设置,我们这里设置为4类。
聚类方法有两类,即迭代和分类,前者较为复杂,会在分析过程中不断移动凝聚点,后者则始终使用初始凝聚点,我们选择两类都有的第一种分析方法。
3.聚类中心
用户可以选择从外部文件或数据文件中写入或读取聚类中心,本案例中我们不使用这个功能。
4.迭代设置
我们可以设置迭代的终止条件,即到达设定的最大值后将停止迭代分析,输出聚类分析结果。
收敛性标准设置的是凝聚点改变的最大距离小于初始凝聚点的比例,小于设定值时,也会停止迭代,输出结果。
使用运行均值表示每次观测后都重新计算凝聚点,这些设置保持默认即可。
5.保存
这是用来设置保存形式的,勾选“聚类成员”将保存SPSS的分类结果,勾选“与聚类中心的距离”将保存观测值和所属类别的欧氏距离,我们不做设置。
6.选项
这个对话框设置的是输出的统计量和个案缺失处理方法,勾选“初始聚类中心”和“每个个案的聚类信息”。
7.结果输出
在输出日志中可以看到,这些学生根据他们的单科成绩被分成了四类,SPSS输出了多个表格,包括初始聚类中心、迭代历史记录、聚类成员、最终聚类中心、最终聚类中心之间的距离和每个聚类中的个案数目,完整详细,可信度较高。
三、小结
使用IBM SPSS Statistics进行快速聚类的方法和案例分享就是这么多啦,这是一个较为常用的分类分析法,适用程度很高,希望可以对大家有所帮助!
如果您对SPSS也有兴趣,欢迎进入IBM SPSS Statistics中文网站下载试用!
作者:参商
展开阅读全文
︾
读者也喜欢这些内容:
spss正态分布是什么意思 spss正态分布操作步骤
在许多统计分析工作进行处理前,都需要检验数据是否服从正态分布。正态性检验是通过样本数据判断总体数据是否服从正态分布的一种假设检验,正态性检验方法有夏皮洛-威尔克方法和柯尔莫戈洛夫-斯米洛夫方法。我们一般借助专业的统计分析软件分析数据是否服从正态分布。SPSS正态分布是什么意思,SPSS正态分布检验操作步骤是怎样的,本文将向大家作简单的说明。...
阅读全文 >
spss数据预处理包括哪些内容 spss数据预处理怎么做
在进行数据分析时,数据预处理是一个至关重要的步骤。SPSS软件作为一款广泛应用的统计分析软件,提供了一系列强大的数据预处理功能。本文将详细介绍SPSS数据预处理包括哪些内容,以及SPSS数据预处理怎么做的内容,帮助您更好地利用软件功能,提高数据分析的准确性和效率。...
阅读全文 >
SPSS数据编码是什么意思 SPSS数据编码怎么弄
在使用SPSS进行数据统计的时候,首先需要做的是对原有的数据进行编码处理。因为SPSS对于汉字是不识别的,即使识别了对后期的分析结果也是会有影响的,所以需要将数据中的变量进行编码处理。接下来本文就详细和大家讲解一下,SPSS数据编码是什么意思,以及SPSS数据编码怎么弄的相关内容。...
阅读全文 >
spss散点图怎么看线性关系 spss散点图如何添加辅助线
当不需要对线性回归分析进行统计学检验时,我们可以利用SPSS图形绘制功能,对数据进行简单的线性回归分析。在SPSS散点图绘制功能中,可以绘制回归曲线,查看数据线性回归方程,并且可以查看线性回归系数R。SPSS散点图怎么看线性关系,SPSS散点图如何添加辅助线?本文结合实例,向大家做简单的介绍。...
阅读全文 >