发布时间:2021-04-22 11: 16: 37
IBM SPSS Statistics的聚类分析可以对数据进行一定标准下的分类操作,以便为用户提供更为便捷的分析基础。其中的聚类分析共有三类:快速聚类、系统聚类和二阶聚类,下面我们要介绍的是IBM SPSS Statistics的二阶聚类分析的方法。
一、二阶聚类
使用二阶聚类,SPSS会为用户探索数据间较为自然的一种分类,可以同时处理分类变量和连续变量,也叫作两步聚类。
第一步是构建分类的特征数,将观测点记在某个节点处,然后判断后续观测点与该节点的相似性,若不相似,将构建一个新的节点;第二步是对节点进行分组,分组完成就是二阶聚类分析完成。
SPSS的聚类功能都在“分析”——“分类”菜单下,点击“二阶聚类”,可以进入二阶聚类分析窗口。
二、分析操作
1.数据样本
我们这里选用的是SPSS自带的一份数据样本,各类汽车的参数及销售数据,使用二阶聚类可以将这些个案对象进行分类分析处理。
2.变量设置
将汽车类型“type”移入分类变量窗口,将分类依据的变量移入连续变量窗口,我们这里依据的是价格、宽度、长度、燃料效率等基础参数的变量,可以使用Shift键将这些变量选中后一次性添加。
3.其他设置
距离测量使用对数似然,因为我们这里使用到了分类变量,所以欧氏距离不可用。
聚类数量使用自动确定,最多可以分为15类,当然,也可以自己确定聚类数。
聚类准则使用BIC标准。
4.选项
勾选使用噪声处理离群值,数值使用默认的25%即可,这会将数据的析出节点合并为一个噪声节点,判断后保留特定的节点,不能被归类的观测值会被标记为离群值。
内存分配设置的是聚类过程中的最大空间,超过设定值后会使用硬盘存储数据。
连续变量的标准化这里不需要多加设置,如果已标准化,可以减少右侧窗口内的变量。
5.输出
勾选输出透视表,会输出四个表格:BIC统计表、连续变量的均值和标准差、最终分类的观测个数、最终分类变量的频数统计表。
保持默认已勾选的图表和表格,下面的工作数据文件和XML文件根据需要设置保存及导出位置。
6.完成分析
上图是输出结果的第一个表格,从这个表格中可以分析最佳的聚类数目:较小的BIC值,较大的更该比率,较大的距离度量比率,最佳聚类数目是3类。
在质心和聚类频率表格中可以看到具体的三组分类下各个变量的均值和偏差,频率和百分比情况。
三、小结
以上就是在IBM SPSS Statistics中如何使用二阶聚类方法对数据样本进行分析处理了,聚类分析的操作难度不大,合理选择聚类方法可以找到现有数据的最佳聚类分布,便于后续分析操作的进行。
希望这次分析可以对大家有所帮助!更多软件资讯和案例分享请进入IBM SPSS Statistics中文网站查看!
作者:参商
展开阅读全文
︾
微信公众号
读者也喜欢这些内容:
SPSS数据导入是什么意思 SPSS数据导入后显示不完整
在使用SPSS进行数据集分析的时候,可以通过导入数据功能将数据集整体导入到SPSS中,使用起来非常的方便,不过在导入数据集的时候,也会遇到一些问题,例如数据导入不进去、导入进去的数据不完整等等,下面给大家详细讲解有关SPSS数据导入的内容,SPSS数据导入是什么意思,SPSS数据导入后显示不完整。...
阅读全文 >
SPSS Hosmer检验是什么 SPSS Hosmer怎么做
SPSS作为一款老牌数据统计分析软件,其统计分析方法不仅多样实用,还非常适用于各种学科的数据分析研究,像是很多医学界的临床数据分析就会使用到SPSS,通过SPSS的Hosmer检验验证数据模型的准确性。以下将介绍有关Hosmer检验的内容,SPSS Hosmer检验是什么,SPSS Hosmer怎么做。...
阅读全文 >
SPSS可视化分箱在哪 SPSS可视化分箱不能用
SPSS是一款应用比较广泛的数据统计分析软件,不仅可以帮助统计分析人员对数据进行各种分析研究,还可以帮助统计分析人员对数据进行整理,常见的像是缺失值处理、异常值处理,以及对数据进行可视化分箱等等,以下介绍的是有关可视化分箱的相关内容,SPSS可视化分箱在哪,SPSS可视化分箱不能用。...
阅读全文 >
SPSS检验值怎么看 SPSS检验值怎么得出
在数据统计领域,测量SPSS检验值可以对繁杂的数据组别进行对比和分析,有助于展开后续针对数据关联和差异的研究。今天,我们以SPSS检验值怎么看,SPSS检验值怎么得出这两个问题为例,带大家了解一下SPSS检验值计算和分析的相关知识。...
阅读全文 >