IBM Business Partner

IBM SPSS Statistics 中文网站 > 使用技巧 > IBM SPSS Statistics进行个案或变量间的欧氏距离分析

IBM SPSS Statistics进行个案或变量间的欧氏距离分析

发布时间:2021/08/03

欧氏距离是距离分析中比较容易理解的、也是较为常用到的距离计算方法,其度量的是欧氏空间中两个点之间的距离。

IBM SPSS Statistics的距离分析中,可运用欧氏距离分析个案或变量间的“距离”,以确定不同个案或变量间的相似性。

一、数据准备

我们以一组购买金额、购买数量与浏览页面数的数据为例,运用欧氏距离分析数据个案(不同编号个案)、变量间(购买金额、购买数量、浏览页面数)的相似性。

图1:购买数据
图1:购买数据

欧氏距离分析是SPSS距离相关分析的一种,因此,我们需先开启距离分析。

图2:距离分析
图2:距离分析


二、距离分析设置

如图3所示,距离分析包含变量、个案标注依据、计算距离与测量四个部分。

我们先做一个个案间的分析,将购买金额、购买数量、浏览页面数添加到变量。

图3:变量设置
图3:变量设置

将个案的编号添加为个案标注依据,但需注意的是,如果编号是数值变量的话,需先将其设置为字符串变量后,才可添加为个案标注依据。

图4:个案标注依据
图4:个案标注依据

设置字符串变量的操作方法如下:

1. 打开数据的变量视图

2. 单击编号变量的类型单元格

3. 在弹出的变量类型中选择“字符串”

图5:调整变量类型
图5:调整变量类型

完成编号的字符串变量设置后,即可将其添加到个案标注依据。

接着,进行计算距离与测量的设置。由于当前分析的是不同个案的相似性,因此,需在计算距离中选择“个案间”。而测量可根据需要选择相似或非相似性,本例选择“非相似性”。

图6:数据类型与测量方式
图6:数据类型与测量方式

SPSS距离分析默认使用欧氏距离,如需更改,也可单击“测量”按钮更改距离的计算方式。

图7:测量模型
图7:测量模型

SPSS提供了区间、计数、二元的测量方式,针对不同的测量方式会有对应的距离计算方法。本例选择默认的区间欧氏距离计算方法,即在限定范围内进行欧氏距离计算。

图8:区间欧式距离
图8:区间欧式距离

三、数据解读

分析结果如下,本分析包含了5个个案数,采用了非相似性矩阵的分析结果。

从非相似性矩阵得出,5个个案的非相似性矩阵数值高,相似性低;而个案1与个案4存在着稍微高一些的相似性。

图9:个案组非相似性测量结果
图9:个案组非相似性测量结果

个案间的相似性低,那么,变量间的相似性如何?

如图10所示,我们将计算距离调整为“变量间”、将测量设为“相似性”。

图10:变量组相似性测量
图10:变量组相似性测量

其分析结果如图11所示,其相似性矩阵数值越接近于1,其相似性越高。可以看到,购买金额与购买数量之间的相似性较高,但浏览页面数与购买金额之间似乎存在着负相似性(相似性数值只有0.478),也就是说,浏览越多页面,购买金额越低。

图11:变量组相似性测量结果
图11:变量组相似性测量结果

四、小结

综上所述,SPSS欧氏距离分析是距离分析中的一种计算方法,可测量个案或变量间的相似性。在本例中,我们使用欧氏距离分析得出购买金额与购买数量间存在相似性,而购买金额与浏览页面间似乎存在着负相似性,但仍需深入分析。

作者:泽洋

标签:SPSS距离分析

读者也访问过这里:
SPSS Statistics
一款功能强大的数据统计分析工具
立即购买
QQ 群
官方交流群:815794396 立即加群
400-8765-888 kefu@makeding.com
热门文章
如何用SPSS计算个人BMI值?
BMI即体重指数,是衡量个人身体质量的一个重要参数,通过判断BMI的数值大小,我们可以判断个人身高与体重是否协调。下面我将用IBM SPSS Statistics来为大家介绍BMI的计算方法。
2021-03-19
SPSS相关性分析结果怎么看
相关性分析是对变量或个案之间相关度的测量,在SPSS中可以选择三种方法来进行相关性分析:双变量、偏相关和距离。
2021-04-23
实践SPSS单因素方差分析之检验结果解读
在《实践SPSS单因素方差分析之变量与检验方法设置》一文中,我们已经详细地演示了IBM SPSS Statistics单因素方差分析方法的变量选择以及相关的选项、对比设置。
2021-01-11
SPSS进行变量赋值的相关操作
变量和个案是IBM SPSS数据界面很重要的两个部分,可以形象理解为地球仪上的经线和纬线。通俗一点讲数据界面的每一列是一种变量,如年龄性别等。一行中的所有变量又构成了一个个案,本篇文章着重讲解变量,个案就不做过多展开。在图1中有具体的标注,可以看一下变量和个案到底是什么样。
2021-02-23
使用SPSS进行回归分析的方法总结
IBM SPSS Statistics 是强大的统计软件平台,SPSS全称Statistical Product and Service Solutions(统计产品与服务解决方案), SPSS可以帮助我们分析并更好地了解数据,以解决复杂的业务和研究问题。如今,SPSS已经被广泛运用于数据分析等各个领域。
2021-03-09
如何使用SPSS检验数据是否服从正态分布—偏度峰度系数
在《如何使用SPSS检验数据是否服从正态分布—KS检验与Q-Q图》一文中,我们了解了如何使用KS检验、Q-Q图来验证数据的正态性。接下来,本文将会继续讲解如何使用IBM SPSS Statistics的描述统计(偏度峰度系数)、探索统计检验(正态检验)数据的正态性。
2021-01-07