使用IBM SPSS Statistics的最近邻元素模型进行数据分析！

发布时间：2022-05-06 14: 18: 21

SPSS的最近邻元素分析是一种分类模型，它是根据个案间的相似性来对个案进行分类。简单来说就是相同个案相互靠近，不同个案相互远离。因此，可以通过判断样本距离哪个离中心点更近，进而判断样本数据属于哪个类别。本篇教程将教大家使用SPSS的最近邻元素模型对汽车行业数据进行数据分析，相信通过学习SPSS的最近邻元素模型，你将能够对各个领域数据分析。

一、数据准备与数据预处理

为了用最近邻元素模型给大家演示数据分析，这里使用Kaggle实验室的car_sales数据集。主要通过添加两款新研制的车型进行数据分析，这两款预研车型技术指标主要包括Model、Priceinthousands、enginesize、horsepower、width、length、curbweight、fuelcapacity、fueleffciency等。

为了对这款新研发的车型进行分析，这里在原数据添加这两个车型的新记录。

为了对新记录添加特别关注的标记，因此这里将添加一个名为focal的新变量。点击SPSS顶部菜单栏“转换”-“计算变量”，打开计算变量窗口，目标变量命名为focal，并在数字表达式输入any(Model,'newCar','newTruck')。这个函数表达式意思是Model变量值为'newCar'或者'newTruck'，则focal为1，否则为0.

同样通过计算变量方式添加变量partition，用于区分训练数据集和测试数据集，表达式为1-any(Model,'newCar','newTruck')。Partition>0，则为训练数据，否则为测试数据。

二、最近邻元素模型分析

由于篇幅有限，这里仅展示预估汽车类型。点击SPSS顶部菜单栏“分析”-“分类”-“最小邻元素”。点击顶部“变量”项目进行设置，将vehicletype加载到目标文本框，9个指标加载到特征文本框，focal加载到焦点个案，Model加载到个案标签。

点击最近邻元素分析顶部“邻元素”，将k值设置为3，并且勾选计算距离时按重要性对特征进行加权。

点击最近邻元素分析顶部“分区”，训练和坚持分区选择使用变量来分配个案，并且将partition加载到分区变量文本框。

三、结果分析

可以看到对于预估汽车类型结果，数据添加了一个预测值的变量，可以看到对新车的预测比较准确，并且生成了一个预估变量空间图型。

四、小结

以上是利用SPSS最近邻元素模型对汽车行业数据进行分析，相信通过从数据准备和预处理，再到利用最近邻元素模型分析，最后到结果分析，你已经对该模型有一定了解，并且能够简单使用到各个领域。

作者：独行侠

展开阅读全文

︾

标签：IBM SPSS Statistics，spss，IBM SPSS

上一篇：数据统计分析用什么软件数据统计分析软件怎么下载
下一篇：怎么使用IBM SPSS Statistics给数据做交叉相关性分析！

读者也访问过这里:

SPSS Statistics

强大的数据分析平台

立即购买

微信群

官方微信群立即加群

400-8765-888

kefu@makeding.com

下载试用

最新文章

SPSS怎么合并变量为一个因子 SPSS因变量和因子怎么判断

我们在使用SPSS进行问卷数据分析的过程中，多个题项往往共同测量同一个潜在维度，直接使用单个题项分析会导致结果零散，将这些相关变量合并为一个因子，能精准提炼数据的核心特征。接下来我将为大家介绍：SPSS怎么合并变量为一个因子，SPSS因变量和因子怎么判断的相关内容。

2026-07-02

SPSS怎么给数据分等级 SPSS怎么给数据加单位

在处理数据的时候，我们可能会想给部分范围数据设置等级，比如分数大于90分的，设置为优秀；分数处于75到90之间的，设置为良好等。在SPSS软件里，我们可以用重新编码的方式，给数据分不同的等级，让其含义更丰富。接下来，本文会给大家介绍SPSS怎么给数据分等级，SPSS怎么给数据加单位的相关内容。

2026-07-02

SPSS怎么进行简单随机抽样 SPSS怎么进行信效度分析

我们在进行问卷调研后，往往需要进行实证的数据分析。在这个过程里，简单随机抽样能够从全量数据中抽取代表性样本，是一种能降低数据分析工作量的核心方法，同时也可以保障样本的随机性与代表性。另外，信度检验验证数据的可靠性，效度分析检验问卷的结构合理性，二者是开展后续统计分析的重要前提。接下来我将为大家介绍：SPSS 怎么进行简单随机抽样，SPSS 怎么进行信效度分析的相关内容。

2026-07-02

SPSS做频数分布表如何分组 SPSS的频数分布表如何分析

数据分析时，连续型变量的原始取值通常较为分散，直接统计频数的话，很难清晰呈现数据的整体分布规律。如果能够分组制作频数分布表，就能将零散的数据整合为有序的组别，直观展现不同区间的样本分布情况。接下来我将为大家介绍：SPSS做频数分布表如何分组，SPSS的频数分布表如何分析的相关内容。

2026-07-02

SPSS中的f值怎么算 SPSS中的f值显著性数值范围是多少

在方差分析、回归分析等统计的方法中，f值多用于判断多组间均值差异是否显著、回归模型是否具有统计学意义。使用SPSS，无需手动计算复杂的f值公式，只需通过对应模块完成变量设置。接下来我将为大家介绍：SPSS中的f值怎么算，SPSS中的f值显著性数值范围是多少的相关内容。

2026-07-02

SPSS如何将数据转换成二分类 SPSS如何将数据转换成文本

原始数据类型往往无法直接满足全部分析与展示需求，所以在数据分析的过程中，我们需要将连续变量或多分类变量转换成二分类变量。而将数值编码转换成文本标签，能让数据结果更直观易懂。接下来我将为大家介绍：SPSS如何将数据转换成二分类，SPSS如何将数据转换成文本的相关内容。

2026-07-02

微信公众号

欢迎加入 SPSS 产品的大家庭，立即扫码关注，获取更多软件动态和资源福利。

读者也喜欢这些内容: