发布时间:2022-05-06 14: 18: 21
SPSS的最近邻元素分析是一种分类模型,它是根据个案间的相似性来对个案进行分类。简单来说就是相同个案相互靠近,不同个案相互远离。因此,可以通过判断样本距离哪个离中心点更近,进而判断样本数据属于哪个类别。本篇教程将教大家使用SPSS的最近邻元素模型对汽车行业数据进行数据分析,相信通过学习SPSS的最近邻元素模型,你将能够对各个领域数据分析。
一、 数据准备与数据预处理
为了用最近邻元素模型给大家演示数据分析,这里使用Kaggle实验室的car_sales数据集。主要通过添加两款新研制的车型进行数据分析,这两款预研车型技术指标主要包括Model、Priceinthousands、enginesize、horsepower、width、length、curbweight、fuelcapacity、fueleffciency等。

为了对这款新研发的车型进行分析,这里在原数据添加这两个车型的新记录。

为了对新记录添加特别关注的标记,因此这里将添加一个名为focal的新变量。点击SPSS顶部菜单栏“转换”-“计算变量”,打开计算变量窗口,目标变量命名为focal,并在数字表达式输入any(Model,'newCar','newTruck')。这个函数表达式意思是Model变量值为'newCar'或者'newTruck',则focal为1,否则为0.

同样通过计算变量方式添加变量partition,用于区分训练数据集和测试数据集,表达式为1-any(Model,'newCar','newTruck')。Partition>0,则为训练数据,否则为测试数据。

二、最近邻元素模型分析
由于篇幅有限,这里仅展示预估汽车类型。点击SPSS顶部菜单栏“分析”-“分类”-“最小邻元素”。点击顶部“变量”项目进行设置,将vehicletype加载到目标文本框,9个指标加载到特征文本框,focal加载到焦点个案,Model加载到个案标签。

点击最近邻元素分析顶部“邻元素”,将k值设置为3,并且勾选计算距离时按重要性对特征进行加权。

点击最近邻元素分析顶部“分区”,训练和坚持分区选择使用变量来分配个案,并且将partition加载到分区变量文本框。

三、结果分析
可以看到对于预估汽车类型结果,数据添加了一个预测值的变量,可以看到对新车的预测比较准确,并且生成了一个预估变量空间图型。

四、小结
以上是利用SPSS最近邻元素模型对汽车行业数据进行分析,相信通过从数据准备和预处理,再到利用最近邻元素模型分析,最后到结果分析,你已经对该模型有一定了解,并且能够简单使用到各个领域。
作者:独行侠
展开阅读全文
︾
微信公众号
读者也喜欢这些内容:
SPSS显著性小于0.001的意义 SPSS显著性大于0.05怎么办
在使用SPSS软件进行数据分析工作的过程中,得到的显著性水平分析结果具有极为重要的作用。它能够帮助我们衡量变量之间是否存在真实的关联,或者不同组别数据之间是否存在实质性的差异。今天我们就一起来探讨关于SPSS显著性小于0.001的意义,SPSS显著性大于0.05怎么办的问题。...
阅读全文 >
SPSS数据筛选好用吗 SPSS数据筛选怎么进行
在数据分析领域,如果收集的数据是为了按照一定标准或者类别来进行区分,我们可以尝试去运用SPSS的数据筛选功能,例如进行海量问卷调查的年龄段分层、地区划定、性别划分等等。本文以SPSS数据筛选好用吗,SPSS数据筛选怎么进行这两个问题为例,带大家了解一下SPSS数据筛选的知识。...
阅读全文 >
SPSS数据视图都是问号怎么办 SPSS数据视图怎么输入文字
SPSS数据统计分析软件的应用领域很广泛,像是教育学、经济学、社会学、医疗等领域都有涉及,也是因为应用的领域广,所以使用SPSS的统计人员也比较多。不过在使用SPSS的时候,也会遇到一些问题,下面给大家介绍SPSS数据视图都是问号怎么办,SPSS数据视图怎么输入文字的相关内容。...
阅读全文 >
SPSS处理数据量范围是多少 SPSS处理数据缺失值怎么办
数据集中的缺失值(Missing Values)指的是在进行数据统计时,由于统计方或调查对象的原因造成的数据缺失,如果不按照一定的统计学方法对这些数据进行处理,统计结果有可能产生偏离,无法施加正确的人工干预。借助SPSS我们可以科学的对数据缺失值进行处理。SPSS处理数据量范围是多少,SPSS处理数据缺失值怎么办,本文向大家作简单介绍。...
阅读全文 >