发布时间:2022-05-06 14: 18: 21
SPSS的最近邻元素分析是一种分类模型,它是根据个案间的相似性来对个案进行分类。简单来说就是相同个案相互靠近,不同个案相互远离。因此,可以通过判断样本距离哪个离中心点更近,进而判断样本数据属于哪个类别。本篇教程将教大家使用SPSS的最近邻元素模型对汽车行业数据进行数据分析,相信通过学习SPSS的最近邻元素模型,你将能够对各个领域数据分析。
一、 数据准备与数据预处理
为了用最近邻元素模型给大家演示数据分析,这里使用Kaggle实验室的car_sales数据集。主要通过添加两款新研制的车型进行数据分析,这两款预研车型技术指标主要包括Model、Priceinthousands、enginesize、horsepower、width、length、curbweight、fuelcapacity、fueleffciency等。
为了对这款新研发的车型进行分析,这里在原数据添加这两个车型的新记录。
为了对新记录添加特别关注的标记,因此这里将添加一个名为focal的新变量。点击SPSS顶部菜单栏“转换”-“计算变量”,打开计算变量窗口,目标变量命名为focal,并在数字表达式输入any(Model,'newCar','newTruck')。这个函数表达式意思是Model变量值为'newCar'或者'newTruck',则focal为1,否则为0.
同样通过计算变量方式添加变量partition,用于区分训练数据集和测试数据集,表达式为1-any(Model,'newCar','newTruck')。Partition>0,则为训练数据,否则为测试数据。
二、最近邻元素模型分析
由于篇幅有限,这里仅展示预估汽车类型。点击SPSS顶部菜单栏“分析”-“分类”-“最小邻元素”。点击顶部“变量”项目进行设置,将vehicletype加载到目标文本框,9个指标加载到特征文本框,focal加载到焦点个案,Model加载到个案标签。
点击最近邻元素分析顶部“邻元素”,将k值设置为3,并且勾选计算距离时按重要性对特征进行加权。
点击最近邻元素分析顶部“分区”,训练和坚持分区选择使用变量来分配个案,并且将partition加载到分区变量文本框。
三、结果分析
可以看到对于预估汽车类型结果,数据添加了一个预测值的变量,可以看到对新车的预测比较准确,并且生成了一个预估变量空间图型。
四、小结
以上是利用SPSS最近邻元素模型对汽车行业数据进行分析,相信通过从数据准备和预处理,再到利用最近邻元素模型分析,最后到结果分析,你已经对该模型有一定了解,并且能够简单使用到各个领域。
作者:独行侠
展开阅读全文
︾
读者也喜欢这些内容:
spss多元线性回归分析操作步骤,spss多元线性回归分析结果解读
spss多元线性回归分析操作步骤,本文会以客流量、销售量与销售额的线性关系演示spss的多元线性回归分析操作步骤,并进行spss多元线性回归分析结果解读。...
阅读全文 >
spss怎么做逐步回归分析 逐步回归分析spss结果解读
spss怎么做逐步回归分析?逐步回归分析是多元线性回归分析的一种,可通过spss回归分析中的“步进”法来做逐步回归分析。本文会运用例子演示逐步回归分析步骤,并进行逐步回归分析spss结果解读。...
阅读全文 >
spss卡方趋势检验怎么做 spss卡方趋势检验步骤
对于两组定类变量,如果想了解它们之间是否存在线性相关关系,可以借助趋势卡方检验(Trend χ2 Test),根据趋势卡方检验结果可以判断变量间是否存在相关关系,并且可以进一步了解变量间相关关系是否为线性相关关系。关于SPSS卡方趋势检验怎么做,SPSS卡方趋势检验步骤是怎样的,本文结合实例向大家做简单的介绍。...
阅读全文 >
SPSS假设检验步骤 SPSS假设检验结果分析
假设检验是统计学中由样本推测总体的一种方法,做出假设后,根据样本的某些统计量计算显著性水平,然后判断是否接受假设,实际工作中,我们一般通过专业的统计软件进行假设检验,如IBM SPSS Statistics,SPSS可以进行如t检验,卡方检验,F检验等多种假设检验,本文中,以最常用的t检验为例,向大家介绍SPSS假设检验步骤,SPSS假设检验结果分析。...
阅读全文 >