
发布时间:2022/05/06 14:18:21
SPSS的最近邻元素分析是一种分类模型,它是根据个案间的相似性来对个案进行分类。简单来说就是相同个案相互靠近,不同个案相互远离。因此,可以通过判断样本距离哪个离中心点更近,进而判断样本数据属于哪个类别。本篇教程将教大家使用SPSS的最近邻元素模型对汽车行业数据进行数据分析,相信通过学习SPSS的最近邻元素模型,你将能够对各个领域数据分析。
一、 数据准备与数据预处理
为了用最近邻元素模型给大家演示数据分析,这里使用Kaggle实验室的car_sales数据集。主要通过添加两款新研制的车型进行数据分析,这两款预研车型技术指标主要包括Model、Priceinthousands、enginesize、horsepower、width、length、curbweight、fuelcapacity、fueleffciency等。
为了对这款新研发的车型进行分析,这里在原数据添加这两个车型的新记录。
为了对新记录添加特别关注的标记,因此这里将添加一个名为focal的新变量。点击SPSS顶部菜单栏“转换”-“计算变量”,打开计算变量窗口,目标变量命名为focal,并在数字表达式输入any(Model,'newCar','newTruck')。这个函数表达式意思是Model变量值为'newCar'或者'newTruck',则focal为1,否则为0.
同样通过计算变量方式添加变量partition,用于区分训练数据集和测试数据集,表达式为1-any(Model,'newCar','newTruck')。Partition>0,则为训练数据,否则为测试数据。
二、最近邻元素模型分析
由于篇幅有限,这里仅展示预估汽车类型。点击SPSS顶部菜单栏“分析”-“分类”-“最小邻元素”。点击顶部“变量”项目进行设置,将vehicletype加载到目标文本框,9个指标加载到特征文本框,focal加载到焦点个案,Model加载到个案标签。
点击最近邻元素分析顶部“邻元素”,将k值设置为3,并且勾选计算距离时按重要性对特征进行加权。
点击最近邻元素分析顶部“分区”,训练和坚持分区选择使用变量来分配个案,并且将partition加载到分区变量文本框。
三、结果分析
可以看到对于预估汽车类型结果,数据添加了一个预测值的变量,可以看到对新车的预测比较准确,并且生成了一个预估变量空间图型。
四、小结
以上是利用SPSS最近邻元素模型对汽车行业数据进行分析,相信通过从数据准备和预处理,再到利用最近邻元素模型分析,最后到结果分析,你已经对该模型有一定了解,并且能够简单使用到各个领域。
作者:独行侠
读者也喜欢这些内容:
spss录入数据限制范围 spss录入数据后怎么做成表
SPSS以变量为单位管理数据,每一列代表一个变量,每个变量的每一行称为一个“个案”。站在统计学角度,每一个个案代表一个随机事件,全部录入的随机事件结果构成调查表,在录入随机事件结果的过程中,SPSS会对数据结构有所限制。那么SPSS录入数据限制范围是怎样的,SPSS录入数据后怎么做成表,本文结合实例向大家做简单的介绍。...
阅读全文 >
spss相关性分析有哪些方法 spss相关性分析的基本步骤
通过统计学的,定量的指标来描述变量之间的关系,这种过程即为相关分析,根据变量类型的不同,可以选择不同的指标来描述变量间的相关关系,鉴于统计分析巨大的计算量,我们一般通过专业的统计分析软件如IBM SPSS Statistics来完成分析。关于SPSS相关性分析有哪些方法,SPSS相关性分析的基本步骤是怎样的问题,本文结合实例,向大家做简单的介绍。...
阅读全文 >
spss配对样本t检验数据录入 spss配对样本t检验数据有负数
t检验是应用范围非常广的一种假设检验,旨在确定两组同样性质的样本经不同处理,或同一样本经不同处理,或同一样本处理前后属性是否有显著性的区别。我们借助SPSS可以非常快速地完成t检验,对于非数学专业的用户,可能有SPSS配对样本t检验数据录入,SPSS配对样本t检验数据有负数之类的问题,我们结合实例及t检验计算公式,向大家做简单的介绍。...
阅读全文 >
spss关联性分析步骤 spss关联性分析结果怎么看
关联性分析或者称为相关分析,在医学,经济学等领域应用广泛,用以探求变量间是否存在关系。我们一般通过专业的统计分析软件进行相关性分析,如IBM SPSS Statistics,spss关联性分析步骤是怎样的,spss关联性分析结果怎么看,本文结合实例向大家做简单的介绍。...
阅读全文 >