
发布时间:2022/04/25 14:54:19
SPSS的贝叶斯分析是基于一种分类模型,适用于在分类确定的条件下,根据某一研究对象的各种特征值进行统计学分析。使用该模型分析前提包括数据有序分类、符合线性假设、变量间独立等条件。下面将使用SPSS的贝叶斯模型对鸢尾花(iris)数据集进行数据分析,让你对贝叶斯分析的使用更加了解。
一、 数据准备与处理
本例使用的是“鸢尾花(iris)数据集”(机器学习经典数据集),通过SPSS软件打开预先下载的数据,总共有150条数据,包括no(编号)、spno(类别)、slen(花萼长度)、swid(花萼宽度)、plen(花瓣长度)、pwid(花瓣宽度)等六个变量,我们将使用上述变量对数据个案进行贝叶斯分析。
由于整个数据可能存在不完整或者不干净的数据,因此需要对数据进行预处理。在SPSS中顶部菜单栏点击“分析”—“描述统计”—“描述”,打开描述窗口之后,将slen、swid、plen、pwid四个鸢尾花特征值加载到变量中。并且点击右侧选项按钮,勾选离散部分的“方差”选项。
根据描述性统计,可以看到没有分布特别的离散点,不存在缺少值和不合理分布,说明该数据能够用来做分析。
二、贝叶斯数据分析
贝叶斯分析属于分类算法进行分析。点击顶部菜单栏“分析”-“分类”-“判别分析”,即可打开贝叶斯分析窗口,将spno(分类)加载到分组变量,将slen、swid、plen、pwid四个特征值加载到自变量选框,并且点击定义范围值设置为0-2。
点击右侧统计按钮,勾选描述选框的“单变量”、“博克斯”和函数系统选框的“费希尔”、“未标准化”。
单变量:对各类中同一自变量均值都相等的假设进行检验,输出单变量的方差分析结果。
博克斯:对各组的协方差矩阵相等的假设进行检验。
点击右侧分类按钮,勾选显示选框的“摘要表”、“留一分类”和图选框的“合并组”、“分组”、“领域图”,并且勾选将缺失值替换为均值。
合并组:生成一张包括各类的散点图。
分组:根据前两个判别函数值对每一类生成一张激点图,共分为几类就生成几张散点图。
领域图:生成用于根据函数值把观测量分到各组中去的边界图。
三、结果分析
由于分析项目比较多,因此这里就不逐一进行结果分析,这里主要是讲解SPSS的贝叶斯分析图和交叉表分析。通过典则判别函数图可以看到将数据分为三类,并且每一类型均确定数据重心,根据重心距离即可确定分类。
通过交叉表项目,输出对每个观测量进行分类的结果分析,可以看到结果正确率达到98%,可说明该分析效果还是非常不错。
四、小结
以上是利用SPSS的贝叶斯模型对鸢尾花数据集进行分析,首先是获取和预处理数据,然后通过贝叶斯模型对数据进行分析,最后对得到的分析结果进行解析,可以看到整个分析结果还是非常不错,正确率非常高,也同时说明SPSS的贝叶斯模型具有较强的实用性。
作者:独行侠
读者也喜欢这些内容:
spss pearson相关性分析步骤 spss pearson相关性分析结果怎么看
Pearson(皮尔逊)相关性指的是联合分布服从二维正态分布的随机变量X,Y之间的简单线性相关关系,X,Y之间的相关关系由简单相关系数r表示。利用IBM SPSS Statistics可以非常快速地完成两个随机变量X,Y间的Pearson(皮尔逊)相关性分析,SPSS Pearson相关性分析步骤是什么,SPSS Pearson相关性分析结果怎么看,本文结合实例,向大家做简单的介绍。...
阅读全文 >
spss决策树分析优缺点 spss决策树为什么没有生成树形图
SPSS决策树分析是在树状图的分析基础上构建的一种数据处理模型,它可以根据自变量的值来预测出因变量的变化趋势,并且分析得出数据之间的相互关联关系,还可以得出数据的风险状况,但是SPSS决策树在数据分析中同样也有优缺点,那么下面就来给大家介绍SPSS决策树分析优缺点,SPSS决策树为什么没有生成树形图。...
阅读全文 >
spss决策树分析 spss决策树分析结果解读
SPSS的决策树分析是以树状图为基础的分类模型,它将个体分成若干个小组,或者依据自变量的数值推测出因变量的相关信息,在数据处理任务中占据重要地位。决策树分析不仅能够生成数据的理解准则,还可以处理连续的种类和字段,并且还能够广泛应用与小数集中。那么下面就来介绍spss决策树分析,spss决策树分析结果解读。...
阅读全文 >
spss置信区间上限下限解读 spss置信区间和预测区间怎么做
在使用IBM SPSS Statistics处理数据时,会使用到置信区间,置信区间是指由样板统计量所构造的总体参数的估计区间。而在统计学中,置信区间是这个参数的真实值落在测量结果周边的概率。在SPSS中,能够完成较为精确的数据分析,那么下面就来介绍SPSS置信区间上限下限解读,SPSS置信区间和预测区间怎么做。...
阅读全文 >