发布时间:2022-04-25 14: 50: 50
SPSS的贝叶斯分析是基于一种分类模型,适用于在分类确定的条件下,根据某一研究对象的各种特征值进行统计学分析。使用该模型分析前提包括数据有序分类、符合线性假设、变量间独立等条件。下面将使用SPSS的贝叶斯模型对鸢尾花(iris)数据集进行数据分析,让你对贝叶斯分析的使用更加了解。
一、 数据准备与处理
本例使用的是“鸢尾花(iris)数据集”(机器学习经典数据集),通过SPSS软件打开预先下载的数据,总共有150条数据,包括no(编号)、spno(类别)、slen(花萼长度)、swid(花萼宽度)、plen(花瓣长度)、pwid(花瓣宽度)等六个变量,我们将使用上述变量对数据个案进行贝叶斯分析。
由于整个数据可能存在不完整或者不干净的数据,因此需要对数据进行预处理。在SPSS中顶部菜单栏点击“分析”—“描述统计”—“描述”,打开描述窗口之后,将slen、swid、plen、pwid四个鸢尾花特征值加载到变量中。并且点击右侧选项按钮,勾选离散部分的“方差”选项。
根据描述性统计,可以看到没有分布特别的离散点,不存在缺少值和不合理分布,说明该数据能够用来做分析。
二、贝叶斯数据分析
贝叶斯分析属于分类算法进行分析。点击顶部菜单栏“分析”-“分类”-“判别分析”,即可打开贝叶斯分析窗口,将spno(分类)加载到分组变量,将slen、swid、plen、pwid四个特征值加载到自变量选框,并且点击定义范围值设置为0-2。
点击右侧统计按钮,勾选描述选框的“单变量”、“博克斯”和函数系统选框的“费希尔”、“未标准化”。
单变量:对各类中同一自变量均值都相等的假设进行检验,输出单变量的方差分析结果。
博克斯:对各组的协方差矩阵相等的假设进行检验。
点击右侧分类按钮,勾选显示选框的“摘要表”、“留一分类”和图选框的“合并组”、“分组”、“领域图”,并且勾选将缺失值替换为均值。
合并组:生成一张包括各类的散点图。
分组:根据前两个判别函数值对每一类生成一张激点图,共分为几类就生成几张散点图。
领域图:生成用于根据函数值把观测量分到各组中去的边界图。
三、结果分析
由于分析项目比较多,因此这里就不逐一进行结果分析,这里主要是讲解SPSS的贝叶斯分析图和交叉表分析。通过典则判别函数图可以看到将数据分为三类,并且每一类型均确定数据重心,根据重心距离即可确定分类。
通过交叉表项目,输出对每个观测量进行分类的结果分析,可以看到结果正确率达到98%,可说明该分析效果还是非常不错。
四、小结
以上是利用SPSS的贝叶斯模型对鸢尾花数据集进行分析,首先是获取和预处理数据,然后通过贝叶斯模型对数据进行分析,最后对得到的分析结果进行解析,可以看到整个分析结果还是非常不错,正确率非常高,也同时说明SPSS的贝叶斯模型具有较强的实用性。
作者:独行侠
展开阅读全文
︾
读者也喜欢这些内容:
spss多元线性回归分析操作步骤,spss多元线性回归分析结果解读
spss多元线性回归分析操作步骤,本文会以客流量、销售量与销售额的线性关系演示spss的多元线性回归分析操作步骤,并进行spss多元线性回归分析结果解读。...
阅读全文 >
怎样使用SPSS的概率回归方法分析数据
回归分析是数据分析中广泛应用的一种方法,如果要学习数理统计分析,回归分析将是重中之重。...
阅读全文 >
逐步回归分析和多元线性回归的区别 SPSS逐步回归分析实例
将获取的全部样本点用一条光滑曲线连接起来,拟合这条曲线的方法有无数种,按照自变量的个数的多少,可分为一元回归分析和多元回归分析。按照变量之间的关系,可分为线性和非线性。逐步回归分析是多元线性回归分析的一种,本文就来谈谈逐步回归分析和多元线性回归的区别,SPSS逐步回归分析实例。...
阅读全文 >
SPSS多元非线性回归分析步骤 SPSS多元非线性回归分析结果
多元非线性回归主要用于进行多变量的分析比较和预测,当现实中的自变量和因变量,即输出和输入数据不成线性关系时,我们要通过对数型变化将非线性问题转换为线性问题,但这仅靠人力明显难以做到,这个时候我们就可以借助数据分析工具——SPSS来进行多元非线性回归分析,下面来为大家具体介绍有关SPSS多元非线性回归分析步骤,SPSS多元非线性回归分析结果的相关内容。...
阅读全文 >