IBM SPSS Statistics 中文网站 > 使用技巧 > 如何使用IBM SPSS Statistics的贝叶斯进行数据分析

如何使用IBM SPSS Statistics的贝叶斯进行数据分析

发布时间:2022/04/25 14:54:19

SPSS的贝叶斯分析是基于一种分类模型,适用于在分类确定的条件下,根据某一研究对象的各种特征值进行统计学分析。使用该模型分析前提包括数据有序分类、符合线性假设、变量间独立等条件。下面将使用SPSS的贝叶斯模型对鸢尾花(iris)数据集进行数据分析,让你对贝叶斯分析的使用更加了解。

 一、 数据准备与处理

 本例使用的是“鸢尾花(iris)数据集”(机器学习经典数据集),通过SPSS软件打开预先下载的数据,总共有150条数据,包括no(编号)、spno(类别)、slen(花萼长度)、swid(花萼宽度)、plen(花瓣长度)、pwid(花瓣宽度)等六个变量,我们将使用上述变量对数据个案进行贝叶斯分析。

 

图1数据展示
图1数据展示

 由于整个数据可能存在不完整或者不干净的数据,因此需要对数据进行预处理。在SPSS中顶部菜单栏点击“分析”—“描述统计”—“描述”,打开描述窗口之后,将slen、swid、plen、pwid四个鸢尾花特征值加载到变量中。并且点击右侧选项按钮,勾选离散部分的“方差”选项。

 

图2加载变量
图2加载变量

 根据描述性统计,可以看到没有分布特别的离散点,不存在缺少值和不合理分布,说明该数据能够用来做分析。

 

图3描述统计
图3描述统计

 二、贝叶斯数据分析

 贝叶斯分析属于分类算法进行分析。点击顶部菜单栏“分析”-“分类”-“判别分析”,即可打开贝叶斯分析窗口,将spno(分类)加载到分组变量,将slen、swid、plen、pwid四个特征值加载到自变量选框,并且点击定义范围值设置为0-2。

 

图4 判别分析
图4 判别分析

 点击右侧统计按钮,勾选描述选框的“单变量”、“博克斯”和函数系统选框的“费希尔”、“未标准化”。

 单变量:对各类中同一自变量均值都相等的假设进行检验,输出单变量的方差分析结果。

 博克斯:对各组的协方差矩阵相等的假设进行检验。

 

图5统计设置
图5统计设置

 点击右侧分类按钮,勾选显示选框的“摘要表”、“留一分类”和图选框的“合并组”、“分组”、“领域图”,并且勾选将缺失值替换为均值。

 合并组:生成一张包括各类的散点图。

 分组:根据前两个判别函数值对每一类生成一张激点图,共分为几类就生成几张散点图。

 领域图:生成用于根据函数值把观测量分到各组中去的边界图。

 

图6分类设置
图6分类设置

 三、结果分析

 由于分析项目比较多,因此这里就不逐一进行结果分析,这里主要是讲解SPSS的贝叶斯分析图和交叉表分析。通过典则判别函数图可以看到将数据分为三类,并且每一类型均确定数据重心,根据重心距离即可确定分类。

 

图7贝叶斯分析图
图7贝叶斯分析图

 通过交叉表项目,输出对每个观测量进行分类的结果分析,可以看到结果正确率达到98%,可说明该分析效果还是非常不错。

 

图8交叉表分析
图8交叉表分析

 四、小结

 以上是利用SPSS的贝叶斯模型对鸢尾花数据集进行分析,首先是获取和预处理数据,然后通过贝叶斯模型对数据进行分析,最后对得到的分析结果进行解析,可以看到整个分析结果还是非常不错,正确率非常高,也同时说明SPSS的贝叶斯模型具有较强的实用性。

 

 作者:独行侠

标签:IBM SPSS StatisticsIBM SPSS

读者也访问过这里:
SPSS Statistics
一款功能强大的数据统计分析工具
立即购买
QQ 群
官方交流群:815794396 立即加群
400-8765-888 kefu@makeding.com
热门文章
实践SPSS单因素方差分析之检验结果解读
在《实践SPSS单因素方差分析之变量与检验方法设置》一文中,我们已经详细地演示了IBM SPSS Statistics单因素方差分析方法的变量选择以及相关的选项、对比设置。
2021-01-11
SPSS相关性分析结果怎么看
相关性分析是对变量或个案之间相关度的测量,在SPSS中可以选择三种方法来进行相关性分析:双变量、偏相关和距离。
2021-04-23
SPSS数据分析显著性差异分析步骤 SPSS显著性差异分析结果怎么看
数据的显著性差异分析主要有三种方法,分别是卡方检验、T检验和方差分析。这三种方法都有具体的数据要求:卡方检验是对多个类别的数据进行分析,T检验是对两组数据进行分析,方差分析是对多组数据进行检验。下面,小编具体说明一下SPSS数据分析显著性差异分析步骤,SPSS显著性差异分析结果怎么看。
2022-01-07
SPSS多元logistic回归分析的使用技巧
回归分析是数据处理中较为常用的一类方法,它可以找出数据变量之间的未知关系,得到较为符合变量关系的数学表达式,以帮助用户完成数据分析。
2021-04-26
SPSS进行变量赋值的相关操作
变量和个案是IBM SPSS数据界面很重要的两个部分,可以形象理解为地球仪上的经线和纬线。通俗一点讲数据界面的每一列是一种变量,如年龄性别等。一行中的所有变量又构成了一个个案,本篇文章着重讲解变量,个案就不做过多展开。在图1中有具体的标注,可以看一下变量和个案到底是什么样。
2021-02-23
如何通过SPSS对问卷进行效度分析
效度分析是指测量的根据或手段(在问卷中为问卷题目)是否能有效检测所需测量事物的程度,是问卷分析中几乎必须进行的一个环节,效度分析分为内容效度、准则效度和结构效度,问卷分析一般所使用的效度分析一般是结构效度。通过数据分析软件IBM SPSS Statistics(win)的效度分析功能我们可轻松获得关于问卷的效度分析结果,帮助我们更好设计或评估问卷。那么如何通过IBM SPSS Statistics对问卷进行效度分析。
2021-10-26