IBM SPSS Statistics 中文网站 > 使用技巧 > 应用SPSS探索性分析,检验数据的正态性分布

应用SPSS探索性分析,检验数据的正态性分布

发布时间:2020/12/25 18:34:35

IBM SPSS Statistics探索性分析提供了数据过滤、离群值识别、假设检验等分析功能。在《应用SPSS探索性分析,快速检查数据异常值》一文中,我们应用探索性分析检查到数据中存在着极端值的情况。本节,将会继续应用检验功能检查数据的正态分布情况。

一、图分析功能简介

如图1所示,IBM SPSS Statistics探索性分析中的图功能包含了图表的可视化以及正态性检验,简单介绍如下:

1.箱图,以最大值、最小值、中位数和两个四分位数描述数据,可检查数据的对称性与分散程度。

2.描述性,包含茎叶图和直方图。

3.带检验的正态图,包含正态性检验以及正态Q-Q图。

4.含莱文检验的分布-水平图,控制分布-水平图的数据转换。

接下来,我们将简单应用以上功能到本文的例子中,用以检验不同性别的客单价数据是否符合正态分布。

图1:图分析功能

二、应用图分析功能

1、设置图分析选项

如图2所示,分别勾选“直方图”以及“含检验的正态图”两个选项,然后单击“继续”,获取分析结果。

图2:图分析选项

2、解读图分析结果

首先,我们来看一下正态性检验的数值。如图3所示,可以看到,男性客单价在两种检验中均低于0.05的置信度,因此可以拒绝其正态分布的假设。

而女性客单价在柯尔莫哥洛夫-斯米诺夫检验(K-S检验)中高于0.05的置信度,在夏皮洛-威尔克检验(S-W检验)中低于0.05的置信度,因本例女性只有49个样本,属于小样本,要采用S-W检验结果,即拒绝其正态分布的假设。

图3:正态性检验

除了使用正态性检验数据,我们还可以通过正态Q-Q图,简单看一下不同性别客单价的实测值与期望正态值的关系。当数值分布于正态曲线上,表明变量符合正态分布。

如图4所示,可以看到,男性的客单价偏离正态曲线,不符合正态分布。

图4:男性客单价正态Q-Q图

如图5所示,女性的数值虽然都接近于正态曲线,但也有一些离散的值,如果样本量大一点,可能效果会更好一点。

图5:女性客单价正态Q-Q图

然后,如图5所示,选中已添加的地区变量,在新名词处输入重新编码后的变量名称:地区编码,并将其添加为新名称。

图6:女性客单价直方图

从以上结果可以看到,男性与女性的客单价均不符合正态分布的假设,这可能与样本量较少有关。以上就是IBM SPSS Statistics探索性分析的应用介绍,您学会了吗?

作者:泽洋

标签:SPSS数据分析软件

读者也访问过这里:
SPSS Statistics
一款功能强大的数据统计分析工具
立即购买
QQ 群
官方交流群:815794396 立即加群
400-8765-888 kefu@makeding.com
热门文章
SPSS数据分析显著性差异分析步骤 SPSS显著性差异分析结果怎么看
数据的显著性差异分析主要有三种方法,分别是卡方检验、T检验和方差分析。这三种方法都有具体的数据要求:卡方检验是对多个类别的数据进行分析,T检验是对两组数据进行分析,方差分析是对多组数据进行检验。下面,小编具体说明一下SPSS数据分析显著性差异分析步骤,SPSS显著性差异分析结果怎么看。
2022-01-07
实践SPSS单因素方差分析之检验结果解读
在《实践SPSS单因素方差分析之变量与检验方法设置》一文中,我们已经详细地演示了IBM SPSS Statistics单因素方差分析方法的变量选择以及相关的选项、对比设置。
2021-01-11
SPSS相关性分析结果怎么看
相关性分析是对变量或个案之间相关度的测量,在SPSS中可以选择三种方法来进行相关性分析:双变量、偏相关和距离。
2021-04-23
SPSS多元logistic回归分析的使用技巧
回归分析是数据处理中较为常用的一类方法,它可以找出数据变量之间的未知关系,得到较为符合变量关系的数学表达式,以帮助用户完成数据分析。
2021-04-26
如何通过SPSS对问卷进行效度分析
效度分析是指测量的根据或手段(在问卷中为问卷题目)是否能有效检测所需测量事物的程度,是问卷分析中几乎必须进行的一个环节,效度分析分为内容效度、准则效度和结构效度,问卷分析一般所使用的效度分析一般是结构效度。通过数据分析软件IBM SPSS Statistics(win)的效度分析功能我们可轻松获得关于问卷的效度分析结果,帮助我们更好设计或评估问卷。那么如何通过IBM SPSS Statistics对问卷进行效度分析。
2021-10-26
SPSS进行变量赋值的相关操作
变量和个案是IBM SPSS数据界面很重要的两个部分,可以形象理解为地球仪上的经线和纬线。通俗一点讲数据界面的每一列是一种变量,如年龄性别等。一行中的所有变量又构成了一个个案,本篇文章着重讲解变量,个案就不做过多展开。在图1中有具体的标注,可以看一下变量和个案到底是什么样。
2021-02-23