IBM Business Partner

IBM SPSS Statistics 中文网站 > 使用技巧 > 应用SPSS探索性分析,检验数据的正态性分布

应用SPSS探索性分析,检验数据的正态性分布

发布时间:2020/12/25

IBM SPSS Statistics探索性分析提供了数据过滤、离群值识别、假设检验等分析功能。在《应用SPSS探索性分析,快速检查数据异常值》一文中,我们应用探索性分析检查到数据中存在着极端值的情况。本节,将会继续应用检验功能检查数据的正态分布情况。

一、图分析功能简介

如图1所示,IBM SPSS Statistics探索性分析中的图功能包含了图表的可视化以及正态性检验,简单介绍如下:

1.箱图,以最大值、最小值、中位数和两个四分位数描述数据,可检查数据的对称性与分散程度。

2.描述性,包含茎叶图和直方图。

3.带检验的正态图,包含正态性检验以及正态Q-Q图。

4.含莱文检验的分布-水平图,控制分布-水平图的数据转换。

接下来,我们将简单应用以上功能到本文的例子中,用以检验不同性别的客单价数据是否符合正态分布。

图1:图分析功能

二、应用图分析功能

1、设置图分析选项

如图2所示,分别勾选“直方图”以及“含检验的正态图”两个选项,然后单击“继续”,获取分析结果。

图2:图分析选项

2、解读图分析结果

首先,我们来看一下正态性检验的数值。如图3所示,可以看到,男性客单价在两种检验中均低于0.05的置信度,因此可以拒绝其正态分布的假设。

而女性客单价在柯尔莫哥洛夫-斯米诺夫检验(K-S检验)中高于0.05的置信度,在夏皮洛-威尔克检验(S-W检验)中低于0.05的置信度,因本例女性只有49个样本,属于小样本,要采用S-W检验结果,即拒绝其正态分布的假设。

图3:正态性检验

除了使用正态性检验数据,我们还可以通过正态Q-Q图,简单看一下不同性别客单价的实测值与期望正态值的关系。当数值分布于正态曲线上,表明变量符合正态分布。

如图4所示,可以看到,男性的客单价偏离正态曲线,不符合正态分布。

图4:男性客单价正态Q-Q图

如图5所示,女性的数值虽然都接近于正态曲线,但也有一些离散的值,如果样本量大一点,可能效果会更好一点。

图5:女性客单价正态Q-Q图

然后,如图5所示,选中已添加的地区变量,在新名词处输入重新编码后的变量名称:地区编码,并将其添加为新名称。

图6:女性客单价直方图

从以上结果可以看到,男性与女性的客单价均不符合正态分布的假设,这可能与样本量较少有关。以上就是IBM SPSS Statistics探索性分析的应用介绍,您学会了吗?

作者:泽洋

标签:SPSS数据分析软件

读者也访问过这里:
SPSS Statistics
一款功能强大的数据统计分析工具
立即购买
QQ 群
官方交流群:815794396 立即加群
400-8765-888 kefu@makeding.com
热门文章
如何用SPSS计算个人BMI值?
BMI即体重指数,是衡量个人身体质量的一个重要参数,通过判断BMI的数值大小,我们可以判断个人身高与体重是否协调。下面我将用IBM SPSS Statistics来为大家介绍BMI的计算方法。
2021-03-19
SPSS相关性分析结果怎么看
相关性分析是对变量或个案之间相关度的测量,在SPSS中可以选择三种方法来进行相关性分析:双变量、偏相关和距离。
2021-04-23
实践SPSS单因素方差分析之检验结果解读
在《实践SPSS单因素方差分析之变量与检验方法设置》一文中,我们已经详细地演示了IBM SPSS Statistics单因素方差分析方法的变量选择以及相关的选项、对比设置。
2021-01-11
SPSS进行变量赋值的相关操作
变量和个案是IBM SPSS数据界面很重要的两个部分,可以形象理解为地球仪上的经线和纬线。通俗一点讲数据界面的每一列是一种变量,如年龄性别等。一行中的所有变量又构成了一个个案,本篇文章着重讲解变量,个案就不做过多展开。在图1中有具体的标注,可以看一下变量和个案到底是什么样。
2021-02-23
使用SPSS进行回归分析的方法总结
IBM SPSS Statistics 是强大的统计软件平台,SPSS全称Statistical Product and Service Solutions(统计产品与服务解决方案), SPSS可以帮助我们分析并更好地了解数据,以解决复杂的业务和研究问题。如今,SPSS已经被广泛运用于数据分析等各个领域。
2021-03-09
如何使用SPSS检验数据是否服从正态分布—偏度峰度系数
在《如何使用SPSS检验数据是否服从正态分布—KS检验与Q-Q图》一文中,我们了解了如何使用KS检验、Q-Q图来验证数据的正态性。接下来,本文将会继续讲解如何使用IBM SPSS Statistics的描述统计(偏度峰度系数)、探索统计检验(正态检验)数据的正态性。
2021-01-07