SPSS > 使用技巧 > SPSS怎么处理缺失值 SPSS缺失数据过多如何填补

SPSS怎么处理缺失值 SPSS缺失数据过多如何填补

发布时间:2025-12-23 10: 00: 00

品牌型号:联想 小新14

系统:Windows 10

软件版本:IBM SPSS Statistics 31.0

在临床收集数据时,由于每个患者做的指标不同,影像学检查也存在差异,所以经常会遇到数据缺失的情况。SPSS作为一款专业的数据分析软件,它可以帮助我们分析出哪些指标有缺失值和大概占比多少,以及针对这些缺失数据,利用不同的方法进行填补。今天我们一起来探讨SPSS怎么处理缺失值,SPSS缺失数据过多如何填补的问题。

一、SPSS怎么处理缺失值

这里搜集了30名被调研对象的数据,分为两组,分别是病例组和对照组。我们发现表格里舒张压和心率数据存在部分缺失值。这些缺失值需要填补,才能进行下一步分析。而舒张压和心率与年龄、性别、身高、体重等因素密切相关,所以我们可以利用SPSS的回归估计法来填补缺失值。这里将为大家详细介绍关于SPSS怎么处理缺失值的具体操作步骤:

1、首先把收集到的数据导入SPSS中,点击上方“分析”选项,接着在菜单中找到并点击“缺失值分析”。进入缺失值分析对话框后,我们会看到两个主要的选择框,一个是用于选择定量变量的框,另一个是用于选择分类变量的框。

点击“缺失值分析”
图1:点击“缺失值分析”

2、从我们的数据中可以看出,“组别”属于分类变量,它分为病例组和对照组;“年龄”属于定量变量,是连续数值型变量;“性别”也是分类变量,分为男性和女性;而身高、体重、收缩压、舒张压以及心率则都属于定量变量。

把变量拖入对应框中
图2:把变量拖入对应框中

3、选择完变量后,在对话框右边的估算方法中勾选“回归”选项。勾选了回归估计法,就相当于告知SPSS软件,要把缺失的变量当作因变量,没有缺失的变量当作自变量来进行处理。

勾选回归估算法
图3:勾选回归估算法

4、点击最下边的“回归”选项,弹出新的窗口,在这里勾选“保存完成的数据”,将插补好的数据另存一份,以便后面使用和分析。下面输入新的数据集名称,注意名称的首位不能是数字,可以输入中文或者英文,点击继续后点击确定,就会生成一份缺失值填补完成的新数据表。

输入新命名,生成新数据表
 图4:输入新命名,生成新数据表

二、SPSS缺失数据过多如何填补

我们知道临床数据案例十分宝贵,当缺失数据过多时,不能粗暴删除,要想办法填补缺失值。在SPSS软件中,大家可以使用多重插补法,处理临床上的数据缺失值。多重插补法是从包含缺失值的原始数据集出发,通过不同插补方法衍生出不同数据集,再对这些数据集进行整合分析。下面我们将为大家介绍在SPSS中缺失数据过多如何填补的具体操作步骤:

1、如下图所示,这里收集了88名患者心衰数据库,心衰患者标记为1,非心衰患者标记为0,还统计了患者的血压等级、有无糖尿病、性别、年龄和BMI等,当前数据集有很多缺失值。

数据表有多个缺失值
图5:数据表有多个缺失值

2、首先,我们查看哪些指标缺失及缺失比例。打开SPSS软件,把数据导入。在上方工具栏里点击分析,在下拉菜单中找到缺失值分析并点击。

选择缺失值分析
图6:选择缺失值分析

3、在弹出的窗口里把定量数据如BMI和年龄放在定量变量框,其余都为分类变量,直接放入分类变量框,序号不用管。点击右边的模式选项,弹出的窗口中勾选个案表,点击继续,点击确定按钮。

把变量放入对应框,并勾选个案
图7:把变量放入对应框,并勾选个案

4、在统计结果界面可以看到,单变量统计表中列出了详细的缺失值个数及占比。比如BMI有72个数据,缺失16个,占比18.2%;患者年龄有76个数据,缺失12个。性别变量存在73个,缺失15个,占比17%等等。

查看缺失值情况
图8:查看缺失值情况

5、接下来对缺失值进行插补,点击分析中的多重插补,选择插补缺失数据值。在弹出的窗口中把需要插补的变量都选中放入模型中的变量框,按住Ctrl键可快速勾选。插补次数可调整,默认是5次,数据集命名要用英文,比如这里输入新数据集叫“new”。

选择多重插补
图9:选择多重插补

6、接着点击方法,弹出的新窗口中选择定制。后面的约束和输出不太重要,大家可以按照需要选择,比如勾选具有插补值的变量的统计描述,最后点击确定。

勾选定制方法
图10:勾选定制方法

7、插补完成后,查看插补模型,会显示各变量插补方式,如BMI用线性回归插补,共缺失16个,因插补5轮,共插补80个数值;性别缺失15个,插补5轮,共插补75个数值,用逻辑回归插补。

查看插补模型
图11:查看插补模型

8、插补完成,点击SPSS图标,能看到写着“无标题new”的新数据集,这是插补后的数据。右上角下拉菜单,选1可看到第一次插补后的数据集情况,黄色部分是插补值;选2能看到第二轮插补有轻微变化,下拉菜单中,前面“imputation”后的12345代表插补轮次。

查看插补后的数据
图12:查看插补后的数据

以上就是关于SPSS怎么处理缺失值,SPSS缺失数据过多如何填补的全部内容。如果收集到的数据存在缺失值,可以运用SPSS软件里的回归估计法或者是多重插补法进行缺失值插补。文中分别列出了这两种方法的具体操作步骤,希望本文的内容能帮助有需要的小伙伴。

署名:梦

展开阅读全文

标签:SPSS缺失值SPSS缺失值分析SPSS缺失值处理SPSS替换缺失值

读者也访问过这里:
SPSS Statistics
强大的数据分析平台
立即购买
微信群
官方微信群 立即加群
400-8765-888 kefu@makeding.com
热门文章
SPSS数据分析显著性差异分析步骤 SPSS显著性差异分析结果怎么看
数据的显著性差异分析主要有三种方法,分别是卡方检验、T检验和方差分析。这三种方法都有具体的数据要求:卡方检验是对多个类别的数据进行分析,T检验是对两组数据进行分析,方差分析是对多组数据进行检验。下面,小编具体说明一下SPSS数据分析显著性差异分析步骤,SPSS显著性差异分析结果怎么看。
2022-01-07
实践SPSS单因素方差分析之检验结果解读
在《实践SPSS单因素方差分析之变量与检验方法设置》一文中,我们已经详细地演示了IBM SPSS Statistics单因素方差分析方法的变量选择以及相关的选项、对比设置。
2021-01-11
spss如何做显著性分析 spss显著性差异分析怎么标abc
在统计分析中,显著性分析是分析相关因素之间是否存在显著影响关系的关键性指标,通过它可以说明分析结论是否由抽样误差引起还是实际相关的,可论证分析结果的准确性。下面大家一起来看看用spss如何做显著性分析,spss显著性差异分析怎么标abc。
2022-03-14
SPSS回归分析中的f值是什么 SPSS回归分析F值在什么范围合适
回归分析中以R表示相关性程度的高低,以F评价回归分析是否有统计学的意义,使用IBM SPSS Statistics进行回归分析,可以非常快速的完成R,F的计算,并且给出回归曲线方程,那么,SPSS回归分析中f值是什么?SPSS回归分析F值在什么范围合适,本文结合实例向大家作简单的说明。
2022-07-22
SPSS多元logistic回归分析的使用技巧
回归分析是数据处理中较为常用的一类方法,它可以找出数据变量之间的未知关系,得到较为符合变量关系的数学表达式,以帮助用户完成数据分析。
2021-04-26
SPSS相关性分析结果怎么看
相关性分析是对变量或个案之间相关度的测量,在SPSS中可以选择三种方法来进行相关性分析:双变量、偏相关和距离。
2021-04-23
最新文章
SPSS协变量是什么 SPSS因子和协变量的区别
在方差分析、一般线性模型等统计分析中,协变量与因子是两个核心基础概念,我们需要准确理解二者的定义、合理区分二者的差异。接下来我将为大家介绍:SPSS协变量是什么,SPSS因子和协变量的区别的相关内容。
2026-06-02
SPSS选择个案如何设置多个条件 SPSS选择个案后如何恢复原始数据
按条件筛选个案,是我们精准提取目标数据的一种常用的方法。另外,多条件筛选能够贴合复杂的分析需求,而筛选后及时恢复原始数据则能保证后续分析的准确性。合理运用多条件选择个案功能,搭配正确的原始数据恢复方法,能让数据筛选操作更高效、数据使用更安全。接下来我将为大家介绍:SPSS选择个案如何设置多个条件,SPSS选择个案后如何恢复原始数据的相关内容。
2026-06-02
SPSS中如何计算auc SPSS中如何计算or值
如果想看一下二分类模型的预测能力好不好,可以用auc这个数值去看。auc其实就是曲线下面积,如果它的值大于0.5,就可以认为模型是有预测价值的,当然,数值越靠近1就越好。而or值,其实就是风险比,可以用来看两个变量的关联程度。接下来我们将介绍SPSS中如何计算auc,SPSS中如何计算or值的相关内容。
2026-06-02
SPSS分析数据分布形态怎么做 SPSS偏态分布的数据怎么分析
分析数据的时候,如果事先不知道它们的分布类型,就要先花一些时间探索一下规律,不然容易出现研究误差。因为针对不同的分布情况,可能会用到不同的分析方法,比如常见的正态分布,有些数据不符合正态分布,就要用一些特殊的研究方法,不然可能会得出错误的结论。接下来我们会介绍SPSS分析数据分布形态怎么做,SPSS偏态分布的数据怎么分析的相关内容。
2026-06-02
SPSS中z检验怎么做 SPSS z检验双侧和单侧的0.01和0.05是多少
针对不同的数据分布,我们要用到的研究方法可能会不同。比如z检验,就是一种要求总体标准差已知的研究方法,而且也需要数据服从标准正态分布。而z检验与t检验比较相似,但相对来说,z检验的要求更为苛刻一些,也更适用在大样本上。接下来我们会介绍SPSS中z检验怎么做,SPSS z检验双侧和单侧的0.01和0.05是多少的相关内容。
2026-06-02
SPSS可以做Spearman相关性分析吗 SPSS的Spearman相关性分析结果怎么看
相关性分析,是一种研究变量之间关系的方法,在数据研究里面很常会用到,比如想知道喝牛奶会不会影响身高、加入某些肥料会不会提高产量等,都会用到相关性分析。在SPSS里面,我们可以用散点图、双变量等方法做相关的分析,接下来,我们会介绍SPSS可以做Spearman相关性分析吗,SPSS的Spearman相关性分析结果怎么看的相关内容。
2026-06-02

微信公众号

欢迎加入 SPSS 产品的大家庭,立即扫码关注,获取更多软件动态和资源福利。

读者也喜欢这些内容: