发布时间:2025-12-23 10: 00: 00
品牌型号:联想 小新14
系统:Windows 10
软件版本:IBM SPSS Statistics 31.0
在临床收集数据时,由于每个患者做的指标不同,影像学检查也存在差异,所以经常会遇到数据缺失的情况。SPSS作为一款专业的数据分析软件,它可以帮助我们分析出哪些指标有缺失值和大概占比多少,以及针对这些缺失数据,利用不同的方法进行填补。今天我们一起来探讨SPSS怎么处理缺失值,SPSS缺失数据过多如何填补的问题。
一、SPSS怎么处理缺失值
这里搜集了30名被调研对象的数据,分为两组,分别是病例组和对照组。我们发现表格里舒张压和心率数据存在部分缺失值。这些缺失值需要填补,才能进行下一步分析。而舒张压和心率与年龄、性别、身高、体重等因素密切相关,所以我们可以利用SPSS的回归估计法来填补缺失值。这里将为大家详细介绍关于SPSS怎么处理缺失值的具体操作步骤:
1、首先把收集到的数据导入SPSS中,点击上方“分析”选项,接着在菜单中找到并点击“缺失值分析”。进入缺失值分析对话框后,我们会看到两个主要的选择框,一个是用于选择定量变量的框,另一个是用于选择分类变量的框。

2、从我们的数据中可以看出,“组别”属于分类变量,它分为病例组和对照组;“年龄”属于定量变量,是连续数值型变量;“性别”也是分类变量,分为男性和女性;而身高、体重、收缩压、舒张压以及心率则都属于定量变量。

3、选择完变量后,在对话框右边的估算方法中勾选“回归”选项。勾选了回归估计法,就相当于告知SPSS软件,要把缺失的变量当作因变量,没有缺失的变量当作自变量来进行处理。

4、点击最下边的“回归”选项,弹出新的窗口,在这里勾选“保存完成的数据”,将插补好的数据另存一份,以便后面使用和分析。下面输入新的数据集名称,注意名称的首位不能是数字,可以输入中文或者英文,点击继续后点击确定,就会生成一份缺失值填补完成的新数据表。

二、SPSS缺失数据过多如何填补
我们知道临床数据案例十分宝贵,当缺失数据过多时,不能粗暴删除,要想办法填补缺失值。在SPSS软件中,大家可以使用多重插补法,处理临床上的数据缺失值。多重插补法是从包含缺失值的原始数据集出发,通过不同插补方法衍生出不同数据集,再对这些数据集进行整合分析。下面我们将为大家介绍在SPSS中缺失数据过多如何填补的具体操作步骤:
1、如下图所示,这里收集了88名患者心衰数据库,心衰患者标记为1,非心衰患者标记为0,还统计了患者的血压等级、有无糖尿病、性别、年龄和BMI等,当前数据集有很多缺失值。

2、首先,我们查看哪些指标缺失及缺失比例。打开SPSS软件,把数据导入。在上方工具栏里点击分析,在下拉菜单中找到缺失值分析并点击。

3、在弹出的窗口里把定量数据如BMI和年龄放在定量变量框,其余都为分类变量,直接放入分类变量框,序号不用管。点击右边的模式选项,弹出的窗口中勾选个案表,点击继续,点击确定按钮。

4、在统计结果界面可以看到,单变量统计表中列出了详细的缺失值个数及占比。比如BMI有72个数据,缺失16个,占比18.2%;患者年龄有76个数据,缺失12个。性别变量存在73个,缺失15个,占比17%等等。

5、接下来对缺失值进行插补,点击分析中的多重插补,选择插补缺失数据值。在弹出的窗口中把需要插补的变量都选中放入模型中的变量框,按住Ctrl键可快速勾选。插补次数可调整,默认是5次,数据集命名要用英文,比如这里输入新数据集叫“new”。

6、接着点击方法,弹出的新窗口中选择定制。后面的约束和输出不太重要,大家可以按照需要选择,比如勾选具有插补值的变量的统计描述,最后点击确定。

7、插补完成后,查看插补模型,会显示各变量插补方式,如BMI用线性回归插补,共缺失16个,因插补5轮,共插补80个数值;性别缺失15个,插补5轮,共插补75个数值,用逻辑回归插补。

8、插补完成,点击SPSS图标,能看到写着“无标题new”的新数据集,这是插补后的数据。右上角下拉菜单,选1可看到第一次插补后的数据集情况,黄色部分是插补值;选2能看到第二轮插补有轻微变化,下拉菜单中,前面“imputation”后的12345代表插补轮次。

以上就是关于SPSS怎么处理缺失值,SPSS缺失数据过多如何填补的全部内容。如果收集到的数据存在缺失值,可以运用SPSS软件里的回归估计法或者是多重插补法进行缺失值插补。文中分别列出了这两种方法的具体操作步骤,希望本文的内容能帮助有需要的小伙伴。
署名:梦
展开阅读全文
︾
微信公众号