发布时间:2021-06-18 14: 21: 12
说起病例对照研究,相信各位小伙伴们都不陌生。简单来说,就是把患有某种疾病的一组病人作为病例组,不患该疾病但是可进行对比试验的另一组作为对照组,通过两组别进行比较,从而推断出某些因素和疾病之间的关联。
因此本节中,我们将一起学习如何使用SPSS软件,设置病例组与对照组的一比一个案控制匹配。
一、个案控制匹配设置
目前对于是否有吸烟习惯和高血压之间的关系存在着一定的争议,本文搜集了高血压组与正常组共2100条数据,数据如下图1。此时的数据是混合在一起的,并没有进行一一匹配,下面我们将使用此数据,进行病例与对照组的数据匹配。
图1:演示混合数据
选择【数据】中的【个案控制匹配】菜单,进行病例组和对照组的数据匹配,如果我们没有找到此菜单的话,则需要在扩展中心中搜索“Fuzzy”进行扩展安装。
图2:个案控制匹配
接着在“个案控制匹配”界面中,设置匹配依据变量为“年龄”和“性别”,匹配容差为“2 0”,2和0之间注意要用空格隔开。前面的2表示,我们可接受病例组和对照组之间的年龄差为2岁,后面的0,因为性别非连续变量,所以输入0。
随后设置组指示符为“高血压”,个案ID为“ID”;最后再填入匹配ID变量名和匹配组变量名,随意命名即可,如命名为“匹配到的ID”和“匹配到的组别”。
图3:个案控制匹配步骤
点击“选项”按钮,进入个案控制选项设置。我们设置抽样选项为不放回抽样,并勾选“最优化执行性能”,同时还需要勾选上“抽取匹配项时随机排列个案顺序”以及设置一个随机数种子,如123456,具体设置如下图。
设置随机种子是为了使得我们的匹配过程是可复现的,防止每次都产生随机结果,无法再次复现匹配过程。
图4:选项设置
点击“附件输出”按钮,设置将匹配结果输出到一个新的数据集中,数据集名称可任意,如“newdata”。
图5:输出到新数据集中
二、匹配结果
最后生成出来的匹配结果的新数据集如下图6所示,共206条匹配数据。新数据集比原数据集多出了两列,分别是“匹配到的组别”和“匹配到的id”。其中ID为92的与ID为91的就是一个病例组和对照组。
图6: 新数据集展示
在个案控制匹配结果表格中,也非常明确地表示出,完全匹配结果有50条,模糊匹配结果有156条。
图7:个案控制匹配结果
按照上述几步我们就完成了个案控制匹配,将病例组和对照组一一匹配在一起,且两者的误差符合我们的实验需求。接下去我们就可以用获得的这些比对数据,采用SPSS中的其他模型方法,进行更深入的探索和研究了。
作者署名:包纸
展开阅读全文
︾
微信公众号
读者也喜欢这些内容:
SPSS计算P值和t值 SPSS计算P值的公式
在数据分析中,不同的统计量会有不同的研究分析功能。比如常见的P值与t值是在检验分析中常用的检验参数。P值用于衡量结果在统计上的显著性,t值则用于检验数据之间是否有关联,两者常配合使用。那么,SPSS计算P值和t值?SPSS计算P值的公式是怎样的?接下来,让我们来详细地学习一下吧。...
阅读全文 >
spss系数表中的t是什么 spss系数表什么指标代表正态影响
在现代数据分析和大数据统计领域,SPSS(Statistical Package for the Social Sciences)是一款广受欢迎的统计分析软件。它因其强大的功能和易用性而被广泛应用于社会科学、市场研究、健康研究等领域。理解SPSS输出的系数表对于数据分析师和研究人员来说至关重要,特别是在解读回归分析结果时。本文将深入探讨“spss系数表中的t是什么 spss系数表什么指标代表正态影响”,并介绍SPSS的主要组件及其在数据分析中的应用。...
阅读全文 >
spss多元线性回归分析操作步骤,spss多元线性回归分析结果解读
spss多元线性回归分析操作步骤,本文会以客流量、销售量与销售额的线性关系演示spss的多元线性回归分析操作步骤,并进行spss多元线性回归分析结果解读。...
阅读全文 >
SPSS双因素方差分析数据录入 SPSS双因素方差分析多重比较
进行双因素方差分析时,数据录入和多重比较是两大难点,用户常常会对数据录入比较困惑,不确定如何分组以及定义变量名称,对于双因素方差分析中的多重比较结果也不能恰当的进行解读,如何进行SPSS双因素方差分析数据录入?SPSS双因素方差分析多重比较如何解读?本文结合实例,向大家做详细的解释。...
阅读全文 >