发布时间:2021-05-21 11: 29: 09
我们在实际的工作生活中,往往结果都不是由单个因素所决定的,而是由多个复杂的指标共同产生。如衡量某个人是否健康时,我们会根据他的年龄、性别、过往病史等多个因素同时进行评价。
接下来我们就需要使用到IBM SPSS Statistics,来绘制数据的ROC曲线,进而分析数据结果的准确性。
一、分析预测
首先准备好我们要使用的数据,如图1,这是一组关于癌症患者与非癌症人员的各项指标数据,我们需要通过分析,判断这些指标,是否能初步判断人员患上癌症的概率。
第一步:点击“分析”菜单中的“回归”,选择“二元Logistic”,通过二元Logistic回归模型,用性别、年龄、BMI、是否吸烟和过往COPD病史,来计算人员患癌症的概率。
在回归设置界面中,设置因变量为cancer,在块中加入除了cancer以外的其他指标,最后在方法中选择“向前:LR”方法,具体设置如图3。
又因为在本组数据中,COPD是多分类变量,而不是简单的二分类,我们将COPD的程度,使用0到4进行表示,分别表示无、轻度、中度、重度。
因此我们需要点击上图3右侧的“分类”,自定义分类变量。在分类协变量中选择COPD,然后选择参考类别为“第一个”,点击“继续”。
最后,点击“保存”按钮(非确定按钮),然后勾选上“预测值”中的“概率”,如图5,此时SPSS就会帮我们生成每条记录的癌症预测概率值。
具体的预测值如图6,PRE_1就是SPSS自动生成的预测概率值。
二、绘制ROC曲线
有了预测概率结果后,我们就可以利用ROC曲线,来分析这个预测结果的准确性。点击“分析”菜单,选择“分类”,点击“ROC曲线”,如图7。
检验变量选择SPSS生成的“PRE_1”,下方的状态变量选择“cancer”,然后状态变量值设置为1,完成上述设置后点击“确定”,即可生成关于这2个预测和实际指标之间的ROC曲线。
最后生成的结果见下图9,我们可通过观察ROC曲线下的面积,来判断预测准确性。
以上就是关于使用SPSS进行多指标下的ROC曲线分析的全部教程,我们首先通过回归模型生成预测值,再将预测值和真实值之间进行ROC曲线分析,得出我们想要的结论。如果大家对IBM SPSS Statistics软件有兴趣,欢迎进入IBM SPSS Statistics中文网站下载试用。
作者署名:包纸
展开阅读全文
︾
读者也喜欢这些内容:
spss多元logistic回归分析步骤 spss多元logistic回归结果怎么看
在这个数据驱动的时代,多元Logistic回归分析已经成为研究者常用的一种分析工具。它用于研究两个或多个预测变量和一个二元结果变量之间的关系。使用SPSS进行这种分析既方便又高效。本文将主要探讨spss多元logistic回归分析步骤以及spss多元logistic回归结果怎么看。...
阅读全文 >
spss拟合曲线怎么看函数 spss拟合曲线怎么做
在数据分析领域中,SPSS是一款广泛使用的统计分析软件,它提供了丰富的功能和工具,包括拟合曲线分析。拟合曲线分析是一种用于描述变量之间关系的方法,它可以帮助我们了解数据的趋势、预测未来值以及评估模型的拟合程度。在SPSS中,我们可以通过拟合曲线函数和相应的统计指标来分析和解释数据。本文将介绍spss拟合曲线怎么看函数,spss拟合曲线怎么做的内容。...
阅读全文 >
spss多因素相关性分析回归系数 spss多因素相关性分析怎么计算
随着大数据时代的到来,数据分析变得愈发重要。在数据分析领域,SPSS是一款广受欢迎的统计分析软件。本文将重点介绍如何在SPSS中进行多因素相关性分析回归系数的计算,以及多因素相关性分析的具体计算方法。本文将介绍spss多因素相关性分析回归系数,spss多因素相关性分析怎么计算的相关内容。...
阅读全文 >
如何用spss分析两组变量相关性 spss分析两个变量是否有显著差异
在社会科学研究中,分析两组变量之间的相关性和显著差异是非常重要的一步。SPSS软件作为社会科学研究中最常用的数据分析软件之一,具有强大的统计分析功能,能够帮助研究者快速、准确地分析两个变量之间的相关性和显著差异。本文将介绍如何使用SPSS软件分析两组变量的相关性和显著差异。...
阅读全文 >