SPSS决策树分析使用教程

发布时间：2021-11-11 15: 16: 44

SPSS决策树分析是基于树的分类模型，它将个案分为若干组，或根据自变量（预测变量）的值预测因变量（目标变量）的值。它有易于理解、可以应用于小数据集、能够处理多输出的问题、对缺失值不敏感、效率高等优点。下面就讲解下SPSS决策树分析使用教程。

一、数据集准备

本例使用的是信用风险识别数据（来源Kaggle的项目），包括int_rate（贷款利率）、grade（贷款等级）、home（住房性质）、employment（职业）等八个指标，我们将通过SPSS软件使用这八个指标对数据个案进行决策树分析。

二、决策树参数设置

点击SPSS主页顶部菜单栏“分析”-“分类”-“决策树”，即可打开决策树窗口。将flag加载到因变量文本框，将八个指标加载到自变量文本框。生长法选择CHAID（卡方自动交互检测），主要是利用卡方检测判断属性优先级。

点击右侧的“验证”按钮，按照训练样本70%，检测样本30%的分配数据。

为了方便结果的观察，点击右侧“保存”，勾选已保存的变量：终端节点数、预测值、预测概率、样本分配。

考虑到防止节点个案数太少而导致结果不准确，因此通过“条件”按钮，将最小个案树父节点设置为400、子节点设置为200。

三、结果分析

通过以上SPSS操作步骤，我们可以得到决策树分析的结果。

1、模型摘要

主要包括生长法、自变量、结果。在本案例中，经过筛选，最终将纳入的是fico_score指标，这意味着这个变量起到重要作用，实际业务操作过程中，我们应该重点关注这个指标。

2、风险

查看模型效果的重要依据之一，从风险表格中可以看到，训练估算0.061，表示在70%的训练样本中有6.1%的样本被错误归类。检验估算0.069，表示在30%的测试样本中有6.9%的样本被错误归类。

3、分类

查看模型效果的重要依据之一，从风险表格中可以看到，训练集93.9%，表示该模型正确率为93.9%。检验集表示在用训练集训练好的模型去检验测试集的数据，正确率为93.1%。

四、小结

以上是利用SPSS决策树模型对信用风险识别数据进行分析，首先我们从Kaggle的项目获取数据，然后通过SPSS决策树模型对数据进行分析，最后对得到的分析结果进行解析，可以看到整个分析结果还是非常不错，正确率非常高，也同时说明该模型具有一定的可用性。

作者：独行侠

展开阅读全文

︾

标签：SPSS，决策树分析，SPSS决策树分析，SPSS决策树

上一篇：利用SPSS做一致性分析
下一篇：论文写作中如何使用SPSSS进行相关性分析

读者也访问过这里:

SPSS Statistics

强大的数据分析平台

立即购买

微信群

官方微信群立即加群

400-8765-888

kefu@makeding.com

下载试用

最新文章

SPSS回归分析加入中介变量怎么做 SPSS中介效应分析结果解读

相信大家在进行社会科学研究的时候，常常使用到中介效应分析这个方法。中介效应分析能够清晰地揭示自变量对因变量的影响是否通过中介变量进行传递，让变量间的作用路径更明确。接下来我将为大家介绍：SPSS回归分析加入中介变量怎么做，SPSS中介效应分析结果解读的相关内容。

2026-06-02

SPSS随机性检验步骤分析 SPSS随机性检验结果分析

数据序列的随机性是保障后续统计检验有效性的重要前提，如果出现了非随机分布的数据。有可能会导致分析结果出现偏差。在SPSS中，我们通过游程检验可以快速完成数据随机性的判断。接下来我将为大家介绍：SPSS随机性检验步骤分析，SPSS随机性检验结果分析的相关内容。

2026-06-02

SPSS绘制箱线图步骤 SPSS箱线图怎么分析

SPSS作为一款功能比较齐全的数据统计分析软件，其绘图功能是很全面的，除了常规的条形图、饼形图、折线图外，还有在各种调研报告中常用到的箱线图，可能有些读者朋友不知道怎么用SPSS绘制箱线图，下面将以实际数据给大家在SPSS中演示SPSS绘制箱线图步骤，SPSS箱线图怎么分析。

2026-06-02

SPSS分布情况用什么分析 SPSS怎么做分布图

2026-06-02

SPSS频数分析怎么做 SPSS频数分析结果怎样分析

频数分析是我们描述数据分布特征时的一种常用方法，它能够直观呈现分类变量各类别的出现次数与占比情况，帮助我们快速掌握数据的整体分布规律。SPSS中的频数分析功能就十分便捷。接下来我将为大家介绍：SPSS频数分析怎么做，SPSS频数分析结果怎样分析的相关内容。

2026-06-02

SPSS中如何计算中位数 SPSS中如何计算残差

如果我们想看看数据的集中分布情况，一般都会看一下均值，因为它可以观察到数值的平均大小。不过均值容易受到极端值的影响，比如有几个数值很大，就会让平均的数值很高。对于这种情况，可以改用中位数、众数来看数据分布，SPSS可以很快速地计算出这些统计量。接下来，我们会介绍SPSS中如何计算中位数，SPSS中如何计算残差的相关内容。

2026-06-02

微信公众号

欢迎加入 SPSS 产品的大家庭，立即扫码关注，获取更多软件动态和资源福利。

读者也喜欢这些内容: