发布时间:2021-06-09 16: 22: 53
哑变量,是一个人为设定的变量,通常取值为0到N,以职业分类来说,0代表学生,1代表工人,2代表老师等等,哑变量就是通过这种取值方式,以此来反映某个变量的不同属性。
哑变量的设置在各个回归模型中都非常重要与常见,今天我们就一起来学习下,如何在SPSS的逻辑回归模型中,设置哑变量。
一、哑变量参数解析
我们想要研究不同的种族之间对某种疾病的患病率是否有不同的差异,下面我们获取了三个不同的种族人群的身体健康数据,其中0表示其他种族;1代表美国黑人;2代表美国白人;3代表印第安人。

图1:演示数据
由于种族属于无序多分类变量,因此我们需要将种族转化为哑变量后,才能进行逻辑回归计算,点击【分析】--【回归】--【二元Logistic】。

图2:逻辑回归分析
我们先把逻辑回归的因变量和块填入相对应的内容,然后就可以点击“分类”按钮,为多分类的自变量“种族”设置哑变量。

图3:设置因变量和块
随后在分类协变量中填入“种族”项,参考类别根据自身数据进行填写,在本演示数据中,由于0表示其他种族,是参照组,因此参考类别我们选择“第一个”,如果参照组是最后一个,则参考类别就需要选择“最后一个”。

图4:参考类别
除参考类别外,我们还需要设置对比方法,可供选择的方法有7种,分别是“指示符”、“简单”、“差异”、“赫尔默特”、“重复”、“多项式”和“偏差”,它们的详细作用如下:
1、“指示符”和“简单”对比方法:用于将某一分类作为参照,其他各个分类分别与参照分类做对比。
2、“差异”对比方法:某个分类与其前面的分类平均值做比较;“赫尔默特”对比方法则是与其后面的分类平均值做比较,它们都常用于有序分类变量。
3、“重复”对比方法:即该分类变量的各个分类,均与前面相邻的一个分类比较,此时前一分类作为参照。
4、“多项式”对比方法:主要是分类类型不同,它只能用于数值型的分类变量。
5、“偏差”对比方法:除参照外,其余的每个分类都与总体水平做比较。

图5:对比方法
二、结论说明
由于本文的自变量种族是无序多分类,因此我们采用默认的“指示符”方法,点击确定后生成的逻辑回归结果如下图6。从结果中我们可以看到SPSS成功将种族转化为三个哑变量,分别是种族(1)、种族(2)和种族(3)。

图6:逻辑回归结果
经过上面的学习,我们就初步掌握了一种设置哑变量的方法,当然在SPSS中,还可以通过程序去生成更复杂场景中的哑变量。SPSS的功能绝不止于此,更多高大上的功能教程尽在IBM SPSS Statistic中文网站上。
作者署名:包纸
展开阅读全文
︾
微信公众号
读者也喜欢这些内容:
SPSS如何把连续变量变成二分类 SPSS将连续变量重新编码为分类变量的方法
我们在使用SPSS进行数据分析时,都会导入大量的原始文件,只有原始文件的基数足够大,我们才能获得较为客观的分析结果。但是众多原始数据中,总会出现一些连续变量,它们会在一定程度上降低数据的参考价值。针对这种情况,我们就需要考虑如何将这些连续变量转换为对我们有利的分类变量。今天我就以SPSS如何把连续变量变成二分类,SPSS将连续变量重新编码为分类变量的方法这两个问题为例,来向大家讲解一下连续变量的转化技巧。...
阅读全文 >
SPSS逻辑回归是什么 SPSS逻辑回归二分类变量设置方法
当进行SPSS数据分析的时候,如果遇到的是二分类的变量数据,研究者通常会使用逻辑回归的分析方法,这可以适用于分类变量与多个自变量之间的关系分析。本文以SPSS逻辑回归是什么,SPSS逻辑回归二分类变量设置方法这两个问题为例,给大家介绍一下SPSS逻辑回归的相关知识。...
阅读全文 >
SPSS数据转置什么意思 SPSS数据转置怎么操作
在进行SPSS数据计算和分析之前,研究者通常运用SPSS数据转置的方法,借此对繁杂数据进行行列互换,适用于EXCEL、CSV、文本数据、SAS等各类形式的数据文本,便于研究者清晰全面地了解数据信息。本文以SPSS数据转置什么意思,SPSS数据转置怎么操作这两个问题为例,带大家了解一下SPSS数据转置的相关知识。...
阅读全文 >
SPSS如何做多重共线检验 SPSS多重共线性怎么解决
多重共线性问题是进行回归模型构建时会出现的一种问题,它往往会导致参数估计不准确和不稳定,进而使模型的预测精度降低。下面就给大家介绍一下SPSS如何做多重共线检验 ,SPSS多重共线性怎么解决的相关内容。...
阅读全文 >