发布时间:2021-06-09 16: 22: 53
哑变量,是一个人为设定的变量,通常取值为0到N,以职业分类来说,0代表学生,1代表工人,2代表老师等等,哑变量就是通过这种取值方式,以此来反映某个变量的不同属性。
哑变量的设置在各个回归模型中都非常重要与常见,今天我们就一起来学习下,如何在SPSS的逻辑回归模型中,设置哑变量。
一、哑变量参数解析
我们想要研究不同的种族之间对某种疾病的患病率是否有不同的差异,下面我们获取了三个不同的种族人群的身体健康数据,其中0表示其他种族;1代表美国黑人;2代表美国白人;3代表印第安人。
图1:演示数据
由于种族属于无序多分类变量,因此我们需要将种族转化为哑变量后,才能进行逻辑回归计算,点击【分析】--【回归】--【二元Logistic】。
图2:逻辑回归分析
我们先把逻辑回归的因变量和块填入相对应的内容,然后就可以点击“分类”按钮,为多分类的自变量“种族”设置哑变量。
图3:设置因变量和块
随后在分类协变量中填入“种族”项,参考类别根据自身数据进行填写,在本演示数据中,由于0表示其他种族,是参照组,因此参考类别我们选择“第一个”,如果参照组是最后一个,则参考类别就需要选择“最后一个”。
图4:参考类别
除参考类别外,我们还需要设置对比方法,可供选择的方法有7种,分别是“指示符”、“简单”、“差异”、“赫尔默特”、“重复”、“多项式”和“偏差”,它们的详细作用如下:
1、“指示符”和“简单”对比方法:用于将某一分类作为参照,其他各个分类分别与参照分类做对比。
2、“差异”对比方法:某个分类与其前面的分类平均值做比较;“赫尔默特”对比方法则是与其后面的分类平均值做比较,它们都常用于有序分类变量。
3、“重复”对比方法:即该分类变量的各个分类,均与前面相邻的一个分类比较,此时前一分类作为参照。
4、“多项式”对比方法:主要是分类类型不同,它只能用于数值型的分类变量。
5、“偏差”对比方法:除参照外,其余的每个分类都与总体水平做比较。
图5:对比方法
二、结论说明
由于本文的自变量种族是无序多分类,因此我们采用默认的“指示符”方法,点击确定后生成的逻辑回归结果如下图6。从结果中我们可以看到SPSS成功将种族转化为三个哑变量,分别是种族(1)、种族(2)和种族(3)。
图6:逻辑回归结果
经过上面的学习,我们就初步掌握了一种设置哑变量的方法,当然在SPSS中,还可以通过程序去生成更复杂场景中的哑变量。SPSS的功能绝不止于此,更多高大上的功能教程尽在IBM SPSS Statistic中文网站上。
作者署名:包纸
展开阅读全文
︾
读者也喜欢这些内容:
SPSS应用多元逻辑回归解决无序多分类问题
什么是无序多分类?举一个例子,当我们要研究基因突变与疾病之间的关系时,因变量就是疾病的各种分类,如乳癌、胃癌、鳞癌等多种,此时因变量不是简单的患病和不患病,且他们之间是无序的,这就是无序多分类。...
阅读全文 >
spss两因素方差分析案例 spss两因素方差分析步骤及结果分析
方差分析作为一种非常有效的分析方法,用于分析两组或两组以上的数据差异。在实际的数据分析过程中,一个因素对因变量的影响脚下,分析结果无法看出明显差异,这时往往会考察两个甚至多个因素对因变量的影响,就用到两因素方差分析方法。两因素方差分析是指对有两个自变量,一个因变量的实验数据进行分析处理,通常是通过分析结果来判断实验处理对实验结果有没有影响。那么,如何使用spss进行两因素方差分析?这里介绍一下spss两因素方差分析案例,spss两因素方差分析步骤及结果分析。...
阅读全文 >
IBM SPSS Statistics常用图表附例演示讲解
SPSS的图表功能非常强大,囊括了直方图、散点图、饼图、折线图、茎叶图等常用的图表,不仅可用于数据的预先分析,而且其图表的格式美观,更可直接在展示报告中使用,减少后续作图的时间。...
阅读全文 >