
发布时间:2022/05/11 14:12:11
品牌型号:联想GeekPro 2020
系统: Windows 10 64位专业版
软件版本: IBM SPSS Statistics
回归分析spss步骤,本文会以研究客流量对销售额影响的问题为例具体演示spss操作步骤,同时,也会具体进行回归分析spss结果解读,并进一步讲解回归分析的其他类型,以帮助加深对回归分析的认识。
一、回归分析spss步骤
本文使用的是一组客流量和销售额的数据,用于构建客流量与销售额的线性回归分析,以研究客流量的变化对销售额的影响。
本例数据仅包含一个自变量与一个因变量,因此可构建简单的一元线性回归方程,依次单击spss的分析-回归-线性选项,进行线性回归分析。
第一步选择变量,分别将销售额、客流量添加到因变量、自变量选项中,以研究自变量客流量对因变量销售额的影响。
第二步,指定线性回归进入的方式,包括输入(自变量全部放进回归模型)、步进(按自变量贡献度、剔除与否等决定自变量是否放入回归模型)、除去(建立自变量模型后,根据条件剔除自变量)、后退(与除去相似,但后退采用逐次剔除自变量的方法)与前进(逐次添加自变量)五种方法。
由于本例分析的是简单的一元线性回归方程,可以按照默认选择“输入”。
第三步设置统计量,分别指定以下统计量:
1.回归系数,进行线性回归方程系数的计算,勾选“估算值”,可获得参数估计量。
2.模型拟合,了解模型的拟合度以及预测的准确度,可同时勾选“描述”统计数值,查看平均值、方差等。
3.残差,勾选“德宾-沃森(D-W)”检验,以了解残差是否存在自相关,检验模型是否具有统计学意义。
第四步,设置参考图表,比如标准化残差图中的“直方图”、“正态概览图”,用于辅助分析残差的自相关性、正态性,检验模型是否具有统计学意义。
第五步,如果在回归方程中需要设置常数项,需在“选项”设置中勾选“在方程中包括常量”。
二、回归分析spss结果解读
完成以上spss的设置后,即可进行运算获取结果,我们需要从模型拟合度、残差是否具有自相关来检验回归方程是否具有统计学意义,以及判断其预测的准确度。
a.模型拟合效果
模型摘要,求得的回归方程R方为0.839,R方数值越接近于1,说明方程的拟合优度越好,一般需要大于0.6。本例回归方程R方为0.839,说明本例分析所得的回归方程拟合效果良好。
ANOVA分析,回归模型的显著性值为0.00,小于0.05的置信空间,即说明有95%的概率拒绝原假设(原假设为客流量与销售额之间无回归关系),也就是说,客流量与销售额之间存在着显著的回归关系。
b.残差相关性分析
通过回归方程R方、ANOVA分析,可得知回归方程具有统计学意义,但模型是否具有准确的预测性,还需要通过残差相关性分析进一步确认。如果残差存在自相关的话,模型的预测准确度就不高。
查看模型摘要中的德宾-沃森值为2.060,查阅德宾-沃森表得到,样本量n=198(采用200样本量D-W值),控制变量数量k=1,其下临界值LD=1.664、上临界值UD=1.684。
而本例的德宾-沃森值为2.060,根据判定规则,本例回归方程符合“如果UD 残差直方图,可查看到残差的分布趋近于正态曲线的分布。 再结合正态P-P图分析,数值的分布近似与直线,说明残差的正态性良好。 在满足残差无自相关性、服从正态分布的前提下,说明该回归方程具有良好的预测性。 c.构建模型表达式 在判定回归模型统计学意义、残差无自相关性、残差满足正态分布的前提下,可求得回归方程的回归系数,从而构建回归方程。 系数分析表,客流量回归系数的显著性数值为0.00<0.05,有95%概率拒绝原假设;而常量系数的显著性为0.4,无法拒绝原假设。说明自变量回归系数具有统计学意义,而常量系数不具有统计学意义,可构建y=12.821x的一元线性回归方程。 三、回归分析有哪些类型 在上文的示例中,我们演示了简单的一元线性回归分析,那么,除此以外,回归分析还包含哪些类型呢? 回归分析包含了线性回归与非线性回归分析,其中: 1.线性回归分析,可分为一元线性回归分析(一个自变量X与因变量Y的关系)与多元线性回归分析(多个自变量与因变量Y的关系) 2.非线性回归分析,也称为曲线回归,根据因变量是定量变量或定性变量可分为Logistic回归、有序回归、Probit回归等。非线性回归分析由于模型未知,其分析情况会更为复杂,常需要借助图表归纳,或简化为多元线性回归来分析。 四、小结 以上就是回归分析spss步骤,回归分析spss结果解读的相关内容。本文重点演示了spss中的一元线性回归分析的步骤,其中会涉及到回归方程的共线性、残差相关性、残差正态性、方程拟合优度等指标的使用。 作者:泽洋
读者也喜欢这些内容:
SPSS变量名称怎么改 SPSS变量名称非法字符怎么办
在SPSS中数据资料的变量名称是需要经过数据编码之后,才能在数据视图中正常显示的,如果没有进行变量名称的数据编码,那么在数据视图中会默认显示VAR000这样的字符串。所以接下来本文就和大家详细讲解一下,SPSS变量名称怎么改,以及SPSS变量名称非法字符怎么办的相关内容。...
阅读全文 >
SPSS数据编码是什么意思 SPSS数据编码怎么弄
在使用SPSS进行数据统计的时候,首先需要做的是对原有的数据进行编码处理。因为SPSS对于汉字是不识别的,即使识别了对后期的分析结果也是会有影响的,所以需要将数据中的变量进行编码处理。接下来本文就详细和大家讲解一下,SPSS数据编码是什么意思,以及SPSS数据编码怎么弄的相关内容。...
阅读全文 >
spss中t值和p值是什么意思 spss中t值和p值的关系
在统计分析过程中,常常会遇到这样的情况:检验两个相关的样本是否来自具有相同均值的总体,就会用到t检验。t检验(Student's t test),主要用于样本含量较小(例如n < 30),总体标准差σ未知的正态分布, t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。利用IBM SPSS Statistics统计分析软件进行t检验可以避免繁杂的统计学计算,快速给出结果,供用户分析。SPSS中t值和p值是什么意思,SPSS中t值和p值的关系是什么,本文结合实例,向大家做简单的介绍。...
阅读全文 >
spss pearson相关性分析步骤 spss pearson相关性分析结果怎么看
Pearson(皮尔逊)相关性指的是联合分布服从二维正态分布的随机变量X,Y之间的简单线性相关关系,X,Y之间的相关关系由简单相关系数r表示。利用IBM SPSS Statistics可以非常快速地完成两个随机变量X,Y间的Pearson(皮尔逊)相关性分析,SPSS Pearson相关性分析步骤是什么,SPSS Pearson相关性分析结果怎么看,本文结合实例,向大家做简单的介绍。...
阅读全文 >