banner

小白学统计(75)范例分析:多元线性回归分析

作者: afenxi来源: afenxi时间:2017-03-12 18:05:190

摘要:范例分析

基础回顾

简单线性和多元线性回归理论基础请回顾:

相关与回归分析基础; 一元(简单线性)相关分析与回归分析; 回归参数的区间估计; 一元(简单线性)回归方程的假设检验; 范例分析:一元(简单线性)相关与回归分析; 多元线性回归分析;

线性回归的步骤不论是一元还是多元相同,步骤如下:

1、散点图判断变量关系(简单线性); 2、求相关系数及线性验证; 3、求回归系数,建立回归方程; 4、回归方程检验; 5、参数的区间估计; 6、预测;

范例分析

王某等人承包了某快递公司在某地的快递业务,一段时间后发现:有时候承接工作量大,完不成快递任务;有时候工作量不足,员工等待。为了制定最佳的工作计划表,王某希望估计快递员每天的工作时间(工资计件,没有偷懒现象),以便决定每天承接的快递数量。王某分析,快递员每天工作的时间与送货距离和送货次数相关。为此,他收集了由10项送货任务组成的简单随机样本数据,并根据这些数据建立二元线性回归方程。数据如下表:

小白学统计(75)范例分析:多元线性回归分析-数据分析网

项目分析

研究的目的是预测快递员运送任务所需要的时间,所以设时间为因变量;距离与次数为自变量。本题直接使用Excel计算结果。

解:1、相关次数;由于是二元回归分析,所以不做散点图,直接用回归系数判别因变量(时间)与自变量总体(距离与次数)之间的相关关系。Excel计算结果:

小白学统计(75)范例分析:多元线性回归分析-数据分析网 复相关系数R为0.9383,说明因变量时间与作为一个整体的所有自变量(距离和次数)高度线性相关。

2、回归系数及回归方程

小白学统计(75)范例分析:多元线性回归分析-数据分析网 通过Excel计算结果,可以得到回归系数及回归方程:

小白学统计(75)范例分析:多元线性回归分析-数据分析网 意义:回归系数0.042表示在固定次数的条件下,送货距离每增加1公里,行驶的时间平均增加0.042小时;同理,回归系数0.573表示在送货距离固定的条件下,送货次数每增加1次,送货的时间平均增加0.573小时。本例中,截距-0.01没有实际意义,只起调节数值的作用。

3、回归方程的检验

回归方程的检验有三种方法(回归方程显著性检验,回归系数显著性检验和相关系数显著性检验),效果相同,选择其一检验即可。Excel给出的是回归方程的显著性检验结果:

小白学统计(75)范例分析:多元线性回归分析-数据分析网 Significance F=0.000591表示统计量F=25.77422的概率值,通过与显著水平(设定为0.05)的比较,表示F值落在拒绝域,所以结论与上相同,即线性回归方程式显著的。

4、区间估计

小白学统计(75)范例分析:多元线性回归分析-数据分析网 从上表可知,在95%置信度条件下,回归系数b1的置信区间为(0.025,0.059),b2的置信区间为(0.069,1.077)。

5、预测

某个快递员某天的任务是快递3件货,最优送货路线总长为120公里,预测送货时间,并得到95%的时间区间。

通过回归方程可得预测的送货时间为6.749小时:

小白学统计(75)范例分析:多元线性回归分析-数据分析网 95%置信度下,送货时间的置信区间为:

小白学统计(75)范例分析:多元线性回归分析-数据分析网 Excei计算结果中有Se的值,但是没有包含t统计量:

小白学统计(75)范例分析:多元线性回归分析-数据分析网 t统计量值用公式:=T.INV.2T(0.05,7)得到2.365,所以该题中送货时间区间为:

(6.749-2.365*0.639,6.749+2.365*0.639)

(5.24,8.26)

所以该条件下送货时间区间为5.24小时~8.26小时。

banner
看过还想看
可能还想看
热点推荐

永洪科技
致力于打造全球领先的数据技术厂商

申请试用
Copyright © 2012-2024开发者:北京永洪商智科技有限公司版本:V10.2
京ICP备12050607号-1京公网安备110110802011451号 隐私政策应用权限