归法作自变量选元。解:后退法SPSS输出结果:逐步回归法二者结果相同,回归方程为:y=865.929—0.601x1-0.361x2+0.639x5但是回归系数的解释不合理。5.10表5.5的数据是1968-1983年期间与电话线制造有关的数据,各变量的含义如下:x1——年份;x2——国民生产总值(10亿美元);x3——新房动工数(单位:1000);x4——失业率(%);x5——滞后6个月的最惠利率;x6——用户用线增量(%);y——年电话销量(百万尺双线)。(1)建立y对x2~x6的线性回归方程。SPSS输出结果如下:回归方程为:=5922.827+4.864+2.374-817.901+14.539-846.867其中x2、x5的系数未通过检验。(2)用后退法选择自变量。后退法剔除P值最大的剔除x5,模型的参数均通过显著性检验。(显著性水平α=0.05),得回归方程为:=6007.320+5.068+2.308-824.261-862.699模型表明年电话销量(y)与国民生产总值、新房动工数、失业率、用户用线增量有显著的线性关系。(3)用逐步回归法选择自变量逐步回归法引入x3,x5,x4进入回归模型,没有剔除变量,保留x3,x5,x4作为最终模型。回归方程为:y=1412.807+3.440x3—415.136x4+348.729x5模型表明年电话销量(y)与新房动工费、失业率、滞后6个月的最惠利率有显著的线性关系。(4)根据以上计算结果分析后退法和逐步回归法的差异答:两个方法得到的最终模型是不同的,后退法首先剔除了x5,而逐步回归法在第二步引入了x5,说明两种方法对自变量选取的方法是不同的,这与自变量之间的相关性有关。相比之下,后退法首先做全模型的回归,每个自变量都有机会展示自己的作用,所得结果更值得信服。从本例看,x5是滞后6个月的最惠利率,对因变量的影响似乎不大。