税的回归模型为: Y= aX 1+ bX 2+ cX 3+ dX 4+ eX 5+ε根据计算机的回归计算结果,代入系数得: Y= 0.292 X 1- 0.012 X 2+ 0.18 8X 3+ 104.62 5X 4- 3784.564 X 5+ 3572.406 显然,从回归统计结果上看,这些自变量的组合对欠税预测值 Y的影响并不显著。(b )利用后向消元法,逐个消去 P 值小于 0.5 的自变量后重新回归计算,得新的比较好的回归模型为: Y:欠税( $) X 1:税前总收入($) X 4:细目单 C部分扣除百分比(%) X 5:家庭办公室指标 Y= aX 1+ dX 4+ eX 5+ε根据计算机的回归计算结果,代入系数得: Y= 0.293X 1+ 94.564X 4- 3387.18 X 5+ 3510.828 (C) (1)为了检验(B) 的模型的异方差性,观察计算机输出的残差图: 由于残差分布并没有显著地随着自变量的增大而增大,因此认为(b) 中构造的模型没有呈现异方差性的证据。(2)绘制残差的直方图,观察得基本呈现钟状,因此认为满足正态性假设。(3)模型 Y= aX 1+ dX 4+ eX 5+ε回归系数的 95% 的置信区间为: a£[ 0.233398 , 0.352997 ]d£[ 17.78466059 , 171.3444212 ] e£[ -6713.817765 , -60.53712371 ] (D)将题设数据代入模型,则得对该纳税人欠税额的预测值: ?= 0.293X 1+ 94.564X 4- 3387.18 X 5+ 3510.828 =0.293 X 130000 + 94.564 X 25– 3387.18 X1+ 3510.828 = 38090 + 2364.1 - 3387.18 + 3510.828 =40577.75 ($)