第二章练习题及参考解答
2.1 为研究中国的货币供应量(以货币与准货币M2表示)与国内生产总值(GDP)的相互依存关系,分析表中1990年—2007年中国货币供应量(M2)和国内生产总值(GDP)的有关数据:
表2.9 1990年—2007年中国货币供应量和国内生产总值(单位:亿元) 年份 货币供应量M2 国内生产总值GDP 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 15293.4 19349.9 25402.2 34879.8 46923.5 60750.5 76094.9 90995.3 104498.5 1197.9 134610.4 158301.9 185007.0 221222.8 254107.0 298755.7 345603.6 403442.2 18718.3 21826.2 26937.3 35260.0 48108.5 59810.5 70142.5 78060.8 83024.3 88479.2 98000.5 108068.2 119095.7 135174.0 159586.7 184088.6 213131.7 251483.2 资料来源:中国统计年鉴2008,中国统计出版社
对货币供应量与国内生产总值作相关分析,并说明相关分析结果的经济意义。
练习题2.1 参考解答:
计算中国货币供应量(以货币与准货币M2表示)与国内生产总值(GDP)的相关系数为:
计算方法: rXYnXiYiXiYinX(Xi)2iii22nYi(Yi)222 或 rX,Y计算结果:
(XX)(YY)(XX)(YY)ii
M2
M2
1
GDP
0.99261486
GDP
0.99261486 1
经济意义: 这说明中国货币供应量与国内生产总值(GDP)的线性相关系数为0.9926,线性相关程度相当高。
2.2 为研究美国软饮料公司的广告费用X与销售数量Y的关系,分析七种主要品牌软饮料公司的有关数据
表2.10 美国软饮料公司广告费用与销售数量 品牌名称 Coca-Cola Classic Pepsi-Cola Diet-Coke Sprite Dr.Pepper Moutain Dew 7-Up 广告费用X(百万美元) 131.3 92.4 60.4 55.7 40.2 29.0 11.6 销售数量Y(百万箱) 1929.2 1384.6 811.4 541.5 546.9 535.6 219.5 资料来源:(美) Anderson D R等. 商务与经济统计.机械工业出版社.1998. 405
绘制美国软饮料公司广告费用与销售数量的相关图, 并计算相关系数,分析其相关程度。能否在此基础上建立回归模型作回归分析?
练习题2.2参考解答
美国软饮料公司的广告费用X与销售数量Y的散点图为
说明美国软饮料公司的广告费用X与销售数量Y正线性相关。 相关系数为: x x 1 y 0.978148015384 y 0.978148015384 1 说明美国软饮料公司的广告费用X与销售数量Y的正相关程度相当高。 若以销售数量Y为被解释变量,以广告费用X为解释变量,可建立线性回归模型 Yi12Xiui 利用EViews估计其参数结果为
经t检验表明, 广告费用X对美国软饮料公司的销售数量Y确有显著影响。回归结果表明,广告费用X每增加1百万美元, 平均说来软饮料公司的销售数量将增加14.40359(百万箱)。
2.3 为了研究深圳市地方预算内财政收入与国内生产总值的关系,得到以下数据:
表2.11 深圳市地方预算内财政收入与国内生产总值 年 份 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 地方预算内财政收入Y (亿元) 21.70 27.33 42.96 67.25 74.40. 88.02 131.75 142.06 1.39 184.21 221.92 262.49 265.93 290.84 321.47 421.38 500.88 本市生产总值(GDP)X (亿元) 171.67 236.66 317.32 453.14 634.67 842.48 1048.44 1297.42 1534.73 1804.02 2187.45 2482.49 2969.52 3585.72 4282.14 4950.91 5813.56 2007 658.06 6801.57 资料来源: 深圳市统计年鉴2008. 中国统计出版社
(1)建立深圳地方预算内财政收入对本市生产总值GDP的回归模型; (2)估计所建立模型的参数,解释斜率系数的经济意义; (3)对回归结果进行检验。
(4)若是2008年深圳市的本市生产总值为8000亿元,试对 2008年深圳市的财政收入作出点预测和区间预测 (0.05)。
练习题2.3参考解答: 1、 建立深圳地方预算内财政收入对GDP的回归模型,建立EViews文件,利用地
方预算内财政收入(Y)和GDP的数据表,作散点图
可看出地方预算内财政收入(Y)和GDP的关系近似直线关系,可建立线性回归模型: Yt12GDPtut 利用EViews估计其参数结果为
ˆ20.46110.0850GDP 即 Ytt (9.8674) (0.0033)
t=(2.0736) (26.1038) R2=0.9771 F=681.40
经检验说明,深圳市的GDP对地方财政收入确有显著影响。R0.9771,说明GDP解释了地方财政收入变动的近98%,模型拟合程度较好。
模型说明当GDP 每增长1亿元时,平均说来地方财政收入将增长0.0850亿元。 当2008年GDP 为7500亿元时,地方财政收入的点预测值为:
2ˆ20.46110.08508000700.4611(亿元) Y2008区间预测:
为了作区间预测,取0.05,Yf平均值置信度95%的预测区间为:
ˆ Yf21(XfX)ˆt2 2nxi利用EViews由GDP数据的统计量得到 x2031.266 X2300.773 n=18 则有
x2i2x(n1)2031.2662(181)70142706.5669
22 (Xf1X)(80002300.773)32481188.3976
ˆ700.4611,t0.025(18-2)=2.120平均值置信度95%的预测区间为: 取0.05,Y2008 Yf^t2^21(XfX) 2nxiGDP20088000时 700.46112.12027.2602 700.461141.6191(亿元)
132481188.3976 1870142706.5669Yf个别值置信度95%的预测区间为:
Yf^21(XfX)t21 2nxi^即 700.46112.12027.26021 700.461171.2181(亿元)
132481188.3976 1870142706.56692.4 为研究中国改革开放以来国民总收入与最终消费的关系,搜集到以下数据:
表2.12 中国国民总收入与最终消费 (单位:亿元)
年份 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 19 1990 1991 1992 国民总收入X 最终消费 Y 年份 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 国民总收入 X 最终消费 Y 35.217 4062.579 4545.624 48.461 5330.451 5985.552 7243.752 9040.737 10274.38 12050.62 15036.82 17000.92 18718.32 21826.2 26937.28 2239.1 2633.7 3007.9 3361.5 3714.8 4126.4 4846.3 5986.3 6821.8 7804.6 9839.5 111.2 12090.5 14091.9 17203.3 35260.02 48108.46 59810.53 70142.49 78060.83 83024.28 88479.15 98000.45 108068.2 119095.7 135174 159586.7 184088.6 213131.7 251483.2 219.9 29242.2 36748.2 43919.5 48140.6 51588.2 55636.9 61516 66878.3 71691.2 77449.5 87032.9 97822.7 110595.3 128444.6 资料来源:中国统计年鉴2008. 中国统计出版社,2008.
(1) 以分析国民总收入对消费的推动作用为目的,建立线性回归方程,并估计其参数。
ˆ和可决系数R。 (2) 计算回归估计的标准误差(3) 对回归系数进行显著性水平为5%的显著性检验。
(4) 如果2008年全年国民总收入为300670亿元,比上年增长9.0%,预测可能达到的最终 消费水平,并对最终消费的均值给出置信度为95%的预测区间。
练习题2.4参考解答:
(1)以最终消费为被解释变量Y,以国民总收入为解释变量X,建立线性回归模型: Yi12Xiui 利用EViews估计参数并检验
2
回归分析结果为:
ˆ3044.3430.530112X Ytt(5.4040) (0.00967) t= (3.3999) (54.8208)
R0.9908 n=30
2ˆ(2)回归估计的标准误差即估计的随机扰动项的标准误差e2t由EViews估(n2),
ˆ3580.903, 可决系数为0.9908。 计参数和检验结果得(3)由t分布表可查得t0.025(302)2.048,由于t254.8208t0.025(28)2.048 ,或由P值=0.000可以看出, 对回归系数进行显著性水平为5%的显著性检验表明, 国民总收入对
最终消费有显著影响。
(4)如果2008年全年国民总收入为300670亿元,预测可能达到的最终消费水平为:
ˆ3044.3430.530112300670162433.1180(亿元) Y2008对最终消费的均值置信度为95%的预测区间为: Yf^t2^21(XfX) 2nxi由Eviews计算国民总收入X变量样本数据的统计量得: x68765.51 X63270.07 n=30 则有
x2i2x(n1)68765.512(301)137132165601.2429
22 (XfX)(30067063270.07)563587267.0049
ˆ162433.1180,t0.025(30-2)=2.048,已知 ˆ3580.903,平均值置信取0.05,Y2008度95%的预测区间为:
Yf^21(XfX) 2nxit2^ =162433.11802.0483580.9031563587267.0049 30137132165601.2429 =162433.11884888.4110(亿元)
2.5 美国各航空公司业绩的统计数据公布在《华尔街日报1999年年鉴》(The Wall Street Journal Almanac 1999)上。航班正点到达的比率和每10万名乘客投诉的次数的数据如下1。 1资料来源:(美)David R.Anderson
等《商务与经济统计》,第405页,机械工业出版社
表2.13 美国各航空公司业绩的统计数据
航空公司名称 西南(Southwest)航空公司 (Continental)航空公司 西北(Northwest)航空公司 美国(US Airways)航空公司 联合(United)航空公司 美洲(American)航空公司 德尔塔(Delta)航空公司 美国西部(Americawest)航空公司 环球(TWA)航空公司 航班正点率(%) 81.8 76.6 76.6 75.7 73.8 72.2 71.2 70.8 68.5 投诉率(次/10万名乘客) 0.21 0.58 0.85 0.68 0.74 0.93 0.72 1.22 1.25 资料来源:(美) Anderson D R等.商务与经济统计. 机械工业出版社.1998,405.
(1)画出这些数据的散点图
(2)根据散点图。表明二变量之间存在什么关系?
(3)估计描述投诉率如何依赖航班按时到达正点率的回归方程。 (4)对估计的回归方程斜率的意义作出解释。
(5)如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数是多少?
练习题2.5参考解答:
美国各航空公司航班正点到达比率X和每10万名乘客投诉次数Y的散点图为
由图形看出航班正点到达比率和每10万名乘客投诉次数呈现负相关关系, 利用EViews计算线性相关系数为: X Y X Y 1 -0.882607 -0.882607
建立描述投诉率(Y)依赖航班按时到达正点率(X)的回归方程: Yi12Xiui 利用EViews估计其参数结果为
ˆ6.0178320.070414X 即 Yii (1.017832)(-0.014176)
t=(5.7161) (-4.967254) R2=0.7796 F=24.67361
从检验结果可以看出, 航班正点到达比率对乘客投诉次数确有显著影响。
这说明当航班正点到达比率每提1个百分点, 平均说来每10万名乘客投诉次数将下降0.07次。
如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数为
ˆ6.0178320.070414800.384712(次) Yi
2.6 表2.34中是16支公益股票某年的每股帐面价值Y和当年红利X的数据:
表2.14 某年16支公益股票每股帐面价值和当年红利
帐面价值Y公司序号 (元) 1 2 3 4 22.44 20. 22.09 14.48 2.4 2.98 2.06 1.09 9 10 11 12 红利X(元) 公司序号 (元) 12.14 23.31 16.23 0.56 0.80 1.94 3.00 0.28 帐面价值Y红利X(元) 5 6 7 8 20.73 19.25 20.37 26.43 1.96 1.55 2.16 1.60 13 14 15 16 0.84 18.05 12.45 11.33 0.84 1.80 1.21 1.07 (1)分析每股帐面价值和当年红利的相关性? (2) 建立每股帐面价值和当年红利的回归方程; (3)解释回归系数的经济意义。
练习题2.6参考解答:
1.分析每股帐面价值和当年红利的相关性 作散布图:
从图形看似乎具有一定正相关性,计算相关系数:
每股帐面价值和当年红利的相关系数为0.7087
2.建立每股帐面价值X和当年红利Y的回归方程:
Yi12Xiui
回归结果:
参数2的t检验:t值为3.7580,查表t0.025(162)2.145 2.7 设销售收入X为解释变量,销售成本Y为被解释变量。现已根据某百货公司某年12个月的有关资料计算出以下数据:(单位:万元) (Xt2X)425053.73 X7.88 t2(YY)(Xt262855.25 Y549.8 X)(YtY)334229.09 (1) 拟合简单线性回归方程,并对方程中回归系数的经济意义作出解释。 (2) 计算可决系数和回归估计的标准误差。 (3) 对2进行显著水平为5%的显著性检验。 (4) 假定下年1月销售收入为800万元,利用拟合的回归方程预测其销售成本,并给出 置信度为95%的预测区间。 练习题2.7参考解答: (1)建立回归模型: Yi12Xiui ˆ用OLS法估计参数: 2(XX)(YY)xy(XX)xiii2i2ii334229.090.7863 425053.73ˆYˆX549.80.78637.8866.2872 12ˆ66.28720.7863X 估计结果为: Yii说明该百货公司销售收入每增加1元,平均说来销售成本将增加0.7863元。 (2)计算可决系数和回归估计的标准误差 可决系数为: R 2ˆx)ˆy(yy2i2i2i2i2ˆ2x22iy2i 0.78632425053.73262796.990.999778262855.25262855.25由 r2e1y2i2i 可得 e2i(1R2)yi2 e2i(1R2)yi2(10.999778)262855.2558.3539 ˆ回归估计的标准误差: e2i(n2)58.3539(122)2.4157 (3) 对2进行显著水平为5%的显著性检验 t*ˆ22ˆ)SE(2^ˆ2ˆ)SE(2^~t(n2) ˆ)SE(2ˆ2ˆ)SE(2^^ˆ2xi2.41572.41570.0037 425053.73651.9614 t*0.7863212.5135 0.0037* 查表得 0.05时,t0.025(122)2.228 信度为95%的预测区间。 ˆ66.28720.7863X66.28720.7863800695.3272万元 Yii1(XFX)2ˆˆ预测区间为: YFYFt2 2nxi1(8007.88)2Y695.32722.2282.4157 F12425053.73 695.32721.99782.8 表2.15中是1992年亚洲各国人均寿命(Y)、按购买力平价计算的人均GDP(X1)、成人识字率(X2)、一岁儿童疫苗接种率(X3)的数据: 表2.15 1992年亚洲各国人均寿命等数据 序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 国家和 地区 日本 中国 韩国 新加坡 泰国 马来西亚 斯里兰卡 中国 菲律宾 朝鲜 蒙古 印度尼西亚 越南 缅甸 巴基斯坦 老挝 印度 孟加拉国 柬埔寨 尼泊尔 不丹 阿富汗 平均寿命 Y (年) 79 77 70 74 69 70 71 70 65 71 63 62 63 57 58 50 60 52 50 53 48 43 人均GDP X1(100美元) 194 185 83 147 53 74 27 29 24 18 23 27 13 7 20 18 12 12 13 11 6 7 成人识字率X2(%) 99 90 97 92 94 80 80 90 95 95 84 81 36 55 50 37 38 27 41 32 一岁儿童疫苗接种率X3 (%) 99 79 83 90 86 90 88 94 92 96 85 92 90 74 81 36 90 69 37 73 85 35 资料来源:联合国发展规划署. 人的发展报告. 1993 (1)分别设定简单线性回归模型,分析各国人均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率的数量关系。 (2)对所建立的多个回归模型进行检验。 (3)分析对比各个简单线性回归模型。 练习题2.8参考解答: (1) 分别设定简单线性回归模型,分析各国人均寿命与人均GDP、成人识字率、一岁 儿童疫苗接种率的数量关系: 1) 人均寿命与人均GDP关系 Yi12X1iui 估计检验结果: 2) 人均寿命与成人识字率关系 3) 人均寿命与一岁儿童疫苗接种率关系 (2)对所建立的多个回归模型进行检验 由人均GDP、成人识字率、一岁儿童疫苗接种率分别对人均寿命回归结果的参数t检验值均明确大于其临界值,而且从对应的P值看,均小于0.05,所以人均GDP、成人识字率、一岁儿童疫苗接种率分别对人均寿命都有显著影响. (3)分析对比各个简单线性回归模型 人均寿命与人均GDP回归的可决系数为0.5261 人均寿命与成人识字率回归的可决系数为0.7168 人均寿命与一岁儿童疫苗接种率的可决系数为0.5379 相对说来,人均寿命由成人识字率作出解释的比重更大一些 2.9 按照“弗里德曼的持久收入假说”: 持久消费Y正比于持久收入X,依此假说建立的计量模型没有截距项,设定的模型应该为:Yi2Xiui,这是一个过原点的回归。 ˆ的计算公式是什么?对该模在古典假定满足时,证明过原点的回归中2的OLS估计量2型是否仍有 e0和eXiii0?对比有截距项模型和无截距项模型参数的OLS估计 有什么不同? 练习题2.9参考解答: 没有截距项的过原点回归模型为: Yi2Xiu 因为 ˆX)e(Y2ii2i2 ei2ˆX)(X)2eX 2(Yi求偏导 ii2iiˆ2ei2ˆX)(X)0 令 2(Yi2iiˆ2ˆ得 2XYXii2iˆ 而有截距项的回归为2xyxi2ii 对于过原点的回归,由OLS原则: e0已不再成立, 但是eXiii0是成立的。 ˆ)还可以证明对于过原点的回归 Var(2ˆ)而有截距项的回归为 Var(2 2X22i2iˆ , 2ee2in12i x , ˆ2n2 2.10 练习题2.3中如果将“地方财政收入”和“本市生产总值”数据的计量单位分别或同时由”亿元”改为”万元”,重新估计参数,对比参数估计及检验结果与计量单位更改之前有什么区别? 你能从中总结出什么规律性吗? 练习题2.10参考解答: 如果将“地方财政收入Y”和“本市生产总值GDP”数据的计量单位分别或同时由”亿元”改为”万元”,数据变为: 深圳市地方预算内财政收入与国内生产总值 年 份 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 地方预算内财政收入Y (亿元)Y1 21.70 27.33 42.96 67.25 74.40. 88.02 131.75 142.06 1.39 184.21 221.92 262.49 265.93 290.84 (万元)Y2 217000 273300 429600 672500 744000 880200 1317500 1420600 13900 1842100 2219200 2624900 2659300 2908400 本市生产总值(GDP) (亿元)GDP1 171.67 236.66 317.32 453.14 634.67 842.48 1048.44 1297.42 1534.73 1804.02 2187.45 2482.49 2969.52 3585.72 (万元) GDP2 1716700 2366600 3173200 4531400 6346700 8424800 10484400 12974200 15347300 18040200 21874500 24824900 29695200 35857200 2004 2005 2006 2007 321.47 421.38 500.88 658.06 3214700 4213800 5008800 6580600 4282.14 4950.91 5813.56 6801.57 42821400 49509100 58135600 68015700 A.当“地方财政收入”和“本市生产总值”数据的计量单位均为“亿元”时估计检验结果为: ˆ20.461060.084965GDP Y1t1t (9.867440) (0.003255) t=(2.073593) (26.10376) R2=0.977058 B.当“地方财政收入” 的计量单位为“亿元”,“本市生产总值” 的计量单位为“万元” 时: ˆ20.461060.00000850GDP Y1t2t(9.867440)(0.000000325) t=(2.073593) (26.10376) R2=0.977058 C.当“地方财政收入” 的计量单位为“万元”,“本市生产总值” 的计量单位为“亿元” 时: ˆ204610.6849.6520GDP Y2t1t(98674.40) (32.54902) t=(2.073593) (26.10376) R2=0.977058 D.当“地方财政收入” 的计量单位为“万元”,“本市生产总值” 的计量单位为“万元” 时: ˆ204610.60.084965GDP Y2t2t(98674.40) (0.0032549) t=(2.073593) (26.10376) R2=0.977058 可以总结出,变量度量单位对回归影响的一般规律为: 1)当被解释变量测量单位改变(扩大或缩小常数c倍),而解释变量测量单位不变时:OLS截距和斜率的估计值及标准误差都缩小或扩大为原来的c倍. (如C的情况) 2)当解释变量测量单位改变(扩大或缩小常数c倍),而被解释变量测量单位不变时:OLS斜率的估计值及标准误差扩大或缩小为原来的c倍,但不影响截距的估计. (如B的情况)3)当被解释变量和解释变量测量单位同时改变相同倍数时,OLS的截距估计值及标准误差扩大为原来的c倍,但不影响斜率的估计. (如D的情况) 4)当被解释变量和解释变量测量单位改变时,不会影响拟合优度.可决系数是纯数没有维度,所以不随计量单位而变化。 第三章练习题参考解答 练习题 3.1为研究中国各地区入境旅游状况,建立了各省市旅游外汇收入(Y,百万美元)、旅行社职工人数(X1,人)、国际旅游人数(X2,万人次)的模型,用某年31个省市的截面数据估计结果如下: ˆ151.02630.1179X1.5452X Yi1i2i t=(-3.066806) (6.652983) (3.3780) R2=0.934331 R0.929 F=191.14 n=31 (1) 从经济意义上考察估计模型的合理性。 (2) 在5%显著性水平上,分别检验参数1,2的显著性。 (3) 在5%显著性水平上,检验模型的整体显著性。 3.2根据下列数据试估计偏回归系数、标准误差,以及可决系数与修正的可决系数: Y367.693, X1402.760, X28.0, n15, 2(YY)i266042.269, (Xi1iX1)284855.096, 1i2(XX)2i2280.000, (YY)(X(X1iX1)74778.346, (YY)(Xi2iX2)4250.900, X1)(X2iX2)4796.000 3.3 经研究发现,家庭书刊消费受家庭收入几户主受教育年数的影响,表中为对某地区部分家庭抽样调查得到样本数据: 家庭书刊年消费支出(元)Y 450 507.7 613.9 563.4 501.5 781.5 541.8 611.1 1222.1 家庭月平均收入 (元)X 1027.2 1045.2 1225.8 1312.2 1316.4 1442.4 11 1768.8 1981.2 户主受教育年数 (年)T 8 9 12 9 7 15 9 10 18 家庭书刊年消费支出(元)Y 793.2 660.8 792.7 580.8 612.7 0.8 1121 1094.2 1253 家庭月平均收入 (元)X 1998.6 2196 2105.4 2147.4 2154 2231.4 2611.8 3143.4 3624.6 户主受教育年数 (年)T 14 10 12 8 10 14 18 16 20 (1) 建立家庭书刊消费的计量经济模型; (2)利用样本数据估计模型的参数; (3)检验户主受教育年数对家庭书刊消费是否有显著影响; (4)分析所估计模型的经济意义和作用 3.4 考虑以下“期望扩充菲利普斯曲线(Expectations-augmented Phillips curve)”模型: Yt12X2t3X3tut 其中:Yt=实际通货膨胀率(%);X2t=失业率(%);X3t=预期的通货膨胀率(%) 下表为某国的有关数据, 表1. 1970-1982年某国实际通货膨胀率Y(%), 失业率X2(%)和预期通货膨胀率X3(%) 年份 实际通货膨胀率Y (%) 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 5.92 4.30 3.30 6.23 10.97 9.14 5.77 6.45 7.60 11.47 13.46 10.24 5.99 失业率X2 (%) 4.90 5.90 5.60 4.90 5.60 8.50 7.70 7.10 6.10 5.80 7.10 7.60 9.70 预期的通货膨胀率X3(%) 4.78 3.84 3.31 3.44 6.84 9.47 6.51 5.92 6.08 8.09 10.01 10.81 8.00 (1)对此模型作估计,并作出经济学和计量经济学的说明。 (2)根据此模型所估计结果,作计量经济学的检验。 (3)计算修正的可决系数(写出详细计算过程)。 3.5某地区城镇居民人均全年耐用消费品支出、人均年可支配收入及耐用消费品价格指数的统计资料如表所示: 年份 1991 人均耐用消费品支出 Y(元) 137.16 人均年可支配收入 X1(元) 1181.4 耐用消费品价格指数 X2(1990年=100) 115.96 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 124.56 107.91 102.96 125.24 162.45 217.43 253.42 251.07 285.85 327.26 1375.7 1501.2 1700.6 2026.6 2577.4 3496.2 4283.0 4838.9 5160.3 5425.1 133.35 128.21 124.85 122.49 129.86 139.52 140.44 139.12 133.35 126.39 利用表中数据,建立该地区城镇居民人均全年耐用消费品支出关于人均年可支配收入和耐用消费品价格指数的回归模型,进行回归分析,并检验人均年可支配收入及耐用消费品价格指数对城镇居民人均全年耐用消费品支出是否有显著影响。 3.6下表给出的是1960—1982年间7个OECD国家的能源需求指数(Y)、实际GDP指数(X1)、能源价格指数(X2)的数据,所有指数均以1970年为基准(1970=100) 年份 能源需实际求指数Y GDP指数X1 54.1 55.4 58.5 61.7 63.6 66.8 70.3 73.5 78.3 83.3 88.9 91.8 54.1 56.4 59.4 62.1 65.9 69.5 73.2 75.7 79.9 83.8 86.2 .8 能源价格年份 指数X2 111.9 112.4 111.1 110.2 109.0 108.3 105.3 105.4 104.3 101.7 97.7 100.3 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 能源需求实际指数Y GDP指数X1 97.2 100.0 97.3 93.5 99.1 100.9 103.9 106.9 101.2 98.1 95.6 94.3 100.0 101.4 100.5 105.3 109.9 114.4 118.3 119.6 121.1 120.6 能源价格指数X2 98.6 100.0 120.1 131.0 129.6 137.7 133.7 144.5 179.0 1.4 190.9 1960 1961 1962 1963 19 1965 1966 1967 1968 1969 1970 1971 (1)建立能源需求与收入和价格之间的对数需求函数 lnYt01lnX1t2lnX2tut,解释各回归系数的意义,用P值检验所估计回 归系数是否显著。 (2) 再建立能源需求与收入和价格之间的线性回归模型 Yt01X1t2X2tu,解释各回归系数的意义,用P值检验所估计回归系数是 否显著。 (3 )比较所建立的两个模型,如果两个模型结论不同,你将选择哪个模型,为什么? 练习题参考解答 练习题3.1参考解答 有模型估计结果可看出:旅行社职工人数和国际旅游人数均与旅游外汇收入正相关。平均说来,旅行社职工人数增加1人,旅游外汇收入将增加0.1179百万美元;国际旅游人数增加1万人次,旅游外汇收入增加1.5452百万美元。 取0.05,查表得t0.025(313)2.048 因为3个参数t统计量的绝对值均大于t0.025(313)2.048,说明经t检验3个参数均显著不为0,即旅行社职工人数和国际旅游人数分别对旅游外汇收入都有显著影响。 取0.05,查表得F0.05(2,28)3.34,由于F199.14F0.05(2,28)3.34,说明旅行社职工人数和国际旅游人数联合起来对旅游外汇收入有显著影响,线性回归方程显著成立。 练习题3.3参考解答 (1)建立家庭书刊消费的计量经济模型: Yi12Xi3Tiui 其中:Y为家庭书刊年消费支出、X为家庭月平均收入、T为户主受教育年数 (2)估计模型参数,结果为 ˆ50.01620.085X52.3703T 即 Yiii (49.46026)(0.02936) (5.20217) t= (-1.011244) (2.944186) (10.06702) R2=0.951235 R0.944732 F=146.2974 (3) 检验户主受教育年数对家庭书刊消费是否有显著影响: 由估计检验结果, 户主受教育年数参数对应的t 统计量为10.06702, 明显大于t的临界值 2t0.025(183)2.131,同时户主受教育年数参数所对应的P值为0.0000,明显小于 0.05,均可判断户主受教育年数对家庭书刊消费支出确实有显著影响。 (4)本模型说明家庭月平均收入和户主受教育年数对家庭书刊消费支出有显著影响,家庭月平均收入增加1元,家庭书刊年消费支出将增加0.086元,户主受教育年数增加1年,家庭书刊年消费支出将增加52.37元。 练习题3.5参考解答 (1) 建立该地区城镇居民人均全年耐用消费品支出关于人均年可支配收入和耐用消费品价格指数的回归模型: Yt12Xt3Ttut (2)估计参数结果 由估计和检验结果可看出,该地区人均年可支配收入的参数的t检验值为10.54786,其绝对值大于临界值t0.025(113)2.306;而且对应的P值为0.0000,也明显小于0.05。说明人均年可支配收入对该地区城镇居民人均全年耐用消费品支出确实有显著影响。 但是,该地区耐用消费品价格指数的参数的t检验值为-0.921316,其绝对值小于临界值 t0.025(113)2.306;而且对应的P值为0.3838,也明显大于0.05。这说明该地区耐 用消费品价格指数对城镇居民人均全年耐用消费品支出并没有显著影响 第四章 4.1 假设在模型Yi12X2i3X3iui中,X2与X3之间的相关系数为零,于是有人建议你进行如下回归: Yi12X2iu1iYi13X3iu2i ˆ且ˆ?为什么? ˆ2ˆ3(1)是否存在23ˆ会等于ˆ1或ˆ1或两者的某个线性组合吗?(2) 1ˆvarˆvarˆ2且varˆ3? (3)是否有var23 练习题4.1参考解答: ˆ且ˆ。 ˆ2ˆ3(1) 存在23ˆ因为2yxxyxxxxxxi2i23ii3i22i23i22i3i2ix3i 当X2与X3之间的相关系数为零时,离差形式的 x2ix3i0 ˆ有2yxxyxxxxi2i23ii22i23i2i22iˆ2 ˆ ˆ3同理有:3ˆ会等于ˆ1或ˆ1的某个线性组合 (2) 1ˆYˆXˆX,且ˆ1Yˆ2X2,ˆ1Yˆ3X3 因为 12233ˆ且ˆ,则 ˆ2ˆ3由于23ˆXˆ1Yˆ2X2Y 22ˆXˆ1Yˆ3X3Y 33ˆ2ˆ3ˆ1Y X2Yˆ1 X3ˆ1Yˆ1ˆYˆXˆXYYˆ1ˆ1Y XX3则 122332X2X3ˆvarˆvarˆ2且varˆ3。 (3) 存在var23ˆ因为var22x22i1r232 ˆ当r230时,var2x1rx22i2232222iˆ2 varˆvarˆ3 同理,有var3 4.2在决定一个回归模型的“最优”解释变量集时人们常用逐步回归的方法。在逐步回归中既可采取每次引进一个解释变量的程序(逐步向前回归),也可以先把所有可能的解释变量都放在一个多元回归中,然后逐一地将它们剔除(逐步向后回归)。加进或剔除一个变量,通常是根据F检验看其对ESS的贡献而作出决定的。根据你现在对多重共线性的认识,你赞成任何一种逐步回归的程序吗?为什么? 练习题4.2参考解答: 根据对多重共线性的理解,逐步向前和逐步向后回归的程序都存在不足。逐步向前法不能反映引进新的解释变量后的变化情况,即一旦引入就保留在方程中;逐步向后法则一旦某个解释变量被剔出就再也没有机会重新进入方程。而解释变量之间及其与被解释变量的相关关系与引入的变量个数及同时引入哪些变量而呈现出不同,所以要寻找到“最优”变量子集则采用逐步回归较好,它吸收了逐步向前和逐步向后的优点。 4.3 下表给出了中国商品进口额Y、国内生产总值GDP、居民消费价格指数CPI。 表4.11 中国商品进口额、国内生产总值、居民消费价格指数 年份 1985 1986 1987 1988 19 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 商品进口额 (亿元) 1257.8 1498.3 1614.2 2055.1 2199.9 2574.3 3398.7 4443.3 5986.2 9960.1 11048.1 11557.4 11806.5 11626.1 13736.4 18638.8 国内生产总值 (亿元) 9016.0 10275.2 12058.6 15042.8 16992.3 18667.8 21781.5 26923.5 35333.9 48197.9 60793.7 71176.6 773.0 84402.3 677.1 99214.6 居民消费价格指数(1985=100) 100.0 106.5 114.3 135.8 160.2 165.2 170.8 181.7 208.4 258.6 302.8 327.9 337.1 334.4 329.7 331.0 2001 2002 2003 2004 2005 2006 2007 20159.2 24430.3 34195.6 435.8 54273.7 63376.9 73284.6 109655.2 120332.7 135822.8 159878.3 183084.8 211923.5 249529.9 333.3 330.6 334.6 347.7 353.9 359.2 376.5 资料来源:《中国统计年鉴》,中国统计出版社2000年、2008年。 请考虑下列模型:lnYt1+2lnGDPt3lnCPItui 1)利用表中数据估计此模型的参数。 2)你认为数据中有多重共线性吗? 3)进行以下回归: lnYtA1+A2lnGDPtv1ilnYtB1+B2lnCPItv2ilnGDPtC1C2lnCPItv3i根据这些回归你能对数据中多重共线性的性质说些什么? ˆ和ˆ在5%水平上个别地显著,并且总的F检验也是显4)假设数据有多重共线性,但23著的。对这样的情形,我们是否应考虑共线性的问题? 练习题4.3参考解答: (1) 参数估计结果如下 ln(进口)3.0601.657ln(GDP)1.057ln(CPI) (0.337) (0.092) (0.215)R20.992 R20.991 F1275.093(括号内为标准误) (2)居民消费价格指数的回归系数的符号不能进行合理的经济意释,且且CPI与进口之间的简单相关系数呈现正向变动。可能数据中有多重共线性。 计算相关系数: (3)最大的CI=108.812,表明GDP与CPI之间存在较高的线性相关。 (4)分别拟合的回归模型如下: lnY4.09071.2186ln(GDP) t= (-10.58) (34.6222)R20.9828 R20.9820 F1198.698 lnY5.44242.6637ln(CPI) t= (-4.3412) (11.6809)R20.8666 R20.8603 F136.4437 ln(GDP)1.43802.2460ln(CPI) t=(-1.9582) (16.8140)R20.9309 R20.9276 F282.7107 单方程拟合效果都很好,回归系数显著,可决系数较高,GDP和CPI对进口分别有显著的单一影响,在这两个变量同时引入模型时影响方向发生了改变,这只有通过相关系数的分析才能发现。 (5)如果仅仅是作预测,可以不在意这种多重共线性,但如果是进行结构分析,还是应该引起注意。 4.4 自己找一个经济问题来建立多元线性回归模型,怎样选择变量和构造解释变量数据矩阵X才可能避免多重共线性的出现? 练习题4.4参考解答: 本题很灵活,主要应注意以下问题: (1)选择变量时要有理论支持,即理论预期或假设;变量的数据要足够长,被解释变量与解释变量之间要有因果关系,并高度相关。 (2)建模时尽量使解释变量之间不高度相关,或解释变量的线性组合不高度相关。 4.5 克莱因与戈德伯格曾用1921-1950年(1942-1944年战争期间略去)美国国内消费Y和工资收入X1、非工资—非农业收入X2、农业收入X3的时间序列资料,利用OLSE估计得出了下列回归方程: ˆ8.1331.059X10.452X20.121X3Y (8.92) (0.17) (0.66) (1.09) R20.95 F107.37括号中的数据为相应参数估计量的标准误差。试对上述模型进行评析,指出其中存在的 问题。 练习题4.5参考解答: 从模型拟合结果可知,样本观测个数为27,消费模型的判定系数R0.95,F统计量为107.37,在0.05置信水平下查分子自由度为3,分母自由度为23的F临界值为3.028,计算的F值远大于临界值,表明回归方程是显著的。模型整体拟合程度较高。 依据参数估计量及其标准误,可计算出各回归系数估计量的t统计量值: 2t08.1330.91,8.92t11.0596.10,0.17t20.4520.69,0.66t30.1210.111.09除t1外,其余的tj值都很小。工资收入X1的系数的t检验值虽然显著,但该系数的估计值过大,该值为工资收入对消费边际效应,因为它为1.059,意味着工资收入每增加一美元,消费支出的增长平均将超过一美元,这与经济理论和常识不符。 另外,理论上非工资—非农业收入与农业收入也是消费行为的重要解释变量,但两者的t检验都没有通过。这些迹象表明,模型中存在严重的多重共线性,不同收入部分之间的相互关系,掩盖了各个部分对解释消费行为的单独影响。 4.6 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费总量Y (万吨标准煤)、国民总收入(亿元)X1(代表收入水平)、国内生产总值 (亿元)X2(代表经济发展水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费 (千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等在1985-2007年期间的统计数据,具体如表4.2所示。 表4.12 1985~2007年统计数据 年份 能源消费 y 1985 1986 1987 1988 19 1990 1991 1992 76682 80850 86632 92997 96934 98703 103783 109170 国民 总收入 X1 9040.7 10274.4 12050.6 15036.8 17000.9 18718.3 21826.2 26937.3 国内生 工业 建筑业 交通运输邮电 人均生活 能源加工 增加值 X5 406.9 475.6 544.9 661 786 1147.5 1409.7 1681.8 电力消费 转换效率 X6 21.3 23.2 26.4 31.2 35.3 42.4 46.9 54.6 X7 68.29 68.32 67.48 66.54 66.51 67.2 65.9 66.00 产总值 增加值 增加值 X2 9016 10275.2 12058.6 15042.8 16992.3 18667.8 21781.5 26923.5 X3 3448.7 3967 4585.8 5777.2 84 6858 8087.1 10284.5 X4 417.9 525.7 665.8 810 794 859.4 1015.1 1415 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 115993 122737 131176 1348 137798 132214 133831 138553 143199 151797 174990 203227 223319 246270 265583 35260 48108.5 59810.5 70142.5 77653.1 83024.3 881 98000.5 108068.2 119095.7 135174 159586.7 183956.1 35333.9 48197.9 60793.7 71176.6 773 84402.3 677.1 99214.6 109655.2 120332.7 135822.8 159878.3 183084.8 14188 2266.5 19480.7 29.7 24950.6 3728.8 29447.6 4387.4 32921.4 4621.6 34018.4 4985.8 35861.5 5172.1 4003.6 5522.3 43580.6 5931.7 47431.3 65.5 54945.5 7490.8 65210 8694.3 76912.9 10133.8 2205.6 28.3 3424.1 4068.5 4593 5178.4 5821.8 7333.4 8406.1 9393.4 10098.4 12147.6 10526.1 12481.1 14604.1 61.2 72.7 83.5 93.1 101.8 106.6 118.2 132.4 144.6 156.3 173.7 190.2 216.7 249.4 274.9 67.32 65.2 71.05 71.5 69.23 69.44 69.19 69.04 69.03 69.04 69.4 70.71 71.08 71.24 71.25 213131.7 211923.5 91310.9 11851.1 251483.2 249529.9 107367.2 14014.1 资料来源:《中国统计年鉴》,中国统计出版社2000、2008年版。 要求: 1)建立对数多元线性回归模型,分析回归结果。 2)如果决定用表中全部变量作为解释变量,你预料会遇到多重共线性的问题吗?为什么? 3)如果有多重共线性,你准备怎样解决这个问题?明确你的假设并说明全部计算。 练习题4.6参考解答: (1)建立对数线性多元回归模型,引入全部变量建立对数线性多元回归模型如下: 生成: lny=log(y), 同样方法生成: lnx1,lnx2,lnx3,lnx4,lnx5,lnx6,lnx7. 作全部变量对数线性多元回归,结果为: 从修正的可决系数和F统计量可以看出,全部变量对数线性多元回归整体对样本拟合很好,,各变量联合起来对能源消费影响显著。可是其中的lnX3、lnX4、lnX6对lnY影响不显著,而且lnX2、lnX5的参数为负值,在经济意义上不合理。所以这样的回归结果并不理想。 (2) 预料此回归模型会遇到多重共线性问题, 因为国民总收入与GDP本来就是一对关联指标;而工业增加值、建筑业增加值、交通运输邮电业增加值则是GDP的组成部分。这两组指标必定存在高度相关。 解释变量国民总收入(亿元)X1(代表收入水平)、国内生产总值(亿元)X2(代表经济发展水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费 (千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等很可能线性相关,计算相关系数如下: 可以看出lnx1与lnx2、lnx3、lnx4、lnx5、lnx6之间高度相关,许多相关系数高于0.900以上。如果决定用表中全部变量作为解释变量,很可能会出现严重多重共线性问题。 (3)因为存在多重共线性,解决方法如下: A:修正理论假设,在高度相关的变量中选择相关程度最高的变量进行回归建立模型:而对变量取对数后,能源消费总量的对数与人均生活电力消费的对数相关程度最高,可建立这两者之间的回归模型。如 lny9.9320.421lnx6 (0.116) (0.026)R20.926 R20.922 F261.551 B:进行逐步回归,直至模型符合需要研究的问题,具有实际的经济意义和统计意义。采用逐步回归的办法,去检验和解决多重共线性问题。分别作lnY对 lnX1,lnX2,lnX3,lnX4,lnX5,lnX6,lnX7的一元回归,结果如下: 一元回归结果: 变量 lnX1 lnX2 0.315 14.62 0.911 0.906 lnX3 0.277 9.718 0.818 0.809 lnX4 0.297 13.22 0.3 0.888 lnX5 0.273 11.717 0.867 0.861 lnX6 0.421 16.173 0.926 0.922 lnX7 8.73 4.8 0.507 0.484 参数估计值 0.316 t统计量 可决系数 调整可决系数 14.985 0.914 0.910 其中加入lnX6的方程调整的可决系数最大, 以lnX6为基础, 顺次加入其他变量逐步回归。结果如下表: 变量 lnX6 lnX1 lnX6 lnX2 lnX6 lnX3 lnX6 lnX4 lnX6 lnX5 lnX6 lnX7 lnX1 -0.186 (-0.698) -0.251 (-1.021) 0.061 (1.548) -0.119 (-0.7) -0.623 (-7.127) lnX2 lnX3 lnX4 lnX5 lnX6 0.666 (1.1) 0.753 (2.308) 0.341 (5.901) 0.585 (3.167) 1.344 (10.314) 0.391 (11.071) 0.924 0.977 0.921 0.927 0.922 lnX7 R2 0.920 经比较,新加入lnX5的方程调整可决系数改进最大, 各参数的t检验也都显著,但是lnX5参数 的符号与经济意义不符合。若再加入其他变量后的逐步回归,若剔除不显著的变量和无经济意义的变量后, 仍为第一步所建只包含lnX6的一元回归模型。 如果需要建立多元线性回归模型,则需寻找新的变量或改变模型形式。 例如, 不取对数作全部变量多元线性回归,结果为: 可以看出还是有严重多重共线性。作逐步回归: 分别作一元回归得到: 变量 参数估计值 t 统计量 X1 0.7333 26.4698 0.9709 0.9695 X1 6.6399(0.0022) 0.5512 (0.0000) 0.5040 (0.3356) 1.0516 (0.0000) 1.0075 (0.0088) 0.7499 (0.0000) X2 0.7353 0.9684 0.9669 X2 -5.9308 (0.0054) X3 1.6655 0.9393 0.93 X3 0.4349 (0.0821) X4 X4 13.1909 25.9636 0.9697 0.9683 X5 X5 10.80 13.5147 0.69 0.20 X6 -255.80 (0.438) X6 678.0058 22.4229 0.9599 0.9580 X7 -813.44 (0.5988) X7 19332.30 4.7024 0.5129 0.47 25.3627 18.0257 R2 R2 X1,X2 X1,X3 X1,X4 X1,X5 X1,X6 X1,X7 以X1为基础加入其他变量, 结果为: R2 0.9785 0.9726 0.9683 0.9766 0.9690 0.9684 4.1326 (0.6580) -5.0269 (0.013) 注: 括号中为p值. 可以发现加入X2、X5、X6、X7后参数的符号不合理,加入X4后并不显著。只有加入X3后修正的可决系数有所提高,而且参数符号的经济意义合理, X3参数估计值的p值为0.0821,在10%的显著性水平下是显著的。所以相对较为合理的模型估计结果可以为: 可是这里的lnX2和lnX5的参数符号为负,在经济意义上并不合理。说明多重共线性影响仍然很严重。 4.7 在本章开始的“引子”提出的“农业的发展反而会减少财政收入吗?”的例子中,如果所采用的数据如下表所示 表4.13 1978-2007年财政收入及其影响因素数据 建筑业增加受灾面积财政收入农业增加值工业增加值总人口(万最终消费年份 值(亿(千公(亿元)CS (亿元)NZ (亿元)GZ 人)TPOP (亿元)CUM 元)JZZ 顷)SZM 1978 1132.3 1027.5 1607 138.2 96259 2239.1 50790 1979 1146.4 1270.2 1769.7 143.8 97542 2633.7 39370 1980 1159.9 1371.6 1996.5 195.5 98705 3007.9 44526 1981 1175.8 1559.5 2048.4 207.1 100072 3361.5 39790 1982 1212.3 1777.4 2162.3 220.7 101654 37148 33130 1983 1367 1978.4 2375.6 270.6 103008 4126.4 34710 1984 12.9 2316.1 27 316.7 104357 4846.3 310 1985 2004.8 25.4 3448.7 417.9 105851 5986.3 44365 1986 2122 2788.7 3967 525.7 107507 6821.8 47140 1987 2199.4 3233.0 4585.8 665.8 109300 7804.6 42090 1988 2357.2 3865.4 5777.2 810 111026 9839.5 50870 19 26.9 4265.9 84 794 112704 111.2 46991 1990 2937.1 5062.0 6858 859.4 114333 12090.5 38474 1991 3149.48 5342.2 8087.1 1015.1 115823 14091.9 55472 1992 3483.37 5866.6 10284.5 1415 117171 17203.3 51333 1993 4348.95 6963.8 14188 2266.5 118517 219.9 48829 1994 5218.1 9572.7 19480.7 29.7 119850 29242.2 55043 1995 6242.2 12135.8 24950.6 3728.8 121121 36748.2 45821 1996 7407.99 14015.4 29447.6 4387.4 1223 43919.5 469 1997 8651.14 14441.9 32921.4 4621.6 123626 48140.6 53429 1998 9875.95 14817.6 34018.4 4985.8 124761 51588.2 50145 1999 11444.08 14770.0 35861.5 5172.1 125786 55636.9 49981 2000 13395.23 14944.7 4003.6 5522.3 126743 61516 54688 2001 16386.04 15781.3 43580.6 5931.7 127627 66878.3 52215 2002 103. 16537.0 47431.3 65.5 128453 71691.2 47119 2003 21715.25 17381.7 54945.5 7490.8 129227 77449.5 54506 2004 26396.47 21412.7 65210 8694.3 129988 87032.9 37106 2005 319.29 22420.0 76912.9 10133.8 130756 96918.1 38818 2006 38760.20 24040.0 91310.9 11851.1 131448 110595.3 41091 2007 51321.78 28095.0 107367.2 14014.1 132129 128444.6 492 (资料来源:《中国统计年鉴2008》,中国统计出版社2008年版) 试分析:为什么会出现本章开始时所得到的异常结果?怎样解决所出现的问题? 练习题4.7参考解答: (1)根据样本数据得到各解释变量的样本相关系数矩阵如下: 样本相关系数矩阵 解释变量之间相关系数较高,特别是农业增加值、工业增加值、建筑业增加值、最终消费之间,相关系数都在0.9以上。这显然与第三章对模型的无多重共线性假定不符合。 (2)解决方案: 采用逐步回归的方式,可以得到没有共线性的回归模型,但可能存在设定偏误。 合并工业增加值与建筑业增加值,得到财政收入与第二产业的回归。 取对数再回归,可以减低共线性。 第五章 5.1 设消费函数为 Yi12X2i3X3iui 式中,Yi为消费支出;X2i为个人可支配收入;X3i为个人的流动资产;ui为随机误差 222项,并且E(ui)0,Var(ui)X2i(其中为常数)。试解答以下问题: (1)选用适当的变换修正异方差,要求写出变换过程; (2)写出修正异方差后的参数估计量的表达式。 练习题5.1参考解答: 2(1)因为f(Xi)X2i,所以取W2i1,用W2i乘给定模型两端,得 X2iYiXu11233iiX2iX2iX2i X2i上述模型的随机误差项的方差为一固定常数,即 Var( ui1)2Var(ui)2X2iX2i (2)根据加权最小二乘法,可得修正异方差后的参数估计式为 ˆY*ˆX*ˆX*2233 1ˆ2 W2i**2****yi*x2iW2ix3iW2iyix3iW2ix2ix3i**WxW2ix2*2iW2ix3*22i2ix3ii2 ˆ3 其中 W2i**2****yi*x3iW2ix2iW2iyix2iW2ix2ix3iW2ix2*2iW2ix3*2iW2ix2*ix3*i2i2 X *2WXW2i2i,X*3WXW2i2i3i,Y*WYW2i2ii **xXX2i2i2 **x3iX3iX3y*YiY* 5.2 下表是消费Y与收入X的数据,试根据所给数据资料完成以下问题: (1)估计回归模型Y12Xu中的未知参数1和2,并写出样本回归模型的书写格式; (2)试用Goldfeld-Quandt法和White法检验模型的异方差性; (3)选用合适的方法修正异方差。 表5.8 某地区消费Y与收入X的数据(单位:亿元) Y 55 65 70 80 79 84 98 95 90 75 74 110 113 125 108 X 80 100 85 110 120 115 130 140 125 90 105 160 150 165 145 Y 152 144 175 180 135 140 178 191 137 1 55 70 75 65 74 X 220 210 245 260 190 205 265 270 230 250 80 85 90 100 105 Y 95 108 113 110 125 115 130 135 120 140 140 152 140 137 145 X 140 145 150 160 165 180 185 190 200 205 210 220 225 230 240 115 140 120 145 130 180 225 200 240 185 80 84 79 90 98 110 115 120 125 130 175 1 180 178 191 245 250 260 265 270 练习题5.2参考解答: (1)该模型样本回归估计式的书写形式为 ˆ9.347522+0.637069XYii t= (2.569104) (32.00881) R2=0.9423 R2=0.945500 F=1024.5 DW=1.790431 (2)首先,用Goldfeld-Quandt法进行检验。 将样本X按递增顺序排序,去掉中间1/4的样本,再分为两个部分的样本,即 n1n222。 分别对两个部分的样本求最小二乘估计,得到两个部分的残差平方和,即 ee求F统计量为 2122603.01482495.840 eFe22212495.844.1390603.0148 给定0.05,查F分布表,得临界值为F0.05(20,20)2.12。 c.比较临界值与F统计量值,有F=4.1390>F0.05(20,20)2.12,说明该模型的随机误差项存在异方差。 其次,用White法进行检验。具体结果见下表 White Heteroskedasticity Test: F-statistic 6.301373 Probability 0.003370 Obs*R-squared 10.801 Probability 0.004374 Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 08/05/05 Time: 12:37 Sample: 1 60 Included observations: 60 Variable Coefficient Std. Error t-Statistic Prob. C -10.03614 131.1424 -0.076529 0.9393 X 0.165977 1.619856 0.1024 0.9187 X^2 0.001800 0.004587 0.392469 0.6962 R-squared 0.181067 Mean dependent var 78.86225 Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.152332 S.D. dependent var 102.3231 Akaike info criterion 596790.5 Schwarz criterion -361.2856 F-statistic 0.937366 Prob(F-statistic) 111.1375 12.14285 12.24757 6.301373 0.003370 2给定0.05,在自由度为2下查卡方分布表,得5.9915。比较临界值与卡方 统计量值,即nR10.805.9915,同样说明模型中的随机误差项存在异方差。 (2)用权数W1 Dependent Variable: Y Method: Least Squares Date: 08/05/05 Time: 13:17 Sample: 1 60 Included observations: 60 Weighting series: W1 Variable Coefficient Std. Error t-Statistic C 10.37051 2.629716 3.943587 X 0.630950 0.018532 34.04667 Weighted Statistics R-squared 0.211441 Mean dependent var Adjusted R-squared 0.197845 S.D. dependent var S.E. of regression 7.7782 Akaike info criterion Sum squared resid 3509.7 Schwarz criterion Log likelihood -207.2041 F-statistic Durbin-Watson stat 0.958467 Prob(F-statistic) Unweighted Statistics R-squared 0.946335 Mean dependent var Adjusted R-squared 0.945410 S.D. dependent var S.E. of regression 9.0396 Sum squared resid Durbin-Watson stat 0.8005 221,作加权最小二乘估计,得如下结果 XProb. 0.0002 0.0000 106.2101 8.685376 6.973470 7.043282 1159.176 0.000000 119.6667 38.684 4739.526 用White法进行检验得如下结果: White Heteroskedasticity Test: F-statistic Obs*R-squared 3.138491 Probability 0.050925 5.951910 Probability 0.050999 2给定0.05,在自由度为2下查卡方分布表,得5.9915。比较临界值与卡方 统计量值,即nR5.951910<5.9915,说明加权后的模型中的随机误差项不存在异方差。其估计的书写形式为 22ˆ10.37050.6309XYt(3.943587) (34.04667)R20.211441 R2=0.197845 DW=0.958467 F=1159.176 5.3 下表是2007年我国各地区农村居民家庭人均纯收入与家庭人均生活消费支出的数据 表5.9 各地区农村居民家庭人均纯收入与家庭人均生活消费支出的数据(单位:元) 地 区 北 京 天 津 河 北 山 西 内蒙古 辽 宁 吉 林 黑龙江 上 海 江 苏 浙 江 安 徽 福 建 江 西 山 东 河 南 家庭人均纯收入 9439.63 7010.06 4293.43 3665.66 3953.1 4773.43 4191.34 4132.29 10144.62 6561.01 8265.15 3556.27 5467.08 4044.7 4985.34 3851.6 家庭生活消费支出 6399.27 3538.31 2786.77 2682.57 3256.15 3368.16 3065.44 3117.44 8844.88 4786.15 6801.6 2754.04 4053.47 2994.49 3621.57 2676.41 地 区 湖 北 湖 南 广 东 广 西 海 南 重 庆 四 川 贵 州 云 南 西 藏 陕 西 甘 肃 青 海 宁 夏 新 疆 家庭人均纯收入 3997.48 3904.2 5624.04 3224.05 3791.37 3509.29 3546.69 2373.99 2634.09 2788.2 24.69 2328.92 2683.78 3180.84 3182.97 家庭生活消费支出 3090 3377.38 4202.32 2747.47 2556.56 2526.7 2747.27 1913.71 2637.18 2217.62 2559.59 2017.21 2446.5 2528.76 2350.58 (1)试根据上述数据建立2007年我国农村居民家庭人均消费支出对人均纯收入的线性回归模型。 (2)选用适当方法检验模型是否在异方差,并说明存在异方差的理由。 (3)如果存在异方差,用适当方法加以修正。 练习题5.3参考解答: 解: (1)建立样本回归函数。 ˆ179.1916+0.7195X Y (0.808709)(15.74411) R0.5260, F=247.8769 (2)利用White方法检验异方差,则White检验结果见下表: Heteroskedasticity Test: White F-statistic 7.194463 Prob. F(2,28) 0.0030 0.0052 2Obs*R-squared 10.52295 Prob. Chi-Square(2) Scaled explained SS 30.08105 Prob. Chi-Square(2) 0.0000 由上述结果可知,该模型存在异方差。分析该模型存在异方差的理由是,从数据可以看出,一是截面数据;二是各省市经济发展不平衡,使得一些省市农村居民收入高出其它省市很多,如上海市、北京市、天津市和浙江省等。而有的省就很低,如甘肃省、贵州省、云南省和陕西省等。 (3)用加权最小二乘法修正异方差,分别选择权数w1过试算,认为用权数w3的效果最好。结果如下: 111,w2,w32,经XXX 书写结果为 ˆ787.28470.5615XY(4.5325)(10.0747) R20.9461,F101.4992 5.4 下表是某一地区31年中个人储蓄和个人收入数据资料 表5.10 个人储蓄和个人收入数据(单位:元) 时期 储蓄额(Y) 收入额(X) 1 2 3 4 5 6 2 105 90 131 122 107 8777 9210 9954 10508 10979 11912 时期 17 18 19 20 21 22 储蓄额(Y) 收入额(X) 1578 1654 1400 1829 2200 2017 24127 25604 26500 27670 28300 27430 7 8 9 10 11 12 13 14 15 16 406 503 431 588 8 950 779 819 1222 1702 12747 13499 14269 15522 16730 17663 18575 19635 21163 22880 23 24 25 26 27 28 29 30 31 2105 1600 2250 2420 2570 1720 1900 2100 2300 29560 28150 32100 32500 35250 33500 36000 36200 38200 (1)建立一元回归函数,判断有无异方差存在,并说明存在异方差的原因。 (2)用适当方法修正异方差。 练习题5.4参考解答: (1)建立样本回归函数。 ˆ-8.1236+0.0847X Y (-5.485018)(17.341) R0.912050, F=300.7324 从估计的结果看,各项检验指标均显著。但由于收入通常存在不同的差异,因此需要判断模型是否存在异方差。 首先,用图形法。从残差平方对解释变量散点图可以看出(见下图),模型很可能存在异方差。 2 其次,用运用Goldfeld-Quanadt检验异方差。 第一,对变量X取值以升序排序。 第二,构造子样本。由于本例的样本容量为31,删除1/4观测值,约7个,余下部分分 得两个样本区间:1—12和20—31,它们的样本个数均是12个。 第三,在样本区为1—12,所计算得到的残茶平方和为20—31,所计算得到的残茶平方和为 e22i21i21i1629.2;在样本区为 e22i981744.6。 981744.66.0267。 1629.2e第四,根据Goldfeld-Quanadt检验,F统计量为Fe第五,判断。在显著性水平为0.05条件下,分子分母的自由度均为10,查F分布表得临界值为F0.05(10,10)2.98,因为F6.0267F0.05(10,10)2.98,所以拒绝原假设,表明模型存在异方差。 最后,用ARCH方法检验异方差,则ARCH检验结果见下表: Heteroskedasticity Test: ARCH F-statistic Obs*R-squared 6.172299 Prob. F(1,28) 5.418686 Prob. Chi-Square(1) 0.0192 0.0199 由上述结论可知,拒绝原假设,则模型中随机误差项存在异方差。 (2)分别用权数w1效果最好,即 111,w2,w32,发现用权数w2求加权最小二乘估计XXXˆ706.69860.0873XY(8.0399)(20.1399) R20.8735,F405.61 5.5 下表的数据是2007年我国建筑业总产值(X)和建筑业企业利润总额(Y)。试根据资料建立回归模型,并对模型判断是否存在异方差,如果有异方差,选用适当方法修正。 表5.11 各地区建筑业总产值(X)和建筑业企业利润总额(Y)(单位:万元) 地 区 北 京 天 津 河 北 建筑业总产值x 建筑业企业利润总额y 25767692 12219419 16146909 地 区 建筑业总产值x 建筑业企业利润总额y 21108043 18288148 29995140 698837.4 545655.7 1388554.6 960256.4 湖 北 379211.6 湖 南 446520.8 广 东 山 西 内蒙古 辽 宁 吉 林 黑龙江 上 海 江 苏 浙 江 安 徽 福 建 江 西 山 东 河 南 10607041 6811038.3 21000402 7383390.8 8758777.8 25241801 70105724 69717052 15169772 15441660 7861403.8 320450 21517230 194565.9 广 西 353362.6 海 南 836846.6 重 庆 102742 四 川 98028.5 贵 州 794136.5 云 南 2368711.7 西 藏 1887291.7 陕 西 378252.8 甘 肃 375531.9 青 海 188502.4 宁 夏 1190084.1 新 疆 574938.7 6127370 821834 11287118 21099840 3487908.1 7566795.1 602940.7 11730972 4369038.8 1254431.1 1549486.5 4508313.7 126343.1 14615.7 386177.5 466176 413.1 266333.1 525.2 2246.6 152143.1 24468.3 25224.6 68276.6 数据来源:国家统计局网站 练习题5.5参考解答: (1)求Y对X的回归,得如下估计结果 ˆ292.820.0323XY(0.8009)(20.8233) R20.9373,F433.6077用怀特检验的修正方法,即建立如下回归模型 ˆYˆ2ei212Yi3ivi 通过计算得到如下结果: 注意,表中E2为残差平方et。 即 2ˆ0.0138Yˆ2 ˆi26.34(E09)65144.33Yeii对该模型系数作判断,运用F或LM检验,可发现存在异方差。 ˆ后,ˆ和具体EViews操作如下:在得到Y的估计Y进一步得到残差平方ei,然后建立ei对Y22ˆ2的线性回归模型。再通过上述回归对Yˆ和Yˆ2前的系数是否为零进行判断,从而检验原模Y型中是否存在异方差。在上表界面,按路径:VIEW/COEFFIEICENT TESTS/REDUANDANT VARIABLES,得到如下窗口,并输入变量名“YF YF^2”,即 然后“OK”即得到检验结果为 从表中F统计量值和LM统计量值看,拒绝原假设,表明原模型存在异方差。 (2)通过对权数的试算,最后选择权数w原后的结果) 1,用加权最小二乘法得到如下估计(还lXˆ9038.8750.0311XY(0.5912)(17.6011) R20.9144,F309.7983,DW2.0975对该模型进行检验,发现已无异方差。 5.6 下表为四川省农村人均纯收入、人均生活费支出、商品零售价格指数1978年至2008年时间序列数据。试根据该资料建立回归模型,并检验是否存在异方差,如果存在异方差,选用适当方法进行修正。 表5.12 1978——2008四川省农村人均纯收入、人均生活费支出、商品零售价格指数 时间 农村人均纯收入X 农村人均生活消费支出Y 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 19 1990 1991 127.1 155.9 187.9 221 256 258.4 286.8 315.07 337.9 369.46 448.85 494.07 557.76 590.21 120.3 142.1 159.5 184 208.23 231.12 251.83 276.25 310.92 348.32 426.47 473.59 509.16 552.39 100 102 108.1 110.7 112.8 114.5 117.7 128.1 135.8 145.7 172.7 203.4 207.7 213.7 商品零售价格指数 时间 农村人均纯收入X 农村人均生活消费支出Y 商品零售价格指数 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 946.33 1158.29 1453.42 1680.69 1731.76 1843.47 1903.60 1986.99 2107. 2229.86 2580.28 2802.78 3002.38 3546.69 904.28 1092.91 1349.88 1440.48 1440.77 1426.06 1485.34 1497.52 1591.99 1747.02 2010.88 2274.17 2395.04 2747.27 310.2 356.1 377.8 380.8 370.9 359.8 354.4 351.6 347 346.7 356.4 359.3 362.9 376.7 1992 1993 634.31 698.27 569.46 7.43 225.2 254.9 2008 4121.2 3127.9 398.9 资料来源:中经网统计数据库 练习题5.6参考解答: (1)设Y表示人均生活费支出,X表示农村人均纯收入,则建立样本回归函数 Y71.61407+0.761445X (3.944029)(69.98227) R0.994113, F=47.518 从估计结果看,各项检验指标均显著,但从经济意义看,改革开放以来,四川省农村经济发生了巨大变化,农村家庭纯收入的差距也有所拉大,使得农村居民的消费水平的差距也有所加大,在这种情况下,尽管是时间序列数据,也有可能存在异方差问题。而且从残差平方对解释变量的散点图可以看出,模型很可能存在异方差(见下图)。 2^ 进一步作利用ARCH方法检验异方差,得ARCH检验结果(见下表) (2)运用加权最小二乘法,选权数为w1,得如下结果 XY35.69419+0.7972X (3.435081)(59.91014) ^R20.991985, F=35.224 经检验,时模型的异方差问题有了明显的改进。 5.7 在5.6题的数据表里,如果考虑物价因素,则对异方差性的修正应该怎样进行? 练习题5.7参考解答: 剔除物价上涨因素后的回归结果如下 ˆ0.4310010.727487XY11t(6.888037) (55.52690)R20.990682 R20.990361 F=3083.237其中,Y1代表实际消费支出,X1代表实际可支配收入。 用ARCH方法来检验模型是否存在异方差: 在显著性水平为0.01的条件下,接收原假设,模型不存在异方差。表明剔除物价上涨因素之后,异方差的问题有所改善。 第六章 6.1 下表给出了美国1960-1995年36年间个人实际可支配收入X和个人实际消费支出Y的数据。 表6.6 美国个人实际可支配收入和个人实际消费支出 (单位:百亿美元) 年份 1960 1961 1962 1963 19 1965 个人实际可支配收入 X 157 162 169 176 188 200 个人实际 消费支出 Y 143 146 153 160 169 180 年份 1978 1979 1980 1981 1982 1983 个人实际可支配收入 X 326 335 337 345 348 358 个人实际 消费支出 Y 295 302 301 305 308 324 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 211 220 230 237 247 256 268 287 285 290 301 311 190 196 207 215 220 228 242 253 251 257 271 283 1984 1985 1986 1987 1988 19 1990 1991 1992 1993 1994 1995 384 396 409 415 432 440 448 449 461 467 478 493 341 357 371 382 397 406 413 411 422 434 447 458 注:资料来源于Economic Report of the President,数据为1992年价格。 要求:(1)用普通最小二乘法估计收入—消费模型; 练习题6.1参考解答: (1)收入—消费模型为 Yt12X2ut (2)检验收入—消费模型的自相关状况(5%显著水平); (3)用适当的方法消除模型中存在的问题。 ˆ9.42870.9359X Ytt Se = (2.5043) (0.0075) t = (-3.7650) (125.3411) R2 = 0.9978,F = 15710.39,d f = 34,DW = 0.5234 (2)对样本量为36、一个解释变量的模型、5%显著水平,查DW统计表可知,dL=1.411,dU= 1.525,模型中DW et= 0.72855 et-1 ˆ*3.78310.9484X* YttSe(1.8710) (0.01) t = (-2.0220) (50.1682) R2 = 0.9871 F = 2516.848 d f = 33 DW = 2.0972 查5%显著水平的DW统计表可知dL = 1.402,dU = 1.519,模型中DW = 2.0972> dU,说明广义差分模型中已无自相关。同时,可决系数R、t、F统计量均达到理想水平。 2ˆ13.783113.9366 10.72855最终的消费模型为 Y t = 13.9366+0.9484 X t 6.2 在研究生产中劳动所占份额的问题时,古扎拉蒂采用如下模型 模型1 Yt01tut 2模型2 Yt01t2tut 其中,Y为劳动投入,t为时间。据1949-19年数据,对初级金属工业得到如下结果: ˆ0.45290.0041t 模型1 Yt t = (-3.9608) R2 = 0.5284 DW = 0.8252 ˆ0.47860.0127t0.0005t2 模型2 Yt t = (-3.2724)(2.7777) R2 = 0.6629 DW = 1.82 其中,括号内的数字为t统计量。 问:(1)模型1和模型2中是否有自相关; (2)如何判定自相关的存在? (3)怎样区分虚假自相关和真正的自相关。 练习题6.2参考解答: (1)模型1中有自相关,模型2中无自相关。 (2)通过DW检验进行判断。 模型1:dL=1.077, dU=1.361, DW (3)如果通过改变模型的设定可以消除自相关现象,则为虚假自相关,否则为真正自相关。 6.3下表是北京市连续19年城镇居民家庭人均收入与人均支出的数据。 表6.7 北京市19年来城镇居民家庭收入与支出数据表(单位:元) 年份 顺序 1 2 3 4 5 6 人均收入 (元) 450.18 491.54 599.40 619.57 668.06 716.60 人均生活消 费支出(元) 359.86 408.66 490.44 511.43 534.82 574.06 商品零售 物价指数(%) 100.00 101.50 108.60 110.20 112.30 113.00 人均实 际收入(元) 人均实际消费支出(元) 450.18 484.28 551.93 562.22 594. 634.16 359.86 402.62 451.60 4.09 476.24 508.02 7 8 9 10 11 12 13 14 15 16 17 18 19 837.65 1158.84 1317.33 1413.24 1767.67 19.57 2067.33 2359.88 2813.10 3935.39 5585.88 6748.68 7945.78 666.75 923.32 1067.38 1147.60 1455.55 1520.41 16.05 1860.17 2134.65 2939.60 4134.12 5019.76 5729.45 115.40 136.80 145.90 158.60 193.30 229.10 238.50 258.80 280.30 327.70 386.40 435.10 466.90 725.87 847.11 902.90 1.07 914.47 829.14 866.81 911.85 1003.60 1200.91 1445.62 1551.06 1701.82 577.77 674.94 731.58 723.58 753.00 663. 690.17 718.77 761.56 7.04 1069.91 1153.70 1227.13 要求:(1)建立居民收入—消费函数; 练习题6.3参考解答: (1)收入—消费模型为 (2)检验模型中存在的问题,并采取适当的补救措施预以处理; (3)对模型结果进行经济解释。 ˆ79.9300.690XYtt Se(12.399)(0.013)t(6.446)(53.621)(6.38) R20.994DW0.575 (2)DW=0.575,取5%,查DW上下界dL1.18,dU1.40,DW1.18,说明误差项存在正自相关。 (3)采用广义差分法 ˆ,得 使用普通最小二乘法估计的估计值et0.657et1Se(0.178)t(3.701) ˆ*36.0100.669X*Ytt Se(8.105)(0.021)t(4.443)(32.416)R20.985DW1.830 DW=1.830,已知dU1.40,dUDW2。因此,在广义差分模型中已无自相关。据 ˆ(1ˆ)36.010,可得: 1ˆ1因此,原回归模型应为 36.010104.985 10.657Yt104.9850.669Xt 其经济意义为:北京市人均实际收入增加1元时,平均说来人均实际生活消费支出将增加0.669元。 6.4 下表给出了日本工薪家庭实际消费支出与可支配收入数据 表6.8 日本工薪家庭实际消费支出与实际可支配收入 个人实际可年份 支配收入 X 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 239 248 258 272 268 280 279 282 285 293 291 294 302 个人实际 消费支出 Y 300 311 329 351 354 3 360 366 370 378 374 371 381 1983 1984 1985 1986 1987 1988 19 1990 1991 1992 1993 1994 年份 单位:1000日元 个人实际 消费支出 Y 384 392 400 403 411 428 434 441 449 451 449 449 个人实际可支配收入 X 304 308 310 312 314 324 326 332 334 336 334 330 注:资料来源于日本银行《经济统计年报》数据为1990年价格。 要求:(1)建立日本工薪家庭的收入—消费函数; (2)检验模型中存在的问题,并采取适当的补救措施预以处理; (3)对模型结果进行经济解释。 要求:(1)检测进口需求模型Yt12Xtut的自相关性; (2)采用科克伦-奥克特迭代法处理模型中的自相关问题。 练习题6.4参考解答: (1)收入—消费模型为 ˆ50.87450.6334X Ytt t = (6.1361) (30.0085) R2 = 0.9751 DW = 0.3528 (2)对样本量为25、一个解释变量的模型、5%显著水平,查DW统计表可知,dL=1.288, dU= 1.454,模型中DW et= 0.8509 et-1 ˆ*13.97840.5351X* Yttt = (2.9181) (7.1563) R2 = 0.6995 DW = 2.3775 查5%显著水平的DW统计表可知dL = 1.273,dU = 1.446,模型中DW = 2.3775> dU,说明广义差分模型中已无自相关。 ˆ113.978493.7518 10.8509最终的消费模型为 Y t = 93.7518+0.5351 X t (3)模型说明日本工薪居民的边际消费倾向为0.5351,即收入每增加1元,平均说来消费增加0.54元。 6.5下表给出了某地区1980-2000年的地区生产总值(Y)与固定资产投资额(X)的数据。 表6.9 地区生产总值(Y)与固定资产投资额(X) 单位:亿元 年份 1980 1981 1982 1983 1984 1985 1986 1987 1988 19 地区生产 总值(Y) 1402 1624 1382 1285 1665 2080 2375 2517 2741 2730 固定资产投资额(X) 216 254 187 151 246 368 417 412 438 436 年份 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 地区生产 总值(Y) 3124 3158 3578 4067 4483 47 5120 5506 6088 7042 8756 固定资产投资额(X) 544 523 548 668 699 745 667 845 951 1185 1180 要求:(1)使用对数线性模型 LnYt12LnXtut 进行回归,并检验回归模型的 自相关性; (2)采用广义差分法处理模型中的自相关问题。 **(3) 令XtXt/Xt1(固定资产投资指数),YtYt/Yt1(地区生产总值增长指**数),使用模型 LnYt12LnXtvt,该模型中是否有自相关? 练习题6.5参考解答: (1)对数模型为 ln(Y)=2.1710+0.9511ln(X) 样本量n=21,一个解释变量的模型,5%显著水平,查DW统计表可知,dL=1.221, dU= 1.420,模型中DW **令 LYtln(Yt)0.4002ln(Yt1) ,LXtln(Xt)0.4002lnXt1。 ** LYt对LXt回归,得 t = (9.0075) (24.4512) R2 = 0.9692 DW = 1.1598 ˆ*1.47720.9060X* Yttt = (6.5465)(15.1595) R2 = 0.9274 DW = 1.4415 模型中DW = 1.4415> dU,说明广义差分模型中已无自相关。 ˆ11.47722.4628 10.4002最终的模型为 Ln(Y t )= -2.468+0.9060ln(X t ) (3)回归模型为 ln(Yt/Yt-1)=0.054 + 0.4422ln(Xt/Xt-1) t (4.0569) (6.6979) R2=0.7137 DW=1.5904 模型中DW = 1.5904> dU,说明广义差分模型中已无自相关。 第七章 7.1 表7.11中给出了1970-1987年期间美国的个人消费支出(PCE)和个人可支配收入(PDI)数据,所有数字的单位都是10亿美元(1982年的美元价)。 表7.11 1970-1987年美国个人消费支出(PCE)和个人可支配收入(PDI)数据 年份 PCE PDI 1970 1971 1492.0 1668.1 1538.8 1728.4 年份 PCE PDI 1976 1803.9 2001.0 1977 1883.8 2066.6 1978 1961.0 2167.4 1979 2004.4 2212.6 1980 2000.4 2214.3 1981 2042.2 2248.6 年份 PCE PDI 1982 2050.7 2261.5 1983 2146.0 2331.9 1984 2249.3 2469.8 1985 2354.8 2542.8 1986 2455.2 20.9 1987 2521.0 2686.3 1972 1621.9 1797.4 1973 16.6 1916.3 1974 1674.0 16.6 1975 1711.9 1931.7 估计下列模型: PCEtA1A2PDIttPCEtB1B2PDItB3PCEt1t (1) 解释这两个回归模型的结果。 (2) 短期和长期边际消费倾向(MPC)是多少? 练习题7.1参考解答: 1)第一个模型回归的估计结果如下, Dependent Variable: PCE Method: Least Squares Date: 07/27/05 Time: 21:41 Sample: 1970 1987 Included observations: 18 Variable Coefficient Std. Error t-Statistic C -216.4269 32.69425 -6.619723 PDI 1.008106 0.015033 67.05920 R-squared 0.9955 Mean dependent var Adjusted R-squared 0.996233 S.D. dependent var S.E. of regression 18.88628 Akaike info criterion Sum squared resid 5707.065 Schwarz criterion Log likelihood -77.37269 F-statistic Durbin-Watson stat 1.366654 Prob(F-statistic) Prob. 0.0000 0.0000 1955.606 307.7170 8.819188 8.918118 4496.936 0.000000 ˆ216.42691.008106PDI 回归方程:PCEtt (32.69425) (0.015033) t =(-6.619723) (67.05920) R=0.9955 F=4496.936 2第二个模型回归的估计结果如下, Dependent Variable: PCE Method: Least Squares Date: 07/27/05 Time: 21:51 Sample (adjusted): 1971 1987 Included observations: 17 after adjustments Variable Coefficient Std. Error t-Statistic C -233.2736 45.55736 -5.120436 PDI 0.982382 0.140928 6.970817 PCE(-1) 0.037158 0.144026 0.257997 R-squared 0.996542 Mean dependent var Adjusted R-squared 0.996048 S.D. dependent var S.E. of regression 18.47783 Akaike info criterion Sum squared resid 4780.022 Schwarz criterion Log likelihood -72.05335 F-statistic Durbin-Watson stat 1.570195 Prob(F-statistic) Prob. 0.0002 0.0000 0.8002 1982.876 293.9125 8.829805 8.976843 2017.0 0.000000 ˆ233.27360.9824PDI0.0372PCE 回归方程:PCEttt1 (45.557) (0.1409) (0.1440) t = (-5.120) (6.9708) (0.258) R2=0.9965 F=2017.0 2)从模型一得到MPC=1.008;从模型二得到,短期MPC=0.9824,由于模型二为自回归模型,要先转换为分布滞后模型才能得到长期边际消费倾向,我们可以从库伊克变换倒推得到长期MPC=0.9824/(1+0.0372)=0.9472。 7.2 表7.12中给出了某地区1980-2001年固定资产投资Y与销售额X的资料。 表7.12 某地区1980-2001年固定资产投资Y与销售额X的资料(单位:亿元) 年份 1980 1981 1982 1983 1984 1985 1986 1987 1988 19 1990 Y 36.99 33.60 35.42 42.35 52.48 53.66 58.53 67.48 78.13 95.13 112.60 X 52.805 55.906 63.027 72.931 84.790 86.5 98.797 113.201 126.905 143.936 154.391 年份 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 Y 128.68 123.97 117.35 139.61 152.88 137.95 141.06 163.45 183.80 192.61 182.81 X 168.129 163.351 172.547 190.682 194.538 194.657 206.326 223.541 232.724 239.459 235.142 运用局部调整假定或自适应预期假定估计以下模型参数,并解释模型的经济意义,探测模型扰动项的一阶自相关性: 1)设定模型 * YtXtut 其中Yt为预期最佳值。 2)设定模型 * YtXtet u* 其中Yt为预期最佳值。 3)设定模型 * YtXtut * 其中Xt为预期最佳值。 练习题7.2参考解答: 1)在局部调整假定下,先估计一阶自回归模型:Yt0Xt1Yt1ut回归的估计结果如下, Dependent Variable: Y Method: Least Squares Date: 25/02/10 Time: 22:42 Sample (adjusted): 1981 2001 Included observations: 21 after adjustments Variable C X Y(-1) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat ^***** Std. Error 4.729450 0.097819 0.114858 t-Statistic -3.193613 6.433031 2.365315 Prob. 0.0050 0.0000 0.0294 109.2167 51.78550 6.616515 6.765733 690.0561 0.000000 Coefficient -15.10403 0.629273 0.271676 0.987125 Mean dependent var 0.985695 S.D. dependent var 6.193728 Akaike info criterion 690.5208 Schwarz criterion -66.47341 F-statistic 1.518595 Prob(F-statistic) 回归方程:Yt15.104030.629273Xt0.271676Yt1 (4.729450) (0.097819) (0.114858) t = (-3.193613) (6.433031) (2.365315) R2=0.987125 F=690.0561 DW=1.518595 ****根据局部调整模型的参数关系,有 ,0, 11, utut 将上述估计结果代入得到: 11*10.2716760.728324 *0*20.7380 0.8001 故局部调整模型估计结果为:Y^*t20.73800.8001Xt 经济意义:该地区销售额每增加1亿元,未来预期最佳新增固定资产投资为0.8001亿元。 运用德宾h检验一阶自相关: dn121h(1)(11.518595)1.29728*221nVar(1)21-210.114858在显著性水平0.05上,查标准正态分布表得临界值h1.96,由于 2h1.29728h1.96,则接收原假设0,说明自回归模型不存 2在一阶自相关问题。 2)先对数变换模型,有lnYtlnlnXtut 在局部调整假定下,先估计一阶自回归模型:lnYt回归的估计结果如下, Dependent Variable: LNY Method: Least Squares Date: 25/02/10 Time: 22:55 Sample (adjusted): 1981 2001 Included observations: 21 after adjustments Variable C LNX LNY(-1) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Coefficient -1.078046 0.904522 0.260033 Std. Error 0.184144 0.111243 0.087799 t-Statistic -5.854366 8.131039 2.961684 Prob. 0.0000 0.0000 0.0084 4.559823 0.562953 -3.145469 -2.996251 1425.219 **0lnXt1*lnYt1ut* * 0.993725 Mean dependent var 0.993028 S.D. dependent var 0.047007 Akaike info criterion 0.039774 Schwarz criterion 36.02742 F-statistic Durbin-Watson stat ^1.479333 Prob(F-statistic) 0.000000 回归方程:lnYt1.0780460.904522lnXt0.260033lnYt1 (0.184144) (0.111243) (0.087799) t = (-5.854366) (8.131039) (2.961684) R2=0.993725 F=1425.219 DW1=1.479333 根据局部调整模型的参数关系,有lnln,将上述估计结果代入得到: **0,1*1 11*10.2600330.739967 lnln**01.45688 1.22238 ^*故局部调整模型估计结果为:lnYt1.456881.22238lnXt,也即 Y0.232961Xt1.22238 经济意义:该地区销售额每增加1%,未来预期最佳新增固定资产投资为1.22238%。 运用德宾h检验一阶自相关: ^*tdn1.47933321h(1)(1)1.30313 *221nVar(1)21210.087799在显著性水平0.05上,查标准正态分布表得临界值h1.96,由于 2h1.30313h1.96,则接收原假设0,说明自回归模型不存在 2一阶自相关。 ****YXYut0t1t1t3)在自适应预期假定下,先估计一阶自回归模型: 回归的估计结果如下, Dependent Variable: Y Method: Least Squares Date: 25/02/10 Time: 22:42 Sample (adjusted): 1981 2001 Included observations: 21 after adjustments Variable C X Y(-1) R-squared Coefficient -15.10403 0.629273 0.271676 Std. Error 4.729450 0.097819 0.114858 t-Statistic -3.193613 6.433031 2.365315 Prob. 0.0050 0.0000 0.0294 109.2167 0.987125 Mean dependent var Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat ^0.985695 S.D. dependent var 6.193728 Akaike info criterion 690.5208 Schwarz criterion -66.47341 F-statistic 1.518595 Prob(F-statistic) 51.78550 6.616515 6.765733 690.0561 0.000000 回归方程:Yt15.104030.629273Xt0.271676Yt1 (4.729450) (0.097819) (0.114858) t = (-3.193613) (6.433031) (2.365315) R2=0.987125 F=690.0561 DW=1.518595 ****根据局部调整模型的参数关系,有 0 11 utut 将上述估计结果代入得到: 11*10.2716760.728324 *0*20.7380 0.8001 故局部调整模型估计结果为:Y^*t20.73800.8001Xt 经济意义:该地区销售额每增加1亿元,未来预期最佳新增固定资产投资为0.8001亿元。 运用德宾h检验一阶自相关: dn121h(1)(11.518595)1.29728在显著*221nVar(1)21-210.114858性水平 0.052上,查标准正态分布表得临界值h1.96,由于 2h1.29728h1.96,则接收原假设0,说明自回归模型不存在一阶自相关。 7.3 利用表7.12的数据,取阿尔蒙多项式的次数m=2,运用阿尔蒙多项式变换法估计分布滞后模型: Yt0Xt1Xt12Xt23Xt34Xt4ut 练习题7.3参考解答: 分布滞后模型:Yt0Xt1Xt1...4Xt4ut s=4,取m=2。 假设00,1012,202142,303192, 4041162 (*) 则模型可变为:Yt0Z0t1Z1t2Z2tut,其中: Z0tXtXt1Xt2Xt3Xt4Z1tXt12Xt23Xt34Xt4 Z2tXt14Xt29Xt316Xt4估计的回归结果如下, Dependent Variable: Y Method: Least Squares Date: 25/02/10 Time: 23:19 Sample (adjusted): 1984 2001 Included observations: 18 after adjustments Variable C Z0 Z1 Z2 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat ^ Std. Error 8.192884 0.174563 0.254447 0.062311 t-Statistic -4.332093 5.104248 -2.632783 1.675338 Prob. 0.0007 0.0002 0.0197 0.1160 121.2322 45.63348 6.688517 6.886378 299.7429 0.000000 Coefficient -35.49234 0.1012 -0.669904 0.104392 0.984670 Mean dependent var 0.981385 S.D. dependent var 6.226131 Akaike info criterion 542.7059 Schwarz criterion -56.19666 F-statistic 1.130400 Prob(F-statistic) 回归方程:Y35.492430.1012Z0t0.669904Z1t0.104392Z2t 35.49124,00.101,10.66990,20.10439 由(*)式可得, 00.101,10.32550,20.03123,30.17917,40.11833 由阿尔蒙多项式变换可得如下估计结果: ^Yt-35.49234 0.101Xt 0.32550Xt1-0.03123Xt2-0.17917Xt3-0.11833Xt4 7.4 表7.13中给出了1962-1995年某地区基本建设新增固定资产Y和全省工业总产值X按当年价格计算的历史资料。 表7.13 1962-1995年某地区基本建设新增固定资产Y和全省工业总产值X(单位:亿元) 年份 1962 1963 19 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 Y 0.94 1.69 1.78 1.84 4.36 7.02 5.55 6.93 7.17 2.33 2.18 2.39 3.3 5.24 5.39 1.78 0.73 X 4.95 6.63 8.51 9.37 11.23 11.34 19.9 29.49 36.83 21.19 18.14 19.69 23.88 29.65 40.94 33.08 20.3 年份 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 19 1990 1991 1992 1993 1994 1995 Y 2.06 7.93 8.01 6. 16 8.81 10.38 6.2 7.97 27.33 12.58 12.47 10.88 17.7 14.72 13.76 14.42 X 42.69 51.61 61.5 60.73 . 66.67 73.78 69.52 79. 92.45 102.94 105.62 104.88 113.3 127.13 141.44 173.75 *(1) 设定模型YtXtt 作局部调整假定,估计参数,并作解释。 * (2) 设定模型YtXtt 作自适应预期假定,估计参数,并作解释。 (3) 比较上述两种模型的设定及拟合情况,你觉得哪一个模型较好,为什么? 练习题7.4参考解答: 1)在局部调整假定下,先估计一阶自回归模型,Yt回归的估计结果如下, Dependent Variable: Y Method: Least Squares Date: 07/27/05 Time: 22:31 Sample (adjusted): 1963 1995 Included observations: 33 after adjustments Variable C X Y(-1) R-squared Adjusted R-squared Coefficient 1.65 0.102199 0.014700 Std. Error 1.167127 0.024782 0.182865 t-Statistic 1.625055 4.123961 0.0803 Prob. 0.1146 0.0003 0.9365 7.804242 5.8686 **0Xt1*Yt1ut* 0.584750 Mean dependent var 0.557066 S.D. dependent var S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat ^3.919779 Akaike info criterion 460.9399 Schwarz criterion -90.33151 F-statistic 1.901308 Prob(F-statistic) 5.6555 5.792502 21.12278 0.000002 回归方程:Yt1.660.1022Xt0.0147Yt1 (1.167)(0.0248) (0.182865) t =(1.625)(4.1239) (0.0803) R2=0.584750 F=21.12278 可以看出,Xt的回归系数显著,而Yt1的回归系数不显著,R2不是很高,模型整体上对样本数据拟合一般。 ****根据局部调整模型的参数关系,有,0,11,tt,将上述估计结果 代入得到:0.9853,0.1037,1.9249 *故局部调整模型为:Yt1.92490.1037Xtt 经济意义:为了达到全省工业总产值的计划值,寻求一个未来预期新增固定资产的最佳量。全省工业总产值每计划增加1(亿元),则未来预期最佳新增固定资产量为0.1037亿元。 ****2)在自适应预期假定下,先估计一阶自回归模型,Yt0Xt1Yt1ut 回归的估计结果如下, Dependent Variable: Y Method: Least Squares Date: 07/27/05 Time: 22:31 Sample (adjusted): 1963 1995 Included observations: 33 after adjustments Variable C X Y(-1) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient 1.65 0.102199 0.014700 Std. Error 1.167127 0.024782 0.182865 t-Statistic 1.625055 4.123961 0.0803 Prob. 0.1146 0.0003 0.9365 7.804242 5.8686 5.6555 5.792502 21.12278 0.000002 0.584750 Mean dependent var 0.557066 S.D. dependent var 3.919779 Akaike info criterion 460.9399 Schwarz criterion -90.33151 F-statistic 1.901308 Prob(F-statistic) 回归方程:Yt1.660.1022Xt0.0147Yt1 (1.167)(0.0248) (0.182865) t =(1.625)(4.1239) (0.0803) R2=0.584750 F=21.12278 可以看出,Xt的回归系数显著,而Yt1的回归系数不显著,R2不是很高,模型整体上对样本数据拟合一般。 ****根据自适应模型的参数关系,有,0,11,tt(1)t1,代入得 ^到:0.9853,0.1037,1.9249 *故局部调整模型为:Yt1.92490.1037Xtut 经济意义:新增固定资产的变化取决于全省工业总产值的预期值。全省工业总产值每预期增加增加1(亿元),当期新增固定资产量为0.1037(亿元)。 3)局部调整模型和自适应模型的区别在于:局部调整模型是对应变量的局部调整而得到的;而自适应模型是由解释变量的自适应过程而得到的。由回归结果可见,Y滞后一期的回归系数并不显著,说明两个模型的设定都不合理。 7.5 表7.14给出某地区各年末货币流通量Y,社会商品零售额X1、城乡居民储蓄余额X 2的数据。 表7.14 某地区年末货币流通量、社会商品零售额、城乡居民储蓄余额数据(单位:亿元) 城乡居民年末货币年份 流通量Y 售额X1 蓄余额X2 社会商品零城乡居民储年份 流通量Y 售额X1 X2 1953 1954 1955 1956 1957 1958 1959 1960 1961 10518 14088 13375 18354 16867 18515 22558 29036 41472 78676 101433 1039 124525 1267 134446 154961 170370 149182 4163 4888 56 7406 9156 10193 13939 15495 12553 1970 1971 1972 1973 1974 1975 1976 1977 1978 38500 47100 57200 60000 62500 500 68000 63000 66000 240332 274534 299197 314006 3154 336015 352924 378115 415830 26156 30944 35961 39667 43320 46184 48311 53313 61290 年末货币社会商品零储蓄余额1962 1963 19 1965 1966 1967 1968 34826 30000 24300 29300 33900 36100 39600 1545 142548 143415 156998 176387 178162 167074 10080 11602 15031 17108 19301 20485 22572 1979 1980 1981 1982 1983 1984 1985 76000 85000 90000 101000 100000 160000 192000 452032 512543 547956 591088 27 733162 919045 70033 92800 109707 133799 1314 201199 277185 *利用表中数据设定模型:Yt1X1t2X2tt 12 Yt*X1tX2te*ut 其中,Yt为长期(或所需求的)货币流通量。试根据局部调整假设,作模型变换,估计并检验参数,对参数经济意义做出解释。 练习题7.5参考解答: *****1)在局部调整假定下,先估计一阶自回归模型:Yt 0X1t1X2t2Yt1ut 回归的估计结果如下: Dependent Variable: Y Method: Least Squares Date: 26/02/10 Time: 15:56 Sample (adjusted): 1954 1985 Included observations: 32 after adjustments Variable C X1 X2 Y(-1) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat ^ Coefficient 6596.228 0.047451 0.274838 0.405275 Std. Error 4344.078 0.039610 0.090534 0.187220 t-Statistic 1.518442 1.197940 3.035736 2.1699 Prob. 0.1401 0.2410 0.0051 0.0391 55355.97 404.90 20.85375 21.03697 275.6267 0.000000 0.967247 Mean dependent var 0.963738 S.D. dependent var 7705.604 Akaike info criterion 1.66E+09 Schwarz criterion -329.6600 F-statistic 2.109534 Prob(F-statistic) 回归方程:Yt6596.228 0.047451X1t0.274838X2t0.405275Yt1 (4344.078) (0.039610) (0.090534) (0.187220) t = (1.518442) (1.197940) (3.035736) (2.1699) R2=0.967247 F=275.6267 DW=2.109534 ****根据局部调整模型的参数关系,有lnln, 00 ,11 ,21 将上述估计结果代入得到: ˆlnY* *lnX*lnX*lnY1*10.4052750.594725 lnY2tt01t12t2t1^0*1**11091.2236700.07978 10.462126 故局部调整模型估计结果为: ^*tY11091.22367 0.07978X1t0.462126X2t 经济意义:在其他条件不变的情况下,该地区社会商品零售额每增加1亿元,则预期年末货币流通量增加0.07978亿元。同样,在其他条件不变的情况下,该地区城乡居民储蓄余额每增加1亿元,则预期年末货币流通量增加0.462126亿元。 2)先对数变换模型形式,lnYt*ln1lnX1t2lnX2tut 在局部调整假定下,先估计一阶自回归模型: **lnYt* 0lnX1t1*lnX2t2lnYt1ut* 回归的估计结果如下: Dependent Variable: LNY Method: Least Squares Date: 26/02/10 Time: 16:12 Sample (adjusted): 1954 1985 Included observations: 32 after adjustments Variable C LNX1 LNX2 LNY(-1) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat ^ Std. Error 1.677888 0.255557 0.154913 0.109260 t-Statistic 0.384014 0.806984 1.163031 4.8049 Prob. 0.7039 0.4265 0.2546 0.0000 10.70088 0.672279 -1.210486 -1.027269 291.3458 0.000000 Coefficient 0.4333 0.206230 0.180168 0.531445 0.9659 Mean dependent var 0.965633 S.D. dependent var 0.124629 Akaike info criterion 0.434905 Schwarz criterion 23.36778 F-statistic 1.914829 Prob(F-statistic) 回归方程:lnYt0.4333 0.20623lnX1t0.180168lnX2t0.531445lnYt1 (1.677888) (0.255557) (0.154913) (0.531445) t = (0.384014) (0.806984) (1.163013) (4.8049) R2=0.9659 F=291.3458 DW=1.914829 ****根据局部调整模型的参数关系,有lnln ,00 ,11 ,21 将上述估计结果代入得到: *1210.5314450.468555 lnln*0*1*1.37514900.44014 10.384518 故局部调整模型估计结果为: lnYt*1.375149 0.44014lnX1t0.384518lnX2t 经济意义:货币需求对社会商品零售额的长期弹性为:0.44104;货币需求对城乡居民储蓄 余额的长期弹性为0.384518。 **7.6 设 Mt1Yt2Rtt ^其中:M为实际货币流通量,Y*为期望社会商品零售总额,R*为期望储蓄总额,对于期望 **值作如下假定: Yt1Yt(11)Yt1 * Rt2Rt(12)Rt1 其中1,2为期望系数,均为小于1的正数。 (1) 如何利用可观测的量来表示Mt? (2) 分析这样变换存在什么问题? (3) 利用7.5题的数据进行回归,估计模型,并作检验。 练习题7.6参考解答: 1)首先将M滞后一期并乘上(11)得到 *(11)Mt1(11)(11)1Yt*(1)R112t1t1 再将原始方程减去该方程,得到 Mt(11)Mt1111Yt2[Rt*(11)Rt*1]t(11)t1111Yt2[Rt*(1221)Rt*1]t(11)t1111Yt2[Rt*(12)Rt*1(12)Rt*1]t(11)t1111Yt2[Rt*(12)Rt*1]2(12)Rt*1t(11)t1111Yt22Rt2(12)Rt*1t(11)t1Mt(11)Mt1111Yt22Rt2(12)Rt*1t(11)t1(1)Mt1(11)Mt2111Yt122Rt12(12)Rt*2t1(11)t2(12)[Mt1(11)Mt2](12)1(12)11Yt1(12)22Rt12(12)(12)Rt*2(12)[t1(11)t2](2)(1)-(2) 于是Mt可表示为: Mt1211[Yt(12)Yt1]22[Rt(11)Rt1](21)Mt1(11)(12)Mt2t(212)t1(11)(12)t2 () *2)从上面的变化中可看出,随机扰动项变为tt(212)t1(11)(12)t2, 这就可能导致出现随机扰动项的自相关,进而导致估计出来的结果是有偏的,而且不是一致估计。 3)对()回归的估计结果如下, Dependent Variable: MT Method: Least Squares Date: 07/26/05 Time: 00:18 Sample(adjusted): 1955 1985 Included observations: 31 after adjusting endpoints Variable C Y Y(-1) R R(-1) MT(-1) MT(-2) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Coefficient 9266.4908 0.1323 -0.1284 -0.3957 0.9533 0.4729 -0.0550 Std. Error 4918.1374 0.1096 0.1236 0.4883 0.6612 0.2361 0.2883 t-Statistic 1.8841 1.2068 -1.03 -0.8104 1.4416 2.0028 -0.1908 Prob. 0.0717 0.2392 0.3091 0.4256 0.1623 0.0566 0.8502 56687.1935 40415.2055 20.9909 21.3147 125.7918 0.9691 Mean dependent var 0.9614 S.D. dependent var 7932.428 Akaike info criterion 1510162034 Schwarz criterion -318.3602 F-statistic Durbin-Watson stat 2.1446 Prob(F-statistic) 0 回归方程: Mt9266.49080.1323Yt0.1284Yt10.3957Rt0.9533Rt10.4729Mt10.0550Mt2 可以看到,只有Mt1的回归系数在10% 的显著性水平下是显著的,其他回归系数均不显著;F统计量较大,方程整体显著;R2较高,模型整体上对样本数据拟合较好。 7.7 考虑如下回归模型: ^ˆ30120.1408X0.2306XYttt1t(-6.27) (2.6) (4.26)R20.727其中,y为通货膨胀率,x为生产设备使用率。 1) 生产设备使用率对通货膨胀率的短期影响和总的影响分别是多大? 2) 如果库伊克模型为Ytb1b2Xtb3Yt1t,你怎样得到生产设备使用率对通货膨胀率的短期影响和长期影响? 练习题7.7参考解答: 1)该模型为有限分布滞后模型,故生产设备使用率对通货膨胀的短期影响为0.1408,总的影响为0.1408+0.2306=0.3714。 2)利用工具变量法,用 ˆYt1来代替 Yt1进行估计,则库伊克模型变换为 ˆaˆu。若原先有Yˆ1aˆ2Xtaˆ3Xt1,则需估计的模型为 Ytb1b2Xtb3Ytt1tˆ1(b2aˆ2)Xt(b3aˆ3)Xt1ut,所以生产设备使用率对通货膨胀的短期影响Ytb1a为b2 7.8 表7.15中给出了某地区消费总额Y和货币收入总额X的年度资料。 表7.15 某地区消费总额Y(亿元)和货币收入总额X(亿元)的年度资料(单位:亿元) 年份 1975 1976 1977 1978 X 103.169 115.07 132.21 156.574 Y 91.158 109.1 119.187 143.908 年份 1990 1991 1992 1993 X 215.539 220.391 235.483 280.975 Y 204.75 218.666 227.425 229.86 ˆ2a^,总的影响为b2ˆ2(b3aˆ3)。 a^^1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 19 166.091 155.099 138.175 146.936 157.7 179.797 195.779 194.858 1.179 199.963 205.717 155.192 148.673 151.288 148.1 156.777 168.475 174.737 182.802 180.13 190.444 196.9 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 292.339 278.116 292.654 341.442 401.141 458.567 500.915 450.939 626.709 783.953 0.637 244.23 258.363 275.248 299.277 345.47 406.119 462.223 492.662 539.046 617.568 727.397 分析该地区消费同收入的关系 1) 做Yt关于Xt的回归,对回归结果进行分析判断; 2) 建立适当的分布滞后模型,用库伊克变换转换为库伊克模型后进行估计,并对估计结果进行分析判断。 练习题7.8参考解答: 1)做Yt关于Xt的回归,回归的估计结果如下, Dependent Variable: Y Method: Least Squares Date: 05/03/10 Time: 15:24 Sample: 1975 2004 Included observations: 30 Variable C X R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat ^ Std. Error 7.945083 0.022840 t-Statistic 3.494733 35.36542 Coefficient 27.76594 0.807731 Prob. 0.0016 0.0000 262.1725 159.3349 9.257921 9.351334 1250.713 0.000000 0.978103 Mean dependent var 0.977321 S.D. dependent var 23.99515 Akaike info criterion 16121.49 Schwarz criterion -136.8688 F-statistic 1.280986 Prob(F-statistic) 回归方程:Yt27.76590.80773Xt (7.945) (0.02284) t =(3.9447) (35.365) R=0.978103 F=1250.713 2从回归结果来看,t检验值、F检验值及R2都显著,但在显著性水平0.05上,DW值 d1.28dl1.3,说明模型扰动项存在正自相关,需对模型进行修改。 2)事实上,当年消费不仅受当年收入的影响,而且还受过去各年收入水平的影响,因此,我们在上述模型中增添货币收入总额X的滞后变量进行分析。如前所述,对分布滞后模型直接进行估计会存在自由度损失和多重共线性等问题。在此,选择库伊克模型进行回归分析,即估计如下模型:Yt**0Xt1*Yt1ut* 回归的估计结果如下, Dependent Variable: Y Method: Least Squares Date: 05/03/10 Time: 15:31 Sample (adjusted): 1976 2004 Included observations: 29 after adjustments Variable C X Y(-1) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient -6.905686 0.251865 0.813628 Std. Error 4.179931 0.043638 0.062991 t-Statistic -1.652105 5.771717 12.91657 Prob. 0.1105 0.0000 0.0000 268.0696 158.7886 7.334900 7.476344 4323.744 0.000000 0.997002 Mean dependent var 0.996772 S.D. dependent var 9.021969 Akaike info criterion 2116.294 Schwarz criterion -103.3560 F-statistic 1.215935 Prob(F-statistic) 2 回归结果显示,t检验值、F检验值及R都显著,但 dn129h(1)(11.215935)2.2442 2ˆ*)21nVar(21290.062911在显著性水平0.05上,查标准正态分布表得临界值h1.96,由于 2h2.2442h1.96,则拒绝原假设0,说明自回归模型存在一阶自相关,需对 2模型作进一步修改。 (3)采用广义差分法
dU, 因此无自相关。
采用广义差分法
et= 0.4002 et-1
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- fenyunshixun.cn 版权所有 湘ICP备2023022495号-9
违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务