1、什么是计量经济学的研究对象,一般性定义、
定义:计量经济学是以经济理论为指导,以经济数据事实为依据,以数学、统计学为方法,以计算机为手段,研究经济关系和经济活动数量规律及其应用,并以建立计量经济模型为核心的一门经济学学科。 计量经济学研究的三个方面:
理论:即说明所研究对象经济行为的经济理论——计量经济研究的基础
数据:对所研究对象经济行为观测所得到的信息——计量经济研究的原料或依据 方法:模型的方法与估计、检验、分析的方法——计量经济研究的工具与手段 2、计量经济学的研究的步骤:
研究的步骤:1、模型设定(选择变量和数学关系式)2、估计参数(确定变量间的数量关系) 3、模型检验(检验所得结论的可靠性)4、模型应用(作经济分析和经济预测) 3、模型如何设定:
基本要素:1、经济变量:不同时间、不同空间的表现不同,取值不同,是可以观测的因素。是模型的研究对象或影响因素。2、经济参数:表现经济变量相互依存程度的、决定经济结构和特征的、相对稳定的因素,通常不能直接观测。
基本要求:1、要有科学的理论依据2、选择适当的数学形式类型:(单一方程、联立方程、线性形式、非线性形式)3、模型要兼顾真实性和实用性(两种不好的模型:太过复杂—真实但不实用、过分简单—不真实)4、包含随机误差项(经济模型与计量经济模型的重要区别)5、方程中的变量要具有可观测性 4、参数如何估计:
原因:一般来说参数是未知的,又是不可直接观测的。由于随机项的存在,参数也不能通过变量值去精确计算。只能通过变量样本观测值选择适当方法去估计。
两个概念:1、参数估计值:估计参数具体数值2、参数估计式:估计参数数值公式 参数估计的常用方法:普通最小二乘、广义最小二乘、极大似然估计、二段最小二乘、三段最小二乘、其它估计方法。 5、如何检验模型:
原因:1、建模理论依据可能不充分2、统计数据或其他信息可能不可靠3、样本较小,结论只是抽样某种偶然结果4、可能违反计量经济方法某些基本假定。
方式:1、经济意义检验(所估计的模型与经济理论是否相符)2、统计推断检验(检验参数估计值是否抽样偶然结果)3、计量经济学检验(是否符合计基本假定)4、预测检验(将模型预测的结果与经济运行的实际对比) 6、模型如何应用
用途: 1、经济结构分析:对所研究的经济关系进行定量的考察,以说明经济变量之间的数量比例关系2、经济预测:由已知的或预先测定的解释变量,去预测被解释变量所在观测的样本数据以外的数值 3、评价:用模型对方案作模拟测算,对方案作评价 4、检验发展经济理论: 去验证既有经济理论或者提出新的理论结论。 7、计量经济学模型中的数据,会举例。
变量的分类:1、因果关系区分:1)被解释变量(应变量):要分析研究变量2)解释变量(自变量):说明应变量变动主要原因变量(非主要原因归入随机误差项)2、性质区分:1)内生变量:其数值由模型所决定的变量,是模型求解的结果2)外生变量:其数值由模型以外决定的变量(注:外生变量数值的变化能够影响内生变量的变化,内生变量却不能反过来影响外生变量)
1
数据的类型:1、时间数列数据(同一空间、不同时间)2、截面数据(同一时间、不同空间)3、混合数据(面板数据、Panel Data)4、虚拟变量数据 8、参数的估计方法分类
1)单一方程模型:最常用的是普通最小二乘法、极大似然估计法等 2)联立方程模型:常用二段最小二乘法和三段最小二乘法等 3)准则:符合“尽可能地接近总体参数真实值”。无偏性、最小方差性、一致性。
第二章:
1、什么叫相关分析,回归分析,关系
相关分析:相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。
回归分析:是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,其目的(实质):由固定的解释变量去估计因变量的平均值。
相同点:
1)都是对存在相关关系的变量的统计相关关系的研究; 2)都能测度线性相关程度的大小;
3)都能判断线性相关关系是正相关还是负相关。 不同点:
1)相关分析是从统计数据上测度变量之间的相关程度,不考虑两者之间是否存在因果关系,因而变量的地位在相关分析中是对等的;回归分析是对变量之间的因果关系的分析,地位是不对等的,有被解释变量和解释变量之分。
2)相关分析假定所有变量均为随机变量;回归分析通常假定解释变量是确定的,是非随机变量,被解释变量是随机变量。
3)相关分析主要关注变量之间的相关程度和性质,不关注变量之间的具体依赖关系。回归分析在关注变量之间的相关程度和性质的同时,更关注变量之间的具体依赖关系,因而可以深入分析变量间的依存关系,有可能达到掌握其内在规律的目的,具有更重要的实践意义。
2、什么是可决系数,相关系数,关系
相关系数:度量两个变量之间的线性相关程度的简单相关系数(简称相关系数)
可决系数:回归平方和在总变差中所占的比重。可决系数可以作为综合度量回归模型对样本观测值拟合优度的度量指标。
异同(关系):在数值上而言决定系数是相关系数的平方。不同:1)可决系数是度量回归模型对样本观测值得拟合程度,也就是解释变量对于被解释变量变差的解释。相关系数是对于两个变量而言,说明两个变量的线性依存度。2)可决系数度量的是解释变量与被解释变量不对称的因果关系,并不说明Y对X的解释。相关系数度量的是X与Y对称的相关关系,不涉及X与Y具体的因果关系。3)可决系数可以取负值。 3、什么是总体回归函数,样本回归函数,关系
回归线:对于每一个X的取值,都有Y的条件期望E(Y|X)与之对应,代表这些Y的条
2
件期望的点的轨迹所形成的直线或曲线。
回归函数:因变量Y的条件期望E(Y|Xi)随解释变量X的变化而有规律的变化,如果把 Y的条件期望E(Y|Xi)表现为X的某种函数:
E(YXi)f(Xi).
回归函数分类:总体回归函数和样本回归函数 4、什么是总体回归函数(PRF)
定义:假如已知所研究的经济现象的总体因变量Y和解释变量X的每个观测值,可以计
算出总体因变量Y的条件均值E(Y|Xi),并表现为X的某种函数:
E(YXi)f(Xi)
表现形式:(1)条件均值表现形式:假如Y的条件均值E(Y|Xi)是解释变量X的线性函数,可表示为:
.(2)个别值表现形式:对于一定的Xi,Y的各个
别值Yi分布在E(Y|Xi)的周围,若各个Yi与条件均值E(Y|Xi)的偏差为ui,显然ui是随机变
量,则有:
如何理解:实际的经济研究中总体回归函数通常是未知的,只能根据经济理论和实践经验去设定。“计量”的目的就是寻求PRF。总体回归函数中 与 的关系可是线性的,也可是非线性的。
线性的判断:线性回归模型的“线性”有两种解释: 1)就变量而言是线性的:Y的条件均值是X的线性函数
2)就参数而言是线性的:Y的条件均值是参数贝塔
的线性函数
计量经济学中,线性回归模型主要指就参数而言是“线性”,因为只要对参数而言是线性的,都可以用类似的方法估计其参数。 5、样本回归函数(SRF)
样本回归线:对于X的一定值,取得Y的样本观测值,可计算其条件均值,样本观测值条件均值的轨迹称为样本回归线。
样本回归函数:如果把因变量Y的样本条件均值表示为解释变量的某种函数,这个函数称为样本回归函数(SRF)。
特点:每次抽样都能获得一个样本,就可以拟合一条样本回归线,所以样本回归线随抽样波动而变化,可以有许多条(SRF不唯一)。
7、样本回归函数与总体回归函数的区别
1、总体回归函数未知,但是确定的;样本回归线却是随抽样波动而变化。样本回归线只是未知总体回归线近似反映。2、总体回归函数参数1和2是确定常数;而样本回归函数的参数
和
是随抽样而变化的随机变量。3、总体回归函数中ui是不可直接观测
的;而样本回归函数中ei是只要估计出样本回归的参数就可以计算的数值。
3
8、为什么引入随机扰动项。
定义:各个Yi值与条件均值E(Y|Xi)的偏差ui代表排除在模型以外所有因素对Y影响 性质:ui是期望为0有一定分布的随机变量
重要性:随机扰动项的性质决定着计量经济方法的选择
原因:1、未知影响因素的代表2、无法取得数据的已知影响因素的代表3、众多细小影响因素的综合代表4、模型的设定误差5、变量的观测误差6、变量内在随机性 9、简单线性回归的5个基本假定(P67为主)
原因:1、模型中有随机扰动,估计的参数是随机变量,只有对随机扰动的分布作出假定,才能确定估计参数的分布性质,才可能进行假设检验和区间估计2、具备一定的假定条件,所作出的估计才具有较好的统计性质。
内容:
1、对模型和变量的假定:1、假定解释变量X是非随机的,或者虽然是随机的,但与扰动项u不相关2、假定解释变量X在重复抽样中为固定值3、假定模型中的变量没有测量误差4、假定变量和模型无设定误差
2、对随机扰动项u的假定(高斯假定、古典假定):1)零均值假定:在给定Xi的条件下 ,ui的条件期望为零,即差为某个常数,即ui的逐次值互不相关,即
4)外生性假定:随机扰动ui与解释变量Xi不相关,即
5)正态性假定:假定ui服从均值为零、方差为的正态分布,即
2
E(uiXi)02)同方差假定:在给定Xi的条件下,ui的条件方
3)无自相关假定:随机扰动项
2
ui~N(0,2)
总结:满足以上古典假定的线性回归模型,也称为古典线性回归模型(CLRM)
10、普通最小二乘(OLS)的基本思想
ˆ也不同。 1、不同的估计方法可得到不同的样本回归参数和,所估计的Yiˆ的差,即剩余ei越小越好 2、理想的估计方法应使Yi与Yie3、因i可正可负,所以可以取ei最小.即
2
11、基本方程组:
4
根据克莱姆法则:
进一步简洁:用离差形式OLS估计式为:
证明如下:1、先将xi与xiyi的分解开,发现均是除以n的相同式子,得证。
,得证。
样本回归函数的离差形式:
12、OLS的回归线的性质
ˆ2xi yˆi
证明如下:
5
13、参数估计量的统计特征
参数估计式的统计特征:1、无偏性(前提:重复抽样中估计方法固定、样本数不变、经重复抽样的观测值,可得一系列参数估计值,得到
,则为无偏)2、有效
性(前提:样本相同、用不同的方法估计参数,可以找到若干个不同的估计式,目的:努力寻求其抽样分布具有最小方差的估计式。)3、一致性(当样本容量n趋于无穷大时,如
6
ˆ依概率收敛于总体参数的真实值,即果估计式)
注:既是无偏同时又具有最小方差的估计式,称最佳无偏估计式,或称为有效估计式
14、OLS统计量的统计特征(高斯马尔科夫定理),线性,无偏的证明,有效性的公式
1、OLS统计量的统计特征:
ˆk是Y的线性函数:1)线性特征:
2)无偏特性
ˆk)kE(3)最小方差特性:
证明如下:(1)线性证明:
(2)无偏特性证明:
2)有效性的公式:
3)高斯—马尔可夫定理:
定义:在给定经典线性回归的假定下,最小二乘估计量是具有最小方差的线性无偏估计量(BLUE)。即:普通最小二乘估计量称为最佳线性无偏估计量。 15、总变差的分解,TSS,ESS,RSS的含义,可决系数
拟合优度:样本回归线对样本观测数据拟合的优劣程度,拟合优度的度量建立在对总变差分解的基础上。
总变差的分解:TSS=ESS+RSS
7
ESS:RSS:TSS: 可决系数:
是样本估计值与其平均值的回归平方和 是样本观测值与其估计值的残差平方和 是样本观测值与其平均值的总离差平方和
表示。
定义:回归平方和(ESS)在总变差(TSS)中占比重称为可决系数,用
作用:可决系数越大,模型拟合优度越好
注意点: 1、可决系数只是说明列入模型的所有解释变量对因变量的联合的影响程度,不说明模型中每个解释变量的影响程度(在多元中)2、回归的主要目的如果是经济结构分析,不能只追求高的可决系数,而是要得到总体回归系数可信的估计量,可决系数高并不表示每个回归系数都可信任;3、如果建模的目的只是为了预测因变量值,不是为了正确估计回归系数,一般可考虑有较高的可决系数 16、OLS估计的分布性质。
OLS估计的性质:
服从分布:
17、回归系数的假设检验(t检验) 原因:回归系数都是通过样本估计,随抽样而变动的随机变量,需要检验其可靠程度
方式:针对变量的参数真值是否为零来进行显著性检验的。 检验方法:1)t检验
2)P 值(P值检验是比较和 p,就是t*出现的概率比较)
规则:当p<时,p值越小,越可以拒绝原假设
18、平均值的预测和个别值的预测的区别,区间大小
区别:平均值的预测值与真实平均值有误差,主要是受抽样波动影响。个别值的预测值与真实个别值的差异, 受抽样波动影响外,还受随机扰动项的影响,即对个别值预测的置信区间比对平均值预测的置信区间更宽。
8
19、案例分析,X,Y,从多个角度回答。练习2.3、2.5
练习2.3 第三章
1、矩阵形式表达,X,Y意义,古典假定
矩阵形式:
古典假定: 1) 零均值假定:
2) 同方差和无自相关假定:
3) 随机扰动项与解释变量不相关:
4) 无多重共线性假定(多元中增加的):即假定各解释变量之间不存在线性关系,解释
变量观测值之间线性无关。解释变量观测值矩阵X的秩为K(注意X为n行K列) 5) 正态性假定:
2、OLS的必要条件,参数向量3.26、3.27、3.28。
9
计算过程如下:
3、OLS的统计性质(3.30的证明)
ˆˆ=(XX)-1XY-1ββ1)线性特性:,是Y线性函数,因(XX)X是非随机或定值矩阵。
ˆ)E(KK,
10
2)无偏特性
3)最小方差特性:OLS估计具有最小方差。
结论:在古典假定下,多元线性回归的 OLS估计式是最佳线性无偏估计式(BLUE) 4、OLS的分布性质(3.31证明)
ˆˆ1、β的期望E(β)=β,
证明:
5、随机扰动项的估计(3.35证明,卧槽,P93,一页纸的证明,你敢信!考了就写不会!)
6、多重可决系数,为什么要引入修正的可决系数。3.48
多重可决系数:在多元回归模型中,由各个解释变量联合起来解释了的Y的变差,在Y的总变差中占的比重,用R2表示。用矩阵可表示为:
引入修正的可决系数的原因: 多重可决系数的一个重要性质是模型中间解释变量个数的不减函数,也就是说样本容量不变时,随着模型中解释变量的增大,可决系数会增大,可决系数只考虑了变差,没有考虑自由度。因此可以用自由度去修正多重可决系数中的残差平方和与回归平方和,从而引入修正的可决系数。
多元回归中TSS自由度为n-1,ESS自由度为K-1,RSS自由度为n-k。一元回归中,k=2.
11
7、F检验,3.49、3.50证明
1)F检验:原假设: H0:23k0,备择假设: 不全为0
计算的F值大于临界值,则拒绝原假设,即所有解释变量联合起来对Y确有显著影响。 2)在一元回归情况下F检验等于t统计量的平方。
8、F统计量与可决系数的关系,(与修正的可决系数的关系根本没有这样的知识点==!)
(1)F检验和拟合优度检验都是针对方程整体。F检验比可决系数具有更强的适用性。 (2)F检验和拟合优度检验都是建立在把总变差TSS分解为ESS和RSS基础上的。 (3)一般来说,模型的可决系数越大,F统计量就越大 (4)与可决系数与修正的可决系数的数量关系为:
,
9、Bj=0的t检验。(P78)
10、案例分析中的模型检验分析。 11、思考题3.1、3.7、(3.8?)、练习题3.4、3.5 思考题:
3.1若要将一个被解释变量对两个解释变量作线性回归分析:
1)写出总体回归函数和样本回归函数; 2)写出回归模型的矩阵表示; 3)说明对此模型的古典假定;
4)写出回归系数及随机扰动项方差的最小二乘估计式,并说明参数估计式的性质。 答:
ˆXβˆX ˆβˆ1)总体回归函数:Y1β2X2β3X3u,样本回归函数:Y1223312
Y11X21Y1X2222)写出回归模型的矩阵表示:
Yn1X2nX31Xk1β1u1βuX32Xk222
X3nXknβkun3)此模型的古典假定:零均值假定;同方差和无自相关假定;随机扰动项与解释变量不相关;无多重共线性假定;随机误差项服从正态分布。
4)回归系数最小二乘估计式:
ˆ随机扰动项方差的最小二乘估计式:σ22eink
参数估计式的性质:具有线性性、无偏性和最小方差性。
3.7试证明:在二元线性回归模型Y1β2X2β3X3u中,当X2和X3相互时,
对斜率系数2和3的OLS估计值。等于Y分对X2和X3作简单线性回归时斜率系数的OLS估计值。
答:二元线性回归模型的回归系数2和3最小二乘估计式:
而当X2和X3相互时,X2和X3的斜方差等于零,即:
将
(xx)0代入ˆ232ˆ式中,可得: 和3
所以,当X2和X3相互时,对斜率系数2和3的OLS估计值。等于Y分对X2和
X3作简单线性回归时斜率系数的OLS估计值。
13
习题3.4
:
1ˆ-β-2.755367-0β1.由t=11,可知对于C,t==-4.3047228 ˆ0.008SE(β)ˆ)=对于lnX2,SE(β20.451234-00.627133-0=0.142128,对于lnX3,t==3.88159
3.1748310.161566对于X4,Coefficient=0.0055×1.795567=0.010136
30-1n-12(1-0.987591)2.修正的可决系数R=1-=1-=0.986159 (1-R)30-4n-k23.S.E.of regression=RSS0.662904==0.1596756 n-k30-4ESS4.F=TSSk-1 其中,R2=ESS/TSS=1-RSS/TSS=0.987591,RSS=0.662904 n-k52.758324-1=8.55912 所以,TSS=53.42123,ESS=52.75832。F=53.4212330-43.5
(1)由TSS的自由度为n-1=19,可知n=20,ESS的自由度为n-k=20-3=17, RSS的自由度为k-1=3-1=2 (2)R=
2
ESS377067.19==0.44467 TSS377067.19+4705 R=1-
2n-119(1-R2)1-0.44467)=1-(=0.37933 n-k17n-kR2170.44467(3)F==6.806214,F0.05(2,17)=3.59<F=6.806214 2=
k-11-R21-0.44467结论:模型对样本拟合不是很好
模型中解释变量X2,X3联合起来对商品需求量Y的影响显著,但不能判断两个解释变量各自对需求量Y是否有显著影响。 第四章
1、什么是多重共线性,原因,后果,如何检验。
含义:在计量经济学中所谓的多重共线性,不仅包括完全的多重共线性(X之间存在精确的线性关系),还包括不完全的多重共线性(X之间存在近似的线性关系)
对于解释变量
,如果存在不全为0的数
λλ...λ1,2,k,使得
14
则称解释变量之间存在着完全多重
共线性。
对于解释变量
,如果存在不全为0的数
λλ...λ1,2,k,使得
则称解释变量之间存在着不完全多重
共线性。
原因:1.经济变量之间具有共同变化趋势。2.在截面数据中,变量间从经济意义上具有密切的关联度。3.模型中包含滞后变量。4.样本数据自身的原因。
后果:1、完全多重共线性:参数估计值不确定,参数估计值的方差无限大 2、不完全多重共线性:参数估计值的方差和协方差增大、变量的显著性检验失去意义、区间估计和区间预测预测功能失效(变大的方差容易使区间预测的“区间”变大。)、参数估计量经济含义不合理(有可能方程整体估计显示可行(R2较高,F检验通过),但参数单独的t检验却可能为不显著。)
检验:1、简单相关系数2、方差膨胀因子3、直观判断4、逐步回归5、行列式。 1)简单相关系数:含义:简单相关系数检验法是利用解释变量之间的线性相关程度去判断是否存在严重多重共线性的一种简便方法。判断规则:一般而言,如果每两个解释变量的简单相关系数(零阶相关系数)比较高,则可认为存在着较严重的多重共线性。
2)方差扩大(膨胀)因子(VIF)法:判断规则:方差膨胀因子越大,表明解释变量之间的多重共性越严重。越接近于1,多重共线性越弱。方差膨胀因子≥10时,说明解释变量
与其余解释变量之间有严重的多重共线性,可能会影响最小二乘估计。
3)直观判断法:1、参数估计值有很大的偶然性。2、参数显著性检验未通过。3、经济意义检验未通过。4、相关系数大。
4)逐步回归检测法:将变量逐个的引入模型,每引入一个解释变量后,都要进行F检验,并对已经选入的解释变量逐个进行t 检验. 当原来引入的解释变量由于后面解释变量的引入而变得不再显著时,则将其剔除。因而也是一种补救多重共线性的有效方法。
ˆ)2Cov(β5)行列式检验法:
1(XX)|XX|
如何补救:
1、剔除变量法:(1)简单相关系数法下,选择相关系数较大的两个变量中相对不重要的变量进行剔除。(2)方差膨胀因子法下,首先剔除最大的方差膨胀因子对应的变量;如果仍存在多重共线性,剔除第二大的。要注意,如果去掉的是重要变量,通常会导致偏误。
2、增大样本容量:如果样本容量增加,会减小回归参数的方差,标准误差也同样会减小,但常面临许多实际困难。
3、变换模型形式 一般而言,差分后变量之间的相关性要比差分前弱得多,所以差分后的模型可能降低出现共线性的可能性,此时可直接估计差分方程。问题:差分会丢失一些信息,差分模型的误
15
差项可能存在序列相关,可能会违背经典线性回归模型的相关假设,在具体运用时要慎重。
4、利用约束条件(先验信息法):通过经济理论分析能够得到某些参数之间的关系,可以将这种关系作为约束条件,将此约束条件和样本信息结合起来进行约束最小二乘估计。
5、横截面数据与时序数据并用:首先利用横截面数据估计出部分参数,再利用时序数据估计出另外的部分参数,最后得到整个方程参数的估计。方法实用性较差。
6、变量变换:主要方法:(1)计算相对指标 (2)将名义数据转换为实际数据 (3)将小类指标合并成大类指标
7、逐步回归法:(1)用被解释变量对每一个所考虑的解释变量做简单回归。(2)以对被解释变量贡献最大的解释变量所对应的回归方程为基础,按对被解释变量贡献大小的顺序逐个引入其余的解释变量。
2、 案例分析
4、练习题4.1、4.2、4.5
4.1
(1)存在:
Σx3i)-(Σyix3i)(Σx2ix3i)ˆ(Σyix3i)(Σx2i)-(Σyix2i)(Σx2ix3i)ˆ=(Σyix2i)( ββ=23222222(Σx2i)(Σx3i)(Σ-x2ix3i)(Σx2i)(Σx3i)(Σ-x2ix3i)且rx2x3=0,则Σx2ix3i=0
22ΣyxΣyix3i(Σyx)(Σx)(Σyx)(Σxi2ii2i3ii3i2i)ˆˆ=ˆ=ˆ3 ˆα原式变形为:β====αβ=β2332222222(Σx2i)(Σx3i)Σx2i(Σx2i)(Σx3i)Σx3i22(2)会等于
(3)存在
σσˆ)=ˆ)=, 且rx2x3=0, var(βvar(β23Σx2i2(1-r2i3i)Σx3i2(1-r2i3i)22σσˆ)=ˆ)=ˆ3) ˆ2),var(αα变形为var(=var(=var(ββ2322Σx2iΣx3i224.2:
ˆ-ββ因为 t=11
ˆ)SE(β1所以 t(c)=
8.133ˆ)=1.059=6.2294 β=0.91177 , t(18.920.170.452ˆ)=0.121=0.111 =0.6848 , t(β30.661.09ˆ)=β t(22
R是0.95,说明模型对样本拟合较好。
F检验,F=107.37> F(3,23)=3.03,回归方程显著。
16
t检验,t统计量分别为0.91177,6.2294,0.6848,0.111,X2,X3对应的t统计量绝对值均小于t(23)=2.069,X2,X3系数不显著,可能存在多重共线性。
4.5
(1)不能,因为三个解释变量之间是线性关系,存在着多重共线性
ββ1,(2+β4),ββ(2)GDP=β1+(2+β4)Mt+(3-β4)Mt-1+ut,可得
(3)可得全部系数
(4)可得全部系数 第五章
1、什么是异方差,原因,后果,如何检验
1)同方差性:对所有的的观测值围绕回归线观测值的分散程度相同。
2)异方差性:设模型为于模型中随机误差项ui有:
把异方差看成是由于某个解释变量的变化而引起的
3)类型:(1)单调递增型:小,(3)复杂型:
有:
(β3-β4)
因为方差是度量被解释变量Y的分散程度,同方差性是所有
,如果对
则称具有异方差性。进一步,
。
随X的增大而减
随X的增大而增大,(2)单调递减型:
与X的变化呈复杂形式,图示如下:
4)原因:1、模型中省略了某些重要的解释变量2、模型的设定误差3、数据的测量误差4、截面数据中总体各单位的差异(截面数据较时间序列数据更容易产生异方差)
5)后果:1、对参数估计统计特性的影响:(1)无偏性仍然成立(参数估计的无偏性仅依赖于基本假定中的零均值假定(即
)。所以异方差的存在对无偏性的成立没有影响)
(2)不在具有最小方差性(同方差假定是OLS估计方差最小的前提条件,所以随机误差项是异方差时,将不能再保证最小二乘估计的方差最小。)(3)具有线性性(4)具有一致性。2、对参数显著性检验的影响:通常由OLS法得到的t统计量不再服从t分布,F统计量也不再服从F分布。t检验和F检验失去存在的基础,即用t和F统计量进行参数的显著性检验将失去意义。3、对预测的影响:尽管参数的OLS估计量仍然无偏,并且基于此的预测也是无偏的,但是由于参数估计量不是有效的,从而对Y的预测也将不是有效的。
17
6)检验:
1、图示检验法:1)相关图形分析(方差描述的是随机变量取值的(与其均值的)离散程度。因为被解释变量Y与随机误差项u有相同的方差,所以利用分析Y与X的相关图形,可以初略地看到Y的离散程度与X之间是否有相关关系。如果随着X的增加,Y的离散程度为逐渐增大(或减小)的变化趋势,则认为存在递增型(或递减型)的异方差)2)残差图形分析(设一元线性回归模型为:型为:
,得残差
运用OLS法估计,得样本回归模
,绘制出散点图,如果ei随X的变化而变
化,则存在异方差,如果ei不随X的变化而变化,则不存在异方差)
2、Goldfeld-Quanadt检验
作用:检验递增性(或递减性)异方差。
基本思想:将样本分为两部分;然后分别对两个样本进行回归;并通过计算两个子样的残差平方和的比来判断两子样的剩余平方和是否存在明显差异,以此为统计量来判断。
检验的前提条件 :1、要求检验使用的为大样本容量。2、其它假定均满足。
检验的特点:1、要求大样本2、异方差的表现既可为递增型,也可为递减型3、检验结果与选择数据删除的个数的大小有关4、只能判断异方差是否存在,在多个解释变量的情下,对哪一个变量引起异方差的判断存在局限
检验的具体做法:1.排序将解释变量的取值按从小到大排序。2.数据分组将排列在中间的约1/4的观察值删除掉,记为c,再将剩余的分为两个部分,每部分观察值的个数为(n-c)/2。3.提出假设:
,4.构造F统计量分
。
别对上述两个部分的观察值求回归模型,由此得到的两个部分的残差平方为
前者为前一部分样本回归产生的残差平方和,后者为后一部分样本回归产生的残差平方和。它们的自由度均为[(n-c)/2]-k,k为参数的个数。在原假设成立的条件下,自由度均是:[(n-c)/2]-k,服从卡方分布,可导出:(后者为子样观测数值相等公式)
5、判断:给定显著性水平a,查 F分布表得临界值
计算统计量F*.如果F*大
于临界值,则拒绝原假设,即模型中的随机误差存在异方差
3、White检验 基本思想:构造残差平方序列与解释变量之间的辅助函数,通过判断辅助函数的显著性来判断原方程是否存在异方差。一般而言,辅助回归的解释变量包括常数项、原模型中的解释变量、解释变量平方、其交叉乘积。
检验的特点:要求变量的取值为大样本,不仅能够检验异方差的存在性,同时在多变量的情况下,还能判断出是哪一个变量引起的异方差。
检验的基本步骤:以一个二元线性回归模型为例,设模型为并且,设异方差与
的一般关系为
18
,
,其中Vt为
随机误差项。1、求回归估计式并计算辅助函数:用残差平方作为异方差即
归函数的可决系数
:计算残差,并求残差的平方。2、求
的估计,并建立的辅助回归,
,3、计算:利用求回归估计式得到辅助回
,n为样本容量。4、提出假设:
5、
检验:在零假设成立下,有分布表得临界值
,如果
渐进服从自由度为5的卡方分布。给定显著性水平a ,查
,则拒绝原假设,表明存在异方差。
4、ARCH检验。(注:必须是时间序列数据)
检验的基本思想:在时间序列数据中,可认为存在的异方差性为ARCH过程,并通过检验这一过程是否成立去判断时间序列是否存在异方差。
检验的特点:变量的样本值为大样本;数据是时间序列数据;只能判断模型中是否存在异方差,而不能诊断出哪一个变量引起的异方差。
检验的步骤:
设ARCH 过程为:
,
,1、提出原假设:
2、参数估计并计算:对原模型作OLS估计,求出残差
,以分别作为对
,并计算残差平方序列
的估计。3、求辅助回归:
4、检验:计算辅助回归的可决系数
的乘积。在
H0成立时,基于大样本,成绩渐进服从卡方分布。给定显著性水平a,查卡方分布表得临界值,如果
,则拒绝原假设,表明模型中得随机误差存在异方差。
5、Glejser检验
检验的基本思想:由OLS法得到残差,取得绝对值,然后将对某个解释变量回归,根据回归模型的显著性和拟合优度来判断是否存在异方差。
检验的特点:不仅能对异方差的存在进行判断,而且还能对异方差随某个解释变量变化的函数形式进行诊断。该检验要求变量的观测值为大样本。
检验的步骤:1.建立模型并求
2.寻找
:根据样本数据建立回归模型,并求残差序列
与X最佳函数形式:进行回归,用各种函数形式去试,寻找最佳的函数
的回归,
作为替代变量,对所选函数形式显著不为零,认为存在异方差性。
形式。3.判断根据选择的函数形式作X对回归。用回归所得到
、t、F等信息判断,若参数
19
7)异方差性的补救措施: 1、模型变换
2、加权最小二乘法(WLS): 基本思路:
3、模型的对数变换
影响:对数变换后的模型通常可以降低异方差性的影响(1、运用对数变换能使测定变量值的尺度缩小。2、经过对数变换后的线性模型,其残差表示相对误差往往比绝对误差有较小的差异。)注意:对变量取对数虽然能够减少异方差对模型的影响,但应注意取对数后变量的经济意义。 2、结合异方差分析案例 3、练习题5.1、(5.7?)
5.1 设消费函数为Yi12X2i3X3iui式中,Yi为消费支出;X2i为个人
22ui为随机误差项,可支配收入;X3i为个人的流动资产;并且E(ui)0,Var(ui)X2i(其中2为常数)。试回答以下问题:
(1)选用适当的变换修正异方差,要求写出变换过程;
(2)写出修正异方差后的参数估计量的表达式。
2解:(1)因为f(Xi)X2i,所以取W2i1,用Wi乘给定模型两端,得 X2i
YiXu11233ii X2iX2iX2iX2i20
上述模型的随机误差项的方差为一固定常数,即 Var(ui1)2Var(ui)2 X2iX2i(2)根据加权最小二乘法及第四章里(4.5)和(4.6)式,得修正异方差后参数估计式为
ˆY*ˆX*ˆX* 12233ˆ 2W2i**2****yi*x2iW2ix3iW2iyix3iW2ix2ix3iWW2i*22i2ixWW*22i3ixWW3i**22i2i3ixx
ˆ3W2i**2****yi*x3iW2ix2iW2iyix2iW2ix2ix3i*22i2i
x*22i3ix**2i2i3ixx2 X2*WXW2i2i,*X3WXW2i2i,Y*WYW2i2ii
** x2iX2iX2**x3iX3iX3y*YiY*
第六章
1、什么是自相关,原因,表现形式,后果,如何检验,如何补救
定义:序列相关,是指总体回归模型的随机误差项逐项值之间存在相关关系。自相关多出现在时间序列数据中。
自相关的程度表示:
原因:1、经济系统的惯性(经济系统的经济行为都具有时间上的惯性)2、经济活动的滞后效应(滞后效应是指某一指标对另一指标的影响不仅限于当期而是延续若干期。)3、数据处理的失误4、蛛网现象5、模型设定偏误(由于设定失误造成的自相关,因此,也称其为虚假自相关)
表现形式:1)一阶自回归AR(1):对于样本观测期为 n 的时间序列数据,可得到总体回归模型(PRF)的随机项为 为自相关系数,
为随机误差项,即
,如果自相关形式为
,其中
2)二阶自回归AR(2):
3)m阶自回归AR(m):
21
一般在经济计量分析中,通常采用一阶自回归形式,即假定自回归形式为AR(1)。
一阶自回归的性质:对于样本观测期为 n 的时间序列数据,可得到总体回归模型(PRF)的随机项为 相关系数,
为随机误差项,即
,如果自相关形式为
,其中
为自
,随机误
,可以推导得到:
差项ut的各期滞后值逐次带入得:
空间自相关:自相关关系主要存在于时间序列数据中,但是在横截面数据中,也可能会出现自相关,通常称其为空间自相关。
后果:1、对参数估计的影响:1)无偏性依然成立,证明如下:
2)不再具有最小方差性(随机扰动项方差增大,导致参数的方差增大)2、对模型检验和预测的影响:1)参数显著性检验失效,2)区间预测和预测区间的精度降低:
自相关的检验: 1)图示检验法
图示法是一种直观的诊断方法,它是把给定的回归模型直接用普通最小二乘法估计参数,求出残差项 e t,作为u t随机项的真实估计值,再描绘e t的散点图,根据图形来判断e t的相关性。如果在负自相关。如果
随着的t变化逐次变化并不断地改变符号,那么随机误差项u t存
随着的t变化逐次变化并不频繁地改变符号,而是几个正的后面跟着
几个负的,则表明随机误差项存在正自相关。如图:
2)DW检验法(是建立经济计量模型中最常用的方法。) 1)假定条件:1)解释变量X为非随机的;(2)随机误差项 ut 为一阶自回归形式,即
,其中误差项满足古典假定;(3)线性回归模型中不应含有滞后内
生变 量作为解释变量(4)模型的截距项不为零(5)数据无缺失项
2)定义:DW统计量为3)取值范围:
22
可以得到关系如下图:,可知DW取值为0-4. 根据样本
容量n和解释变量的数目k(不包括常数项)查DW分布表,得临界值dL和dU,然后依下列准则考察计算得到的DW值,以决定模型的自关状态。 决策规则:
(1)表格法:
(2)图示法:
局限与缺点:1、DW检验有两个不能确定的区域,一旦DW值落在这两个区域,就无法判断。这时,只有增大样本容量或选取其他方法;2、DW统计量的上、下界表要求
,这是因为样本如果再小,利用残差就很难对自相关的存在性做出比较正确的诊断;3、DW只能检验一阶自相关, DW检验不适应随机误差项具有高阶序列相关的检验;4、只适用于有常数项的回归模型并且解释变量中不能含滞后的被解释变.
3)相关图和Q统计量
23
p阶滞后Q -统计量的原假设是:序列不存在p阶自相关;备选假设:序列存在p阶自相关
结果显示:检验结果会显示滞后阶数i、自相关系数AC、偏自相关系数PAC、滞后阶数的Q - 统计量Q-Stat等
判断:观察Autocorrelation 列的柱体是否超过正负方向的虚线。
4)序列相关LM检验
LM检验(Breush-Godfrey LM检验)是构造拉格朗日乘数来检验高阶序列相关;而且在方程中存在滞后因变量的情况下,LM检验仍然有效。根据AIC最小化确定滞后期
LM检验原假设为:直到p阶滞后不存在序列相关。p为预先定义好的整数;
观察方法:F统计量表示辅助回归方程的整体显著性,而后面的Obs*R-squared 才是我们所重点观察的LM统计量。可以看此统计量的相伴概率值。Obs*R-squared的相伴概率大于0.1,接受原假设,不存在序列相关性。
自相关的补救:
1)广义差分法(已知自相关系数):
注意:在进行广义差分时,会丢失了第一个观测值,即损失自由度。当样本容量较小时,会对估计精度有影响。此时,可将第一个观测值变换为:到差分序列
中,再使用普通最小二乘法估计参数。(Prais-Winsten变换)
补充
2)科克伦-奥克特迭代法(未知自相关系数)
在实际应用中,自相关系数往往是未知的。最简单的估算的方法是根据DW统计量计算。但是, 该式得到的是一个粗略的结果。为了得到的精确的估计值,人们通常采用科克伦-奥克特(Cochrane-Orcutt)迭代法。
基本思想:利用残差逐次迭代得到更为满意的主要步骤:
,然后再采用广义差分法。
24
注意:当对时间序列的自相关进行修正后,经常出现变量的显著性检验不能通过的情况。其主要原因包括以下项:样本不够、同时存在异方差和多重共线性等、解释变量未能包含所有影响被解释变量的因素等,以及时间序列数据有其自身的特点,经常出现伪回归现象。处理方法:扩大样本、检验异方差、修改模型、进行单位根检验→建立协整方程。
3)德宾两步法:
3)一阶差分法(用来消除完全一阶正自相关):
2、案例分析 3、思考题6.7、
25
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- fenyunshixun.cn 版权所有 湘ICP备2023022495号-9
违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务