You are on page 1of 352

第四版前言

本书从 2006 年第一版出版至今已十年有余,第三版出版也已近五年,已先后重印 30

次,发行 30 多万册,受到众多院校师生的关注。

为了更好的服务于大学本科计量经济学的教学,科学出版社曾对选用本书作为教材的部

分院校发出调查函,现在修订的第四版,就是在参考所反馈调查意见的基础上,由原作者和

西南财经大学数量经济学教学团队的教师参与修订的。

从调查反馈意见看,广大师生对本教材的基本宗旨和特色是认可的,认为能够满足当前

本科教学的需求。所以,从本科计量经济学教学的实际出发,本书应继续坚持“重思想、重

方法、重应用”的教学理念,坚持与本科教学相适应的基本内容体系,坚持“课堂教学、实

验教学、课程论文三结合”的鲜明特色,努力为本科教学创造良好的条件和环境。

参考各院校多数教师的意见和建议,本书第四版主要作了如下修订:

1.再次更新各章的“引子”,尽量从学生较为熟悉的中国实际经济问题出发,引出本章

所要解决的主要问题,使其更加有利于教学。

2.每一章都有针对中国实际经济问题的案例,通过案例学习本章主要理论与方法的实际

应用,并在案例分析中通过实际操作去学习 EViews 软件,这是本书的特色之一。第四版对

多数案例都用最新的中国统计数据作了更新,同时为有利于教学,也保留了少量历史数据的

案例。由于对实例和案例数据计算过程的四舍五入等原因,手工计算与计算机软件计算的结

果可能略有差异,本书中均以计算机软件计算结果为准。

3.修改了部分练习题,更新了数据,补充了部分新的思考题和练习题。

4.更新了各章实例和案例中使用的 EViews 软件版本。考虑到已能够满足本科教学的需

要,以及多数院校软件获得的方便,第四版统一采用 EViews8.0 的命令和输出界面,而没有

采用 EViews 最新版本的软件。

关于教材的内容体系,有的教师建议删除教材中的“设定误差”和“联立方程组模型”。

考虑到设定误差是模型违反基本假定的重要原因,为使学生更明确模型设定的重要性,第四

版还是作为选讲内容予以保留,但删去了一些过于理论性的练习题。联立方程组模型在计量

经济学中有其理论意义,也有实际应用价值,在本科教学中宜于保留,不过根据各院校的实

际,可将其改为本科教学的选讲内容。此外,还有的教师建议教材中补充面板数据模型、空

间计量、ARCH 模型、截尾数据模型、受限最小二乘等方面的内容。经过讨论,考虑到本科
教学的定位是计量经济学最基本的理论与方法,与研究生计量经济学教学内容有一定的衔接

与区别,应避免与研究生教学的重复。并且,考虑到目前计量经济学本科教学的学时有限,

从多数院校的实际出发,目前还不宜增添更多教学内容。

我们对为这次修订提出宝贵建议的兄弟院校的老师们再次表示衷心感谢。本次修订中,

西南财经大学数量经济教学团队的喻开志、陈娟、何婧、马昀蓓、范国斌、刘田、李伊、张

卫东、干卓泂、孙秀丽等老师分别参与了对第 2 章—第 11 章的修改,对他们做出的奉献表

示衷心感谢。

编者

2018 年 4 月
第一章 导 论

引子:
“一种科学只有在成功地运用了数学时,才算达到了真正完善的地步”。

——卡尔 . 马克思(见拉法格的回忆录)

“第二次世界大战后的经济学是计量经济学的时代。

——P . 萨谬尔森(P . Samuelson)

“在大多数大学和学院中,计量经济学的讲授已成为经济学课程表中最有权威的一部

分。

——R . 克莱因(R . Klein)

第一节 什么是计量经济学

计量经济学是现代经济学的重要分支。为了深入学习计量经济学的理论与方法,有必要

首先从整体上对计量经济学有一些概略性的认识,了解计量经济学的性质、基本思想、基本

研究方法以及若干常用的基本概念。

一、计量经济学的产生与发展

在对实际经济问题的研究中,经常需要对经济活动及其数量变动规律作定量的分析。例

如,为了研究中国经济的增长,需要分析中国国内生产总值(GDP)变动的状况? 分析有哪些

主要因素会影响中国 GDP 的增长?分析中国的 GDP 与各种主要影响因素关系的性质是什

么?分析各种因素对中国 GDP 影响的程度和具体数量规律是什么?分析所得到的数量分析

结果的可靠性如何?还要分析经济增长的政策效应,或者预测中国 GDP 发展的趋势。显然,

对这类经济问题的定量分析,需要解决一些共性问题:提出所研究的经济问题及度量方式,

确定表现研究对象的经济变量(如用 GDP 的变动度量经济的增长);分析对研究对象变动有

影响的主要因素,选择若干作为影响因素的变量;分析各种影响因素与所研究经济现象相互

关系的性质,决定相互联系的数学关系式;运用科学的数量分析方法,确定所研究的经济对

象与各种影响因素间具体的数量规律;运用统计方法分析和检验所得数量结论的可靠性;运

用数量研究的结果作经济分析和预测。对社会经济问题数量规律的研究具有普遍性,计量经

1
济学是专门研究这类问题的经济学科。

计量经济学(Econometrics)这个词是挪威经济学家、第一届诺贝尔经济学奖获得者

弗瑞希(R.Frisch)在其 1926 年发表的《论纯经济问题》一文中,按照”生物计量

学”(Biometrics)一词的结构仿造出来的。Econometrics 一词的本意是指“经济度量”,研究

对经济现象和经济关系的计量方法,因此有时也译为“经济计量学”。将 Econometrics 译

为计量经济学,是为了强调计量经济学是一门经济学科,不仅要研究经济现象的计量方法,

而且要研究经济现象发展变化的数量规律。

计量经济学的产生源于对经济问题的定量研究,这是社会经济发展到一定阶段的客观需

要。经济现象本来就充满着数量关系,人们很早就在探索用定量的方式研究经济问题。早在

17 世纪,英国经济学家、统计学家威廉•配第在《政治算术》中就运用统计方法研究社会经

济问题,主张用“数字、重量和尺度”来阐明经济现象。以后的相当一段时间,经济学家们

也力图运用数学方法研究经济活动,用数学语言和公式去表达经济范畴和经济规律。但计量

经济学作为经济学的一门独立学科被正式确立,其标志一般认为是 1930 年 12 月弗瑞希和丁

伯根(J.Tinbergen)等经济学家发起在美国克里富兰成立世界计量经济学会。

第二次世界大战以后,计量经济学在西方各国的影响迅速扩大,发展成为经济学的重要

分支。特别是从 20 世纪 40 年代到 60 年代,经典计量经济学逐步完善并得到广泛应用。美

国著名经济学家、诺贝尔经济学奖获得者萨谬尔森(P.Samuelson)认为:
“第二次世界大战

后的经济学是计量经济学的时代”。事实上,在诺贝尔经济学奖获得者中,相当一部分都是

计量经济学家。

应该看到,计量经济学的发展是与现代科学技术成就结合在一起的,它反映了社会化大

生产对各种经济因素和经济活动进行数量分析的客观要求。经济学从定性研究向定量分析的

发展,是经济学逐步向更加精密、更加科学发展的表现。正如马克思强调的:一门科学只有

成功地运用了数学以后,才算达到了完善的地步。因此著名经济学家、诺贝尔经济学奖获得

者克莱因(R.Klein)认为:“计量经济学已经在经济学科中居于最重要的地位”。

计量经济学与其他西方经济理论不同的一个重要特点,是它自身并没有固定的经济理

论,计量经济学中的各种计量方法和技术,大多来自数学和统计学。我们只要坚持以科学的

经济理论为指导,紧密结合中国经济的实际,就能够使计量经济学的理论与方法在中国的经

济理论研究和现代化建设中发挥重要的作用。

20 世纪 70 年代以来,计量经济学的理论和应用又进入新的阶段,主要是现代计量经济

学(或称非经典计量经济学)的理论和应用有了很多新的突破,在模型类型、模型导向、模

2
型结构、数据类型、估计和检验理论与方法等方面形成了新的体系。现代计量经济学中非线

性方法、协整理论、面板数据、空间计量、非均衡理论、随机过程方法、非参数方法等现代

数学和统计理论的应用成为新的研究课题,形成了时间序列计量经济学、面板数据计量经济

学、空间计量经济学、非参数计量经济学、微观计量经济学、金融计量经济学、大数据(高

维)计量经济学等新的分支学科。但是,应该强调,经典计量经济学是计量经济学重要的理

论和方法论基础,现代计量经济学是以经典计量经济学模型理论为基础而发展起来的。在经

济学各专业的本科教学中,作为计量经济学的入门课程应当重视经典计量经济学基础,同时

对 “非经典”的现代计量经济学某些新发展有一定的了解,这样才能把握计量经济学的发

展,也才能深刻理解和正确运用经典计量经济方法。

二、计量经济学的性质
计量经济学的奠基人弗瑞希指出:计量经济学“是统计学、经济学和数学的结合”,
“三

者结合起来,就有力量,这种结合便构成了计量经济学” 1。

美国现代经济词典认为:计量经济学是用数学语言来表达经济理论,以便通过统计方法

来论述这些理论的一门经济学分支。

萨谬尔逊、库普曼斯、斯通等三位著名经济学家在 1954 年计量经济学家评审委员会的

报告中认为:“计量经济学可定义为:根据理论和观测的事实,运用合适的推理方法使之联

系起来同时推导,对实际经济现象进行的数量分析。” 2

尽管经济学家对计量经济学定义的表述各不相同,但可以看出,计量经济学是由经济学、

统计学、数学相结合而产生的相对独立的一门科学。事实上,计量经济学是以经济理论和经

济数据的事实为依据,运用数学、统计学的方法,通过建立数学模型来研究经济数量关系和

规律的一门经济学科。应当注意,计量经济学所研究的主体是经济现象及其发展变化的规律,

所以它是一门经济学科。计量经济学要运用大量的数学方法,特别是许多数理统计方法,但

数学在这里只是工具,而不是研究的主体。在计量经济学中,数学方法是为经济问题服务的,

方法手段要服从研究对象(经济活动)的本质特征,这与数学是不同的。计量经济学研究数

量规律性,离不开数学和统计学方法,但是离开了方法提出的经济背景、离开了方法应用的

经济对象、离开了计量结果经济意义的合理解读,计量经济学对于经济问题的研究也就没有

实际的价值。

计量经济学的目的是要把实际经验的内容纳入经济理论,确定表现各种经济关系的经济

1Ragnar Frisch,“A Note on the Term‘Econometrics,’”Econometrica 4,no.1(January 1936):95


2P.A.Samuelson,t.c.Koopmans,and J.R.N.Stone, ”Report of the Evaluative Committee for Econometrica, ”
Econometrica 22,no.2(1954) :141-146.

3
参数,从而发现或验证经济理论,预测经济发展的趋势,为制定经济政策提供依据。为此,

计量经济学不仅要寻求经济计量分析的方法,而且要对实际经济问题加以研究,要解决达到

上述目的的理论和方法论问题。这样,计量经济学分成了两种类型:即理论计量经济学和应

用计量经济学。

理论计量经济学研究如何建立合适的方法,去测定由计量经济模型所设定的经济关系。

现实的经济活动和经济关系异常复杂,一般来说,各种经济变量之间并不是精确的函数关系,

经济变量间的数量关系不是那么确定,也就是说模型中往往包含一些随机的无法直接控制的

因素,所以理论计量经济学要较多地依赖数理统计学方法。除了介绍计量经济模型普遍应用

的参数估计方法与检验方法以外,由于经济现象的复杂性,各种实际的经济关系不一定都服

从一般的统计规律,理论计量经济学还须研究当一般的统计假定条件不完全满足时将会产生

的结果,并寻求解决这些问题的专门方法,也就是说还会面临许多特殊的经济计量问题,形

成一些专门的计量经济方法。所以理论计量经济学是适合于经济关系计量的方法论学科。

应用计量经济学是运用理论计量经济学提供的工具,研究经济学中某些特定领域的现实

经济数量问题,例如生产函数、消费函数、投资函数、供给函数、劳动就业等。应用计量经

济学以建立计量经济学模型为主要内容,强调应用模型的经济学和经济统计学基础,侧重于

建立与应用模型过程中实际问题的处理。应用计量经济学研究的是具体的经济现象和经济关

系,研究它们在数量上的联系及其变动规律性。除了计量经济方法以外,应用计量经济学更

多地要依据经济学理论所确定的经济规律,而且要依据经济统计提供的反映现实经济现象和

经济关系的观测数据,运用计量经济模型分析经济结构,预测经济的发展趋势,对经济政策

作定量的评价。

三、计量经济学与其他学科的关系
从前面的讨论可以看出,计量经济学是与经济学、经济统计学及数理统计学都有关系的

交叉学科。但计量经济学又不是这些学科的简单结合,它与这些学科既有联系又有区别。

计量经济学研究的主体是经济现象和经济关系的数量规律,经济学理论所说明的经济规

律,是计量经济学分析经济数量关系的理论基础。

但是计量经济学并不是盲目地重复经济理论,计量经济学研究是把经济理论与客观现实

联系起来分析,计量经济分析的成果或者是对经济理论确定的原则加以验证与充实,或者可

以否定某些经济理论原则,而进行补充或修改。计量经济学与经济学的明显区别,在于一般

的理论经济学主要根据逻辑推理得出结论,主要用文字或符号说明经济现象和过程的本质与

规律,大多具有定性的性质。理论经济学有时也会涉及经济现象的数量关系,例如说明价格

4
与商品需求量及供应量成正比或反比的关系,但经济理论并不提供这类经济关系数量上的度

量,并不说明价格的变动将会使供应量和需求量具体增加或降低多少。计量经济学则要对经

济理论所确定的经济关系作定量的估计,对经济理论提供经验的内容。

经济统计学也研究对经济现象的计量,只不过是侧重于对社会经济现象的数量描述。经

济统计提供的数据,是计量经济学据以估计参数、验证理论的基本依据。离开了经济统计,

任何对实际经济问题的经济计量分析都会寸步难行。计量经济学对经济统计的这种依赖性是

由经济活动的特殊性决定的。经济现象是人所从事的社会性活动,它不可能像对自然现象的

物理实验和化学实验那样,可以在实验室中严格控制其他条件不变,去重复实验,反复观测

某种因素变动对所研究现象的影响。经济现象不可能人为地控制“其他条件不变”,人们能

够做的只是被动地观测客观经济活动的既成事实,也就是分析对实际经济现象观测所得的统

计数据。计量经济学运用的往往是其他数据搜集者提供的数据,这就要求必须熟悉这些数据

的性质和结构。

计量经济学所研究的经济现象并不都是呈现为精确的函数关系,计量经济模型中包含了

随机误差项,这样模型中的一些变量和参数的估计量都成为了随机变量。概率论与数理统计

学是研究随机变量统计规律性的学科,所以数理统计学中的参数估计、假设检验、方差分析、

回归分析等方法在计量经济学中得到了全面运用,可以说数理统计学是计量经济学的方法论

基础。然而,数理统计学只是抽象地研究一般随机变量的统计规律,主要讨论在一定假设条

件下一般随机变量的概率分布性质,以及特征值的估计与推断。而计量经济学是从具体的经

济模型出发,其参数都具有特定的经济意义,研究对模型参数的估计与推断时,不仅要看在

数学原理上是否通得过,还要看与实际的经济内容是否一致。而且,在实际经济问题的计量

中,数理统计中一些标准的假定经常不能满足,还需要建立许多专门的经济计量方法。所以,

计量经济学并不只是对数理统计方法的简单应用。

作为对计量经济学与其他相关学科关系的的总结,可以引述早在 1933 年 R.弗瑞希为《计

量经济学》杂志写的发刊词中的一段话:“对经济的数量研究可以从好几个方面着手,但其

中任何一个方面就其本身来说都不应该与计量经济学混为一谈。因此,计量经济学与经济统

计学决非一码事;它也不同于我们所说的一般经济理论,尽管经济理论大部分都具有一定的

数量特征;计量经济学也不应视为数学应用于经济学的同义语。经验表明,统计学、经济理

论和数学这三者对于实际理解现代经济生活中的数量关系来说,都是必要的。但任何一种观

点本身都不是充分条件。三者结合起来才是强有力的,正是这种结合才构成了计量经济学。”

5
第二节 计量经济学的研究步骤

运用计量经济学研究经济问题,一般可分为四个步骤:确定变量和数学关系式——模型

设定;分析变量间具体的数量关系——估计参数;检验所得结论的可靠性——模型检验;作

经济分析和经济预测——模型应用。

一、模型设定
所谓经济模型是指对经济现象或过程的一种数学模拟。社会经济现象和过程是非常复杂

的,影响因素众多,经济模型只能把所研究的主要经济因素(表现为经济变量)之间的关系,

用适当的数学关系式近似地、简化地表达出来。例如,为了研究居民的消费行为,根据经济

学中关于消费行为的理论,认为居民消费支出与其收入成正比例,可将二者的关系表示为如

下消费函数:

Y= α + β X (1.1)

式中:Y 为居民消费支出;X 为居民家庭收入; α 和 β 为参数。

式(1.1)中的 β 实际是经济学中的边际消费倾向(MPC), β 作为斜率系数是消费增

加量 ∆Y 与收入增加量 ∆X 的比例,即 β =∆Y ∆X 。然而,在现实的经济生活中,居民消

费支出并不像式(1.1)那样,是家庭收入的精确函数。没有一个模型可以涵盖影响经济生

活的方方面面,因为这些因素在本质上都是随机出现的 3。由于还有许多其他未加入模型的

因素也会影响居民的消费行为,相同收入的家庭,其消费支出不一定完全相同,所以式(1.1)

那样的模型还不是适于对实际经济活动作计量分析的计量经济模型。为了把实际居民消费与

实际收入水平的关系表现出来,还需要在模型中引入一个随机误差项,即

Y=α +β X +u (1.2)

式中,u 是随机误差项,也称随机扰动项。像式(1.2)那样,包含了经济变量、待确定的参

数 α 和 β ,并包含了随机误差项 u 的方程式,才是适于对实际经济活动作计量分析的计量

经济模型。计量经济模型可以如式(1.2)那样只是一个方程式,这称为单一方程模型。在

有的情况下,需要用相互联系的若干个方程构成的方程组去描述更为复杂的经济关系,这种

计量模型称为联立方程组模型。

3 威廉.H.格林: 计量经济分析(上册).北京,中国人民大学出版社,2003,6.

6
显然,在建立计量经济模型时,为了简化和计量的方便,通常不可能把所有的因素都列

入模型,而只能抓住主要影响因素和主要特征,而不得不舍弃某些因素。同时,模型中变量

之间的关系可能设计为线性关系,也可能设计为其他非线性关系。建立模型时,模型中变量

的取舍及相互关系形式的设计,一定程度上是决定于研究者的主观认识,当不同的研究者对

所研究经济问题的认识有差异时,所使用的模型可能会不完全相同。所以,模型的具体形式

是需要研究者去设定的问题。设定模型是计量经济研究的关键步骤,设定计量经济模型既是

一门科学,又是一门艺术。建立一个好的计量模型,要靠丰富的专业知识,要有适当的方法,

更要靠对建模实践的不断总结。

一般说来,设定一个合理的计量经济模型,主要应注意以下三个方面的问题:

1.要有科学的理论依据。建立经济模型是为了反映实际经济活动的规律性,必须对所研

究的经济现象的相互关系作科学的经济理论分析,尽可能使模型真实地反映经济现象实际的

依存关系。对别人成功应用过的计量经济模型,也要从经济机理上具体分析,注意模型的应

用条件是否符合所研究问题的实际,不应简单地生搬硬套。

2.模型要选择适当的数学形式。模型的数学形式可以是单一方程,也可以是联立方程

组。每一个方程可以表现为线性形式,也可以表现为非线性形式。这要根据研究的目的、所

研究经济问题的复杂程度以及所掌握的数据资料来决定。可以利用经济学和数理经济学的成

果,或利用样本数据绘制变量之间关系的图形作参考。在实际建立模型的过程中,应根据所

研究现象相互关系的性质,通过对实际统计资料的试验和分析,经过反复比较,选择尽可能

合理的模型数学形式。另外要注意所构造的方程必须是有解的,特别是在建立联立方程模型

时,要使内生变量的数目与方程个数相适应。在选择模型数学形式时还应注意,在能够达到

研究目的的前提下,应当尽可能选择更为简捷的数学形式,不应只是盲目追求数学形式上的

“完美性”。

3.方程中的变量要具有可观测性。因为只有可观测的变量才可能取得实际的统计数据,

也才可能对模型中的参数作出具体的估计。

二、估计参数
参数与变量不同,参数是计量经济模型中表现经济变量之间相对稳定依存程度的那些因

素,参数描述了模型中经济变量之间关系的方向和强度。计量经济模型中的参数决定着变量

之间具体的数量关系,一旦参数确定了,整个经济系统的基本结构就确定了。例如式(1.2)

中作为边际消费倾向的参数 β ,决定着收入与消费的基本结构关系,这种反映经济结构特

7
性的参数也称为结构参数。

在经济总体中,反映经济结构的参数与变量不同,一般来说参数不能直接观测而且是未

知的。我们能够获得的,往往只是所研究总体中变量的若干样本观测数据。由于随机误差项

的存在,变量之间的数量关系并不呈现为确定的函数关系,通常也不可能精确地去计算参数

的数值。如何通过变量的样本观测数据合理地估计总体模型的参数,这是计量经济学研究的

核心内容。

经过实际样本信息估计出的参数数值称为参数的估计值,但是由于样本毕竟不等于总

体,参数的样本估计值并不一定等于总体参数的真实值。如果用一定的方法能够获得通过变

量的样本观测值去计算参数估计值的公式,这种公式则称为参数的估计量 (或称估计式)。

参数估计量是模型中变量样本观测值的代数式,只要将变量的样本观测值直接代入,即可得

到参数的估计值。如何去确定满足计量经济要求的参数估计量,是理论计量经济学的主要内

容之一。

三、模型检验
模型中的参数被估计以后,一般说来这样的模型还不能直接加以应用,还需要对估计的

计量经济模型作某些检验,其原因是多方面的。首先,在设定模型时,对所研究经济现象规

律性的认识可能并不很充分,所依据的经济理论对所研究对象也许还不能作出正确的解释和

说明。或者虽然经济理论是正确的,但可能我们对问题的认识只是从某些局部出发,或者只

是考察了某些特殊的样本,以局部去说明全局的变化规律,可能导致偏差。其次,我们用以

估计参数的统计数据或其他信息可能并不十分可靠,或者较多地采用了经济突变时期的数

据,不能真实代表所研究的经济关系,或者由于样本太小,所估计的参数只是抽样的某种偶

然结果。此外,我们所建立的模型、采用的方法、所用的统计数据,都有可能违反计量经济

的基本假定,这也可能导出错误的结论。所谓模型检验,就是要对模型和所估计的参数加以

评判,判定在理论上是否有意义,在统计上是否有足够的可靠性。

对计量经济模型的检验主要应从以下四方面进行:

1. 经济意义的检验

模型中的变量和参数都有特定的经济意义,经济理论通常对这些变量以及参数的符号和

取值范围作出了理论说明,如果所估计的模型与经济理论完全相符,则说明我们所观测的事

实证实了这种理论;如果所估计的模型与经济理论的结论不相符,一般来说应当舍弃所估计

的模型,设法从模型设定、估计方法、统计数据等方面找出导致错误结论的原因。

但是应强调,实践是检验真理的唯一标准,任何经济学理论,只有当它成功地解释了过

8
去,才能为人们所接受。如果经过反复研究,证明计量经济模型和估计的参数完全正确,而

是经济理论本身不完备,这时则应提出修正经济理论的建议。所以,计量经济学模型对检验

经济理论、发现和发展经济理论也有重要意义。

2. 统计推断检验

模型的参数是用变量的样本观测值估计的,为了检验参数估计值是否抽样的偶然结果,

需要运用数理统计中的统计推断方法,对模型及参数的统计可靠性作出说明。对计量经济模

型的统计推断检验,包括对模型的拟合优度的检验、用假设检验和方差分析方法对变量显著

性的检验等。

3. 计量经济学检验

计量经济学检验主要是检验模型是否符合计量经济方法的基本假定,例如检验模型中变

量是否存在多重共线性,检验模型中的随机扰动项是否存在自相关和异方差性,检验模型是

否存在可识别性,检验模型中时间序列经济变量是否存在平稳性,等等。当模型违反计量经

济方法的基本假定时,通常的计量经济方法将失去效用,或将导致错误的结论,这时必须对

模型作必要的处理,并重新估计模型的参数。

4. 模型预测检验

这是指将估计了参数的模型用于实际经济活动的预测,然后将模型预测的结果与经济运

行的实际结果相对比,以此检验模型的有效性。

四、模型应用
经过估计参数和模型检验,确认为可靠的计量经济模型,才可以用于实际的经济计量分

析。计量经济模型主要可以用于经济结构分析、经济预测、政策评价和检验与发展经济理论

等几个方面。

所谓经济结构分析,是指用已经估计出参数的模型,对所研究的经济关系进行定量的考

察,以说明经济变量之间的数量比例关系。也就是说,分析当其他条件不变时,模型体系中

的解释变量发生一定的变动对被解释变量的影响程度。常用的经济结构分析方法有边际分

析、弹性分析、乘数分析、比较静力学分析等。例如,说明一个国家或地区国民总收入 Y

与总消费支出 C 关系的消费函数模型:

C =α + β Y + u (1 .3)

通常这是一条斜率为正值且小于 1 的直线。模型中的参数β的经济意义是边际消费倾向

MPC = ∆C ∆Y ,假如估计的参数为β=0.8 ,这说明国民总收入每增加 1 亿元,总消费支

9
出平均将增加 0.8 亿元,这是宏观经济结构分析中很有意义的数据。在此基础上还可进行边

际储蓄趋向和收入增长的乘数分析,因为边际储蓄趋向 ∆S ∆Y = 1 − MPC ,收入增长乘数

M 为:

M 1/(1 − MPC )
= (1.4)

=
若已估计出 β MPC
= 0.8 ,则乘数 M = 5 ,这说明当投资增加 1 个单位时,将导致国民

总收入增加 5 个单位,这又为经济分析提供了重要的定量信息。

所谓经济预测,是指利用估计了参数的计量经济模型,由已知的或预先测定的解释变

量,去预测被解释变量在所观测的样本数据以外的数值。建立计量经济模型是试图从已经发

生的经济活动中寻求变化的规律,然后可以把这种规律用于样本以外数据的预测。经济预测

可以是对被解释变量未来时期的动态预测,也可以是对被解释变量在不同空间状况的空间预

测。

所谓政策评价,是利用计量经济模型对各种可供选择的政策方案的实施后果进行模拟

测算,从而对各种政策方案作出评价。在这种情况下,我们是把计量经济模型当作经济运行

的“实验室”
,去模拟所研究的经济体系,分析整个经济体系对各种假设的政策条件的反映。

在实际的政策评价时,经常把模型中的某些变量或参数视为可用政策调整的“政策变量”,

然后分析“政策变量”的变动对被解释变量的影响。

所谓检验经济理论,是利用计量经济模型去验证既有经济理论或者提出新的理论结论。

实践是检验真理的唯一标准,经济理论只有能够成功解释现实,才能为人们所接受。设定的

计量经济模型实际是人们对某种经济规律的认识,而样本数据是经济活动现实的体现。计量

经济学将理论与事实结合起来,提供了一种检验经济理论的方法。如果依据某种理论建立的

模型能很好拟合样本数据,模型估计检验结果与理论相符合,也就验证了既有理论。如果用

样本数据拟合的模型其估计检验结果与既有理论不相符,并确认数据、模型、计量方法是正

确的,则可以修正既有理论或提出新的理论观点。

显然,计量经济模型应用的经济结构分析、经济预测、政策评价和验证理论几个方面

有密切关系,经济结构分析的结果,可用于经济预测,经济预测的结果是政策评价的依据,

而政策评价本身,实际就是一种条件预测,经济结构分析所揭示的规律性也是验证和发展理

论的重要途径。

10
第三节 变量、参数、数据与模型

一、计量经济模型中的变量
计量经济模型有多种构成因素,其中一些在不同的时间或空间有不同的状态,会取不同

的数值,并且是可以观测的因素,这类因素称为经济变量。例如式(1.2)中的居民家庭收入 X

和居民消费支出 Y 都是经济变量。

计量经济模型中的变量可分为若干类型。从所描述的经济活动形态看,经济变量可分为

流量和存量。某些变量具有时间维度,是按一定时期测度的总量,它们是一定时期内累计发

生的数量,如国内生产总值、投资量、消费量等,这类变量反映的是经济活动的“流量”。

另一些变量不具时间维度,是在一定时点上测度的总量,它们表明某一时点所存在状态的总

量,如金融资产、金融负债等,这类总量反映的是经济“存量”。

从变量的因果关系上,可分为解释变量(explanatory variable)和被解释变量(explained

variable)。在模型中,解释变量是变动的原因,被解释变量是变动的结果。被解释变量是模

型要分析研究的对象,也常称为“应变量”(dependent variable)、
“回归子”
(regressand)等,

例如式(1.2)中的消费支出 Y。解释变量也常称为“自变量”(independent variable)、


“回归

元”(regressor)等,是说明被解释变量变动主要原因的变量,例如式(1.2)中的居民家庭

收入 X。表述被解释变量和解释变量的术语比较多 4,为了表述上尽量一致,避免产生混淆,

本书中统一使用“解释变量”表示被解释变量变动原因的变量;而用“被解释变量”或“应

变量”表示分析研究的对象,即作为变动结果的的变量。

从变量的性质,又可把变量分为内生变量和外生变量。内生变量是其数值由模型所决定

的变量,内生变量是模型求解的结果,例如式(1.2)中的消费支出 Y。外生变量是其数值

由模型以外决定的变量,例如式(1.2)模型中的家庭收入 X。在计量经济模型中,外生变

量数值的变化能够影响内生变量的变化,而内生变量却不能反过来影响外生变量。在内生变

量中,有一些是过去时期的内生变量或称滞后的内生变量,例如在研究消费—收入模型时可

能涉及上一期的收入或上一期的消费支出,又如在研究某地区居民收入对消费的影响时可能

涉及全国居民的收入量,这种过去时期的、滞后的或更大范围的内生变量,不受本模型研究

范围的内生变量的影响,但能够影响我们所研究的本期的内生变量,这种内生变量称为前定

内生变量。在模型中前定内生变量的作用视同于外生变量,并与外生变量一起称为前定变量。

4见古扎拉蒂:
《计量经济学》上册,北京,中国人民大学出版社,2005,9。被解释变量(Explained variable)
有时也被称为因变量,为了与作为变动原因的变量相区别,本书中称为应变量(Dependent variable)。

11
在单一方程模型中,前定变量一般作为解释变量,内生变量一般作为被解释变量或应变量,

而在联立方程模型中内生变量既可作为被解释变量,又可作为解释变量。

确定模型中的变量,是建立计量经济模型的重要环节,被解释变量要选择最能反映所研

究对象变动情况的变量,例如最能反映居民消费行为的是“居民消费支出”,最能够反映全

社会生产成果总量的是“国内生产总值(GDP)”,等等。解释变量则应尽量选择最能够说明

被解释变量变动的主要原因,并能够独立影响被解释变量的那些变量,次要的变动原因应被

归入到随机扰动项中。对变量的选择还要考虑可观测性,有的因素虽然对被解释变量有重要

影响,但是无法获取其观测值,例如家庭财产可能对家庭消费有影响,但家庭的财产数量很

难取得数据,这类无法观测的因素不能实际度量,也不宜作为变量列入计量经济模型。

二、参数的估计
计量经济模型中的参数一般是未知的,需要根据样本信息去加以估计。估计模型中参数

的方法有很多种。例如对于单一方程模型,最常用的是普通最小二乘法、极大似然估计法等。

对于联立方程组模型常用二段最小二乘法和三段最小二乘法等去估计参数。这些估计方法都

建立在一定假设前提的基础上,当估计条件不完全满足时,还需要一些特殊的估计方法。由

于抽样波动的存在,加之前提条件、估计方法及所确定的估计量不一定那么完备,所得到的

参数估计值与总体参数的真实值并不一致,这就要求所得到的参数估计值应符合“尽可能地

接近总体参数真实值”的准则。在各种条件下如何寻求模型参数合理的估计方法,是计量经

济学研究的主要内容。不过,在理论计量经济学中并不侧重于直接研究参数估计值本身,而

是着重于论述所导出的参数估计量是否符合“尽可能地接近总体参数真实值”这样的准则。

通常选择参数估计量时应考察其无偏性、有效性等统计性质,或者考察大样本时的统计性质。

在实际的计量经济研究中,运用样本数据对参数的估计与检验,将面临很大的计算工作

量。现在这方面的工作已经可以由各种有关的计算机应用软件来实现,计算机应用软件已成

为学习计量经济学必不可少的部分。本书采用的计算机应用软件是应用十分广泛的 EViews

(Econometric Views),将结合每一章案例的内容介绍 EViews 的使用方法。

三、计量经济学中应用的数据
估计计量经济模型参数的基本依据,是通过对所研究经济变量实际观测所取得的数据。

数据是对客观事物信息的一种反映,这种信息如以某种量的标志显现出来就称其为数据。在

计量经济研究中使用的数据,主要是各种经济统计数据,也可以是通过专门调查取得的数据,

还可以是人为构造的数据。可用于估计参数的数据主要有以下几类:

(1)时间序列数据(time series data)


。把反映某一总体特征的同一变量的数据,按照

12
一定的时间顺序和时间间隔(如月度、季度、年度)排列起来,这样的统计数据称为时间序

列数据。例如逐年的国内生产总值和消费支出、逐月的物价指数……等等。时间序列数据可

以是时期数据,也可以是时点数据。

(2)截面数据(cross-section data)。截面数据是同一时间(时期或时点)某个变量在不

同空间的观测数据。“不同的空间”可以是指不同的地理区域,也可以是指不同的行业、部

门或个人。例如,同一时间不同家庭的收入和消费支出、某一年各个省(市)的国内生产总

值,等等。在经济学和其他社会科学领域中横截面数据得以广泛应用,特别是在对不同类型

经济活动作比较研究时,更适于使用截面数据。在经济学中,横截面数据分析主要与应用经

济领域密切相关,例如地方公共财政、产业组织理论、城市经济学、劳动经济学、人口与健

康经济学等。在检验微观经济假设或评价微观经济政策时,有关个人、家庭、企业、城市等

的横截面数据是至关重要的。

(3)面板数据(panel data set)。面板数据是对一组固定调查对象的多次观测得到的数

据,即由横截面上个体在不同时间的重复观测而形成的数据。例如在居民收支调查中收集的

对各个固定调查户在不同时期的调查数据,又如全国各省市不同年份的经济发展状况的统计

数据,就都是面板数据。

(4)虚拟变量数据(dummy variables data)。有一些定性的事实,不能直接用一般的数量

去计量,例如政府政策的变动、自然灾害、政治因素、战争与和平状态……。在计量经济研

究中常发现,某些客观存在的定性现象确实对所研究的经济变量有明显的影响,需要把它们

引入计量经济模型中,这时常用人为构造的虚拟变量去表示这类客观存在的定性现象“非此

即彼”的状态。通常以 1 去表示某种状态发生,以 0 表示该种状态不发生。这样的虚拟变量

虽然是人为构造的,但反映了客观存在的定性现象,也可以视为一种数据用作模型参数的估

计和检验。不同的虚拟变量数据有着不同的特征和不同的分析方法。

除了模型的正确设定以外,能否取得用于实际计量的适合的样本数据,是计量经济研究

成败的关键。计量经济分析中使用的数据主要来自于经济统计,常用的数据可从各种统计年

鉴等出版物中取得,特殊的数据则需进行专门的调查才能得到。计量经济研究中使用的数据,

要力求真实、可靠、完整,数据的质量直接关系到所估计参数的可靠性。对明显失真的数据,

应当予以剔除。在经济结构发生重大变革的时期,其统计数据往往不能反映经济变动的真实

趋势和规律,这种“经济突变”时期的数据也不宜直接用于估计模型的参数。此外,我们有

时很难直接找到模型所需要的数据,这时可能还需要对能够得到的数据作重新加工,或者寻

求与所研究的变量高度相关的代用数据,或者对模型的变量与结构加以调整。

13
计量经济学中利用的数据是可能获得的统计数据,实际的统计数据可能会有观测误差,

也可能数据的数量无法满足估计参数的要求,这些数据还可能不满足参数估计方法的基本假

定。这样一来,由于数据可能引发诸如自由度问题、多重共线性、序列相关、异方差性等一

系列问题。如何设法解决由数据引起的问题,也是理论计量经济学和应用计量经济学要专门

研究的内容。

四、计量经济模型的建立
在计量经济研究中,模型是对实际经济现象或过程的一种数学模拟,再完美的模型也不

可能将所有的因素都纳入其中,模型只不过是对可计量的复杂经济现象的一种简化与抽象。

因此模型只能在一定的假设前提下,忽略众多次要因素,而突出若干所关注的主要经济变量,

把有关经济变量的相互依存关系表现为方程式。模型的建立主要靠对现实经济问题的深入研

究,要遵循科学的理论原则,也要运用适当的方法。

某些经济变量的相互关系通常可以利用来建立计量经济模型,例如:

1. 行为关系

行为关系指描述决策者经济行为的某些变量与其它变量的关系。例如居民消费行为与其

收入、物价水平等的关系。利用行为关系建立的模型称为行为方程式。

2. 技术(工艺)关系

这是反映由科学技术水平决定的经济变量间的数量关系,例如说明投入的生产要素与产

出的生产成果的技术关系,如著名的柯柏—道格拉斯生产函数,产量 Q 与资本投入量 K、

劳动投入产出量 L 的关系为:

Q = AK α Lβ eu (1.5)

式中 A、 α 、 β 为参数,u 为随机项。

又如投入产出模型中的生产量 X j 与消耗量 xij 间的关系

xij = aij X j (1.6)

根据生产技术关系建立的模型称为技术方程式。

3. 制度关系

制度关系指经济现象之间由政府政策和规定的制度所决定的关系。例如销售税的数量决

定于销售额和税率,其中税率是由政府规定的。这样建立的模型成称为制度方程式。

4. 定义关系

14
这是指根据定义而表达的恒等式。这类关系是由经济理论或客观存在的经济关系决定的

恒等关系,例如:

国内生产总值 = 消费 + 投资 + 净出口

国民经济中许多平衡关系都可以建立恒等关系,这样的模型称为定义方程式,在联立方程组

模型中经常利用定义方程式。但是,定义方程式的恒等关系中没有随机误差项和需要估计的

参数,一般不宜用于建立单一方程模型。

以上几种方程式中,最重要、最常用的是行为方程式和技术方程式,这两种方程中都有

未知参数需要估计,而且每个方程说明了经济结构的某一方面,所以这些方程称为结构方程

式。

本章小结
1. 计量经济学是以经济理论和经济数据的事实为依据,运用数学、统计学的方法,通

过建立数学模型来研究经济数量关系和规律的一门经济学科。计量经济学与理论经济学、经

济统计学、数理统计学既有区别又有联系。

2. 计量经济研究分为模型设定、参数估计、模型检验、模型运用等四个步骤。

3. 模型的设定主要是选择变量和确定变量间联系的数学形式。适于对实际经济活动作

计量分析的计量经济模型应包含经济变量、待确定的参数和随机误差项。行为方程、技术方

程、制度方程和定义方程可作为建立模型时参考。

4. 计量经济模型中的变量分为被解释变量(应变量)和解释变量、内生变量和外生变

量。

5. 参数是计量经济模型中表现经济变量相互依存程度的因素,通常具有相对稳定性。

参数无法直接观测和计算,只能用适当的方法根据变量的样本观测值去估计。参数估计的方

法应符合“尽可能地接近总体参数真实值”的准则。

6. 计量经济研究中应用的数据包括时间序列数据、截面数据、面板数据、虚拟变量数

据等。

7. 对模型检验包括经济意义检验、统计推断检验、计量经济学检验和模型预测检验。

8. 计量经济模型主要可应用于经济结构分析、政策评价和经济预测。

思考题
1.1 怎样理解产生于西方国家的计量经济学能够在中国的经济理论研究和现代化建设

15
中发挥重要作用?

1.2 怎样理解计量经济学与理论经济学、经济统计学、数学的关系?计量经济学要运用

大量数学和统计学方法,但为什么说它是一门经济学科?而不是数学学科?

1.3 理论计量经济学和应用计量经济学的区别和联系是什么?

1.4 假如你是中央银行货币政策的研究者,需要你对增加货币供应量促进经济增长提出

建议,你将考虑哪些因素?你认为可以怎样运用计量经济学的研究方法?

1.5 为什么对计量经济模型只能”设定”?

1.6 一个完整的计量经济模型应包括哪些基本要素?你能举一个例子说明吗?

1.7 参数和变量的本质区别是什么?为什么对计量经济模型中的参数通常只能用样本观

测值去估计?

1.8 在计量经济模型中被解释变量和解释变量的作用有什么不同?

1.9 如果要根据历史经验预测明年中国的粮食产量,你认为应当考虑那些因素?应当怎

样来设定计量经济模型?

1.10 你能分别举出三个时间序列数据、截面数据、面板数据、虚拟变量数据的实际例子,

并分别说明这些数据的来源吗?

1.11 为什么一般对经济参数只能进行估计?对模型中参数的估计为什么要确定一定的

准则?

1.12 为什么对已经估计出参数的模型还要进行检验?你能举一个例子说明各种检验的

必要性吗?

1.13 为什么计量经济模型可以用于政策评价?其基本思想和前提条件是什么?

1.14 计量经济学与经济理论是什么关系?为什么计量经济模型可以用于检验与发展经济

理论?

1.15 如果要用计量经济方法评价广告支出对产品销售量的影响,你认为应当怎样设定计

量经济模型?

16
第二章 简单线性回归模型

引子:

中国旅游业成为国民经济战略性支柱产业
1
国务院印发的《“十三五”旅游业发展规划》 提出,改革开放以来,中国实现了从旅

游短缺型国家到旅游大国的历史性跨越。“十二五”期间,旅游业全面融入国家战略体系,

走向国民经济建设的前沿,成为国民经济战略性支柱产业。2015 年,旅游业对国民经济的

综合贡献度达到 10.8%。国内旅游、入境旅游、出境旅游全面繁荣发展,已成为世界第一大

出境旅游客源国和全球第四大入境旅游接待国。旅游业成为社会投资热点和综合性大产业。

“十三五”旅游业发展的主要目标是:到 2020 年,旅游市场总规模达到 67 亿人次,旅游投

资总额 2 万亿元,旅游业总收入达到 7 万亿元。旅游业综合贡献度达 12%。


推动中国旅游业快速发展的原因是多方面的,是什么决定性的因素能使中国旅游业成为
国民经济战略性支柱产业?旅游业的发展与这种决定性因素的数量关系究竟是什么?
显然,需要寻求一些方法研究相互联系的经济变量之间的数量关系,对这类问题的研究
应当考虑以下几个方面:①确定作为研究对象的经济变量(如中国旅游业总收入);②分析
影响研究对象变动的主要因素(如中国居民收入的增长);③分析各种影响因素与所研究经
济现象的相互关系(决定相互联系的数学关系式);④确定所研究的经济问题与影响因素间
具体的数量关系(用特定方法估计其参数);⑤分析并检验所得数量结论的可靠性(需要作
统计检验);⑥运用数量研究结果作经济分析和预测(对数量分析结果的实际应用)

研究经济变量之间相互数量关系最基本的方法之一是回归分析。回归分析是计量经济学

的主要工具,也是计量经济学理论和方法的主要内容。在回归分析中,只有一个解释变量的

线性回归模型是最简单的,称为简单线性回归模型或一元线性回归模型。本章从最简单的一

元线性回归模型入手,讨论在基本假定满足的条件下,对经济变量数量关系计量的基本理论

和方法,这也是以后各章的重要基础。

第一节 回归分析与回归函数

一、相关分析与回归分析
(一)经济变量间的相互关系

1国务院关于印发“十三五”旅游业发展规划的通知(国发〔2016〕70 号)

1
许多社会与经济现象,除了自身的变动以外,它们相互之间很可能有一定的依存关系。

各种经济变量相互之间的依存关系有两种不同的类型:一种是确定性的函数关系,另一类是

不确定性的统计关系,也称为相关关系。

当一个或若干个变量 X 取一定数值时,某一个变量 Y 有确定的值与之相对应,我们称变

量间的这种关系为确定性的函数关系。例如,当销售价格 P 不变的情况下,某种商品销售量

X 与销售额 Y 之间的关系可表示为 Y = P X 。一般情况下,确定性的函数关系可表示为 Y=f(X)。

当一个或若干个变量 X 取一定值时,与之相对应的另一个变量 Y 的值虽然不确定,但却

按某种规律在一定范围内变化,我们称变量之间的这种关系为不确定的统计关系或相关关

系,一般可表示为 Y=f(X,u),其中 u 为随机变量。例如,居民的可支配收入 X 与居民的消

费支出 Y 之间的关系,通常具有相同收入水平居民的消费支出并不完全相同,这时居民可支

配收入 X 与消费支出 Y 会呈现为不确定的相关关系。居民消费支出 X 之所以与居民可支配收

入 Y 不呈现为确定的函数关系,是因为除了居民可支配收入 X 以外,还存在许多其他的因素

也会影响居民消费支出 Y。

变量之间的相关关系可用坐标图又称散点图去描述,例如,变量 X 和 Y 之间关系的散点

图可描述为图 2.1:

图 2.1 变量相关关系的散点图

由于涉及的变量数量、相关性质及相关程度的不同,变量之间的相关关系可以分为若干

类型:

(1)从相关关系涉及的变量数量看。只有两个变量的相关关系,称为简单相关关系。例

如,人的身高与体重之间的相关关系。三个或三个以上变量的相关关系,称为多重相关或复

相关。例如,某种商品的需求量与商品的价格及居民的收入水平之间的相关关系。

2
(2)从变量相关关系的表现形式看。当变量之间相关关系的散点图中的点接近一条直线

时,称为线性相关;当变量之间相关关系散点图中的点接近于一条曲线时,称为非线性相关。

(3)从变量相关关系变化的方向看。两个变量趋于在同一个方向变化时,即同增或同减,

称为变量之间存在正相关。当两个变量趋于在相反方向变化时,即当一个变量增加时,另一

个变量却减少,称为变量之间存在负相关。

(4)从变量相关的程度看。当一个变量的变化完全由另一个变量的变化所确定时,称为变

量之间完全相关。例如前面所举的当价格不变的条件下,某种商品销售额与销售量之间的关

系,在这种情况下,相关关系实际成为了函数关系,所以可以把函数关系视为相关关系的特

例。

当两个变量的变化相互完全没有关系,即彼此互不影响时,称为二者不相关。两个现象

的关系如果介于完全相关和不相关之间时,称为不完全相关,我们研究的相关关系通常都是

指的这种不完全的相关关系。

(二)简单线性相关关系的度量

1、简单线性相关系数

在各种类型的相关分析中,只有两个变量的线性相关关系的分析是最简单的。两个变量

之间线性相关程度可以用简单线性相关系数去度量,这种相关系数是最常用的,也简称为相

关系数。对于我们所研究的总体,两个相互联系的变量的相关系数称为总体相关系数,通常

用 ρ 表示,总体相关系数 ρ 可用式(2.1)计算:

Cov( X , Y )
ρ= (2.1)
Var ( X )Var (Y )

其中: Var(X)是变量 X 的方差 ;Var(Y)是变量 Y 的方差;Cov(X,Y)是变量 X 和 Y 的协

方差

总体相关系数 ρ 反映了总体两个变量 X 和 Y 的线性相关程度,对于特定的总体来说,X

和 Y 的数值是既定的,总体相关系数 ρ 是客观存在的特定数值。然而,当总体较大时,变

量 X 和 Y 的全部数值一般不可能去直接观测,所以总体相关系数一般是不能直接计算的未知

量。通常可能做到的是从总体中随机抽取一定数量的样本,通过 X 和 Y 的样本观测值 X i 和 Yi

去计算样本相关系数,变量 X 和 Y 的样本相关系数通常用 rXY 表示,或简记为 r,可用式(2.2)

或式(2.3)去估计:

3
n∑ X iYi − ∑ X i ∑ Yi
rXY = (2.2)
n∑ X i2 − (∑ X i ) 2 n∑ Yi 2 − (∑ Yi ) 2

或 rX ,Y =
∑ ( X − X )(Y − Y )
i i
(2.3)
∑ ( X − X ) ∑ (Y − Y )
i
2
i
2

__ __
其中: X i 和 Yi 分别是变量 X 和 Y 的样本观测值; X 和 Y 分别是变量 X 和 Y 样本观测值的

平均值;n 是样本的个数,也称样本容量。

样本相关系数 r 是根据从总体中抽取的随机样本的观测值 X i 和 Yi 计算出来的,它是对

总体相关系数 ρ 的估计。可以证明,这样计算的样本相关系数是总体相关系数的一致估计。

多个变量之间的线性相关程度,则需要用复相关系数和偏相关系数去度量。

2、相关系数的特点:

由式(2.1)和式(2.2)可看出,相关系数有以下特点:

(1)相关系数的取值在-1 与 1 之间。

(2)当 r=0 时,表明 X 与 Y 没有线性相关关系。

(3)当 0 < r < 1 时,表明 X 与 Y 存在一定的线性相关关系,若 r > 0 表明 X 与 Y 为正相

关,若 r < 0 表明 X 与 Y 为负相关。

(4)当 r = 1 时,表明 X 与 Y 完全线性相关,若 r=1,称 X 与 Y 完全正相关;若 r=-1,

称 X 与 Y 完全负相关。

使用相关系数分析相关关系时应当注意:

(1)X 和 Y 都是相互对称的随机变量,所以

γ XY = γ YX (2.4)

2)相关系数只反映变量间的线性相关程度,不能说明非线性相关关系。

3)相关系数不能确定变量的因果关系,也不能说明相关关系具体接近于哪条直线。

4)样本相关系数是根据从总体中抽取的随机样本的观测值 X 和 Y 计算出来的,它只是

对总体相关系数 ρ 的估计。由于从总体中每抽取一个样本,都可以根据其观测值估计出一

个样本相关系数,因此样本相关系数不是确定的值,而是随抽样而变动的随机变量。对相关
2
系数的统计显著性还有待进行检验 。

(三)回归分析

2 对相关系数显著性检验的方法可参考有关统计学著作。

4
研究变量相互之间的相关关系时,首先需要分析它们是否存在相关关系,然后要明确其

相关关系的类型,而且还应计量其相关关系的密切程度,在统计学中这种研究称为相关分析。

相关分析主要是用一个指标(相关系数)去表明现象间相互依存关系的性质和密切程度。不

过相关分析并不能说明变量间相关关系的具体形式,也还不能从一个变量的变化去推测另一

个变量的具体变化。如果要具体测定变量之间相关关系的数量形式,还需要运用回归分析的

方法。

“回归”这个词是由英国生物学家高尔顿在遗传学研究中首先提出来的。高尔顿发现相

对于一定身高的父母,子女的平均身高有朝向人类平均身高移动或回归的趋势。这就是“回

归”的古典意义。

现在我们沿用“回归”这个词,但其意义与回归的古典意义已有很大区别。现代意义的

回归是关于一个变量(被解释变量或应变量)对另一个或多个变量(解释变量)依存关系的

研究,是用适当的数学模型去近似地表达或估计变量之间的平均变化关系,其目的是要根据

解释变量的数值去估计所研究的被解释变量的总体平均值。

例如,研究个人消费支出 Y 与个人可支配收入 X 的依存关系,对应于一定的个人可支配

收入水平,个人消费支出并不确定,但总是在一定的范围内变动。对于每一个个人可支配收

入水平,个人消费支出呈现出一定的分布,但平均来说,个人消费支出总是随着个人可支配

收入的增加而增加的,其关系可见图 2.2。

X1 X2 X3 X4 X

图 2.2 个人消费支出随个人可支配收入的变化

如果根据个人消费支出 Y 和个人可支配收入 X 的观测数据,要去确定二者变动的统计规

律性,也就要研究当解释变量个人可支配收入 X 变动时,被解释变量个人消费支出 Y 的平均

水平变动的规律,解决这样一类问题的方法是回归分析。

在理解回归分析时,应当注意回归所要揭示的是被解释变量与解释变量之间的平均关

系。在这里,被解释变量是随机变量,解释变量在本质上可以是随机变量,但在经典的回归

5
分析中解释变量作为被解释变量变动的原因,我们总是假定在重复抽样中是取某些固定的

值,所以在一般情况下解释变量是作为非随机变量来处理的。

显然,相关分析与回归分析有密切的联系,他们都是对变量间相关关系的研究,二者可

以相互补充。相关分析可以表明变量间相关关系的性质和程度,只有当变量间存在一定程度

的相关关系时,进行回归分析去寻求相关的具体数学形式才有实际的意义。同时,在进行相

关分析时,要具体确定变量间相关的数学形式,又要依赖于回归分析,而且在多个变量的相

关分析中相关系数的确定也是建立在回归分析基础上的。

同时应当明确,相关分析与回归分析的研究目的和研究方法是有明显区别的。从研究目

的上看,相关分析是用一定的数量指标(相关系数)度量变量间相互联系的方向和程度;回

归分析却是要寻求变量间联系的具体数学形式,是要根据解释变量的固定值去估计和预测被

解释变量的平均值。从对变量的处理看,相关分析对称地对待相互联系的变量,不考虑二者

的因果关系,也就是不区分解释变量和被解释变量,相关的变量不一定具有因果关系,均视

为随机变量;回归分析是建立在变量因果关系分析的基础上,研究其中解释变量的变动对被

解释变量的具体影响,回归分析中必须明确划分被解释变量和解释变量,对变量的处理是不

对称的。在经典回归分析中通常假定解释变量在重复抽样中是取固定值的非随机变量,只有

被解释变量是具有一定概率分布的随机变量。

还应当强调,相关分析和回归分析只是从数据出发定量地分析经济变量间相互联系的手

段,并不能决定经济现象相互之间的本质联系。经济现象间内在的本质联系,决定于它们的

客观规律性,需要结合实际经验去分析,并要由经济学理论去加以说明。如果对本来没有内

在联系的经济现象,仅凭数据进行相关分析和回归分析,有可能会是一种“伪相关”或“伪

回归”,这样不仅没有实际的意义,而且会导致荒谬的结论。所以在对经济问题开展相关分

析和回归分析时,要注意与定性的经济分析相结合,才能得到有实际意义的结果。

二、总体回归函数
回归分析研究的是总体中解释变量与被解释变量之间客观存在的协变规律性,在经济

现象的研究中,这种协变规律是所研究的经济总体的特征。怎样去认识经济总体中相关变量

的协变关系呢?由于实际的经济总体通常难以直接观测,这里以一个简化的例子去说明。

【例 2.1】假如有一个由某地区 100 个城镇居民家庭构成的总体,我们要研究的是该总

体家庭人均月消费支出 Y 与家庭人均月可支配收入 X 之间的关系,并要根据已知的家庭人均

月可支配收入水平去预测该总体家庭人均月消费支出的平均水平。为了研究的方便,把总体

的 100 个家庭按人均月可支配收入水平分为 10 个组,分别考察各组中每个家庭的人均月消

6
费支出(见表 2.1)。

表 2.1 家庭人均月消费支出与家庭人均月可支配收入(单位:元)

家 庭 人 均 月 可 支 配 收 入 X
3000 3500 4000 4500 5000 5500 6000 6500 7000 7500

1819 2027 2269 2304 2646 2917 3068 3383 4107 4267
1847 2118 2364 2435 2819 3028 3488 3797 4313 4800
家 1907 2212 2424 2467 2934 3166 3689 4109 4457 5004
庭 2055 2248 2473 2726 3028 3321 3755 4261 4618 5241
人 2195 2313 2523 2828 3131 3527 3899 4546 4757 5408
均 2245 2481 2581 2946 3244 3690 3920 4757 4972
月 2307 2541 2675 2976 3408 3829 4253 4771 5172
消 2409 2686 2716 3150 3496 3993 4441 4872
费 2702 2817 3174 3522 4174 4673
支 2812 2936 3349 3677 4350 4764
出 2954 3384 3776 4474
Y 3025 3514 3919
3136 3658 4119
3327 3747

E (Y X i ) 2098 2414 2730 3047 3363 3679 3995 4312 4628 4944

由表 2.1 可以看出,对于人均月可支配收入 X 的每一个固定水平,家庭人均消费支出 Y

并不确定,即是说解释变量人均月可支配收入 X 与被解释变量人均月消费支出 Y 之间不是确

定性的函数关系,而是不确定性的相关关系。在给定家庭人均月可支配收入 X 的条件下,家

庭人均月消费支出 Y 形成一定的分布,这种分布称为在 X 取某一特定值时 Y 的条件分布。当

X 取某一特定值时,Y 取各种值的概率,称为 Y 的条件概率。例如当家庭人均月可支配收入

为 3500 元 时 , 家 庭 人 均 月 消 费 支 出 为 2313 元 的 条 件 概 率 为 :

P (Y 2313
= = X 3500)
= 1/10 ,等等。对于 X 的每一个取值 X i ,根据 Y 的条件分布和条

件概率,可以计算出 Y 的条件期望或称条件均值 E (Y X i ) ,所计算的条件均值列于表 2.1

的最后一行。

对于 X 的每一个取值 X i ,都有 Y 的条件期望 E (Y X i ) 与之对应,根据表 2.1 的数据,

可作家庭人均月可支配收入 X 与家庭人均月消费支出 Y 的散点图,如图 2.3 所示:

7
图 2.3 家庭人均月可支配收入与家庭人均月消费支出的散点图

由表 2.1 和图 2.3 可以看出,虽然每个家庭的人均月消费支出存在差异,但平均来说,家

庭人均月消费支出是随家庭人均月可支配收入的递增而递增的。还可以看出,当 X i 取各种

值时,Y 的条件期望(图 2.3 中线上的点)的轨迹接近于一条直线,该直线称为 Y 对 X 的回归直

线。当然,若是 Y 的各个条件期望是位于一条曲线上,则这条曲线就称为 Y 对 X 的回归曲

线。

从上述 100 个家庭构成的总体的例子可以看出,所研究的总体被解释变量家庭人均月消

费支出 Y 的条件期望 E (Y X i ) ,会随解释变量 X 的变化而有规律的变化,如果把 Y 的条件

期望表示为 X 的某种函数,可写为:

E (Y X i ) = f ( X i ) (2.5)

如式(2.5)那样,将总体被解释变量 Y 的条件期望表现为解释变量 X 的函数,这个函

数称为总体回归函数(Population Regression Function,简记为 PRF)。式(2.5)是总体

回归函数的条件期望表示方式。

假如 Y 的总体条件期望 E (Y X i ) 是解释变量 X 的线性函数,可表示为:

E (Y X i= ) β1 + β 2 X i
) f ( X i= (2.6)

其中 β1 和 β 2 是未知的参数, β1 称为截距系数, β 2 称为斜率系数。

需要指出,在实际的经济问题中,总体包含的单位数通常相当多,一般情况下不大可能

像假定的 100 个家庭那样去取得总体所有的观测值,也不大可能直接计算 Y 的条件期望值。

所以事实上总体回归函数的具体形式,只能根据经济理论对所研究经济问题的深刻认识以及

8
实践经验去设定,也就是说需要对总体回归函数作出合理的假设。

在计量经济学中经常把总体回归函数设定为线性函数,这是因为线性函数是最简单的函

数形式,而且线性回归函数中参数的估计与检验相对容易,用线性模型去近似地描述总体回

归函数,常能获得较好的效果。

在计量经济学中线性模型的“线性“有两种解释:一是模型就变量而言是线性的,即 Y

的条件期望 E (Y X i ) 是解释变量 X i 的线性函数,这时回归线是一条直线。按这一原则,例

如 E (Y X i=
) β1 + β 2 X i2 或 E (Y X i=
) β1 + β 2 (1 X i ) 都不是线性回归模型。二是模型就参

数而言是线性的,即 Y 的条件期望 E (Y X i ) 是参数 β 的线性函数,而对于解释变量 X i 则可

以 是 线 性 的 , 也 可 以 是 非 线 性 的 。 按 这 一 原 则 , 例 如 E (Y X i=
) β1 + β 2 X i2 或

) β1 + β 2 X i 或
) β1 + β 2 (1 X i ) 都 是 线 性 回 归 模 型 , 而 E (Y X i=
E (Y X i=

) β1 + (1 β 2 ) X i 则不是线性回归模型。在计量经济学中,从回归理论和参数的估
E (Y X i=

计方法考虑,通常是就参数而言判断是否线性回归模型,而对解释变量 X i 则可以是线性的

也可以是非线性的。

三、随机扰动项 u

以条件期望表现的总体回归函数 E (Y X i ) 描述的是随着解释变量的变化被解释变量的

平均变动。但是相对于一定的 X i ,Y 的个别值 Yi 并不全在代表平均值轨迹的回归线上,而

是围绕回归线上下波动,也就是说个别值 Yi 总是分布在条件期望 E (Y X i ) 的周围。若令各

个 Yi 值与条件期望 E (Y X i ) 的偏差为 ui ,显然 ui 是个可正可负的随机变量,称为随机扰动项

或随机误差项。即

u=
i Yi − E (Y X i ) (2.7)

或 =Yi E (Y X i ) + ui (2.8)

式(2.8)是总体回归函数的个别值表示方式,或称随机设定形式。

如果总体回归函数是只有一个解释变量的线性函数,则有

ui = Yi − β1 − β 2 X

或 β1 + β 2 X i + ui
Yi = (2.9)

9
式(2.9)表明,除了已列入模型的解释变量 X 以外,还有影响被解释变量 Y 变动的其他

因素,这里的随机扰动项 ui 就代表着那些对 Y 有影响但又未纳入模型的诸多因素的综合影

响。

从式(2.5)和式(2.8)可以看出,条件期望表示方式与个别值表示方式是等价的。因为若

对式(2.8)两边取其对于 X i 的条件期望,则有

E (Y X i ) E{E ( Y X i )} + E (ui X i )
=

= E (Y X i ) + E (ui X i )

显然,这里暗含着 E (ui X i ) = 0 的假定条件,也就是回归线是通过 Y 的条件期望或条件均值

的。

在总体回归函数中引进随机扰动项,主要有以下几方面的原因:

(1)作为未知影响因素的代表。由于对所研究的经济现象的变动规律的认识并不完备,

除了一些已知的主要因素以外,还有一些未被认识或尚不能肯定的因素影响着被解释变量,

因此只得用随机扰动项作为被模型省略掉的未知因素的代表。

(2)作为无法取得数据的已知因素的代表。有一些因素已经知道对被解释变量有相当的

影响,但可能无法获得这些变量的定量数据。例如,在研究家庭消费支出时,根据有关经济

理论的分析,认为家庭财产的数量对家庭消费支出也有影响,可是一般情况下取得家庭财产

的数据有困难,在计量经济模型中不得不把家庭财产略去,而这类变量的影响被归入到随机

扰动项。

(3)作为众多细小影响因素的综合代表。某些影响因素已经被认识到,其数据也可能获

得,例如影响家庭消费支出的还可能有子女人数、性别构成、民族习惯、受教育程度,等等,

但是这些因素或许对被解释变量家庭消费支出的影响相对比较小,或许其影响不很规则、有

的可能不易数量化,从经济计量的成本考虑,通常不把它们列入模型,而将它们的联合影响

处理为随机扰动项。

(4)模型的设定误差。在设定经济计量模型时,总是力图使模型更为简单明了,当用较

少的解释变量就能说明被解释变量的实质变化时,就不应把更多的解释变量列入模型;当用

较简洁的函数形式就能说明变量之间的本质联系时,就尽量不采用更为复杂的函数形式。这

样,变量和函数形式的设定可能会引起设定误差,这种设定误差也要由随机扰动项来表示。

(5)变量的观测误差。对社会经济现象观测所得到的统计数据,由于主客观的原因,可

10
能会有一定的观测误差,这种观测误差只有归入随机扰动项。

(6)经济现象的内在随机性。即使把所有相关的影响因素全部纳入模型,即使不存在观

测误差,人所从事的一些经济行为还是可能具有不可重复性和随机性。例如,某些涉及人们

思想行为的变量,很难完全控制,而是具有内在的随机性,这种内在的随机性也可能影响人

们的经济行为。这类经济现象内在随机性的影响只能归入随机扰动项。

由此可见,随机扰动项有十分丰富的内容,在计量经济研究中起着重要的作用。对随机

扰动项的处理是计量经济分析中的重要内容,一定程度上,随机扰动项的性质决定着计量经

济方法的选择和使用。

四、样本回归函数
对于实际的经济问题,通常总体包含的单位数很多,无法掌握所有单位的数值,总体

回归函数实际上是未知的。我们可能做到的只是对应于解释变量 X 的选定水平,对被解释变

量 Y 的某些样本进行观测,然后通过对样本观测获得的信息去估计总体回归函数。

仍然以【例 2.1】中 100 个家庭的人均月可支配收入与家庭人均月消费支出为例,假设

从 100 个家庭的总体中各随机抽取 10 个家庭进行观测,形成了两个随机样本,如表 2.2 和

表 2.3 所示:

表 2.2 随机样本(一) 单位:元

人均月可支配收入 X 3000 3500 4000 4500 5000 5500 6000 6500 7000 7500

人均月消费支出 Y 2195 2313 2675 2976 3244 3527 3899 4109 4618 4800

表 2.3 随机样本(二) 单位:元

人均月可支配收入 X 3000 3500 4000 4500 5000 5500 6000 6500 7000 7500

人均月消费支出 Y 2195 2248 2716 2828 3131 3690 3920 4261 4457 5004

可将两个随机样本的数据绘制成散点图,其示意图见图 2.4。

Y
SRF1• *
* * SRF2
* *
• * •

*• • *

11
图 2.4 两个随机样本的示意图

从总体中抽取一定样本数据进行观测,对于解释变量 X 的一定值,取得的被解释变量 Y

的样本观测值也可计算其条件均值,
Y 的样本观测值的条件均值随解释变量 X 而变动的轨迹,

称为样本回归线。图 2.4 中所示的两条直线就是分别通过两个样本观测值拟合的最适合的样

本回归直线。当然如果所拟合的是曲线,就称为样本回归曲线。

从图 2.4 可以看出,被解释变量(人均月消费支出)的样本条件均值也是随解释变量(人

均月可支配收入)的变化而有规律的变化的。如果把被解释变量 Y 的样本条件均值表示为解

释变量 X 的某种函数,这个函数称为样本回归函数(Sample Regression Function,简记为

SRF)。显然,样本回归函数的函数形式应与设定的总体回归函数的函数形式一致。样本回归

函数如为线性函数,可表示为:

ˆ βˆ + βˆ X
Y= (2.10)
i 1 2 i

其中,Yˆi 是 回归线上与 X i 相对应的 Y 的样本条件均值,可视为对总体条件期望 E (Y X i ) 的

估计值; β̂1 和 β̂ 2 分别是样本回归函数的截距系数和斜率系数,可视为对总体回归函数中系

数 β1 和 β 2 的估计。

与总体回归函数相类似,实际观测的被解释变量值 Yi 并不完全等于样本条件均值 Yˆi ,

二者之差可用 ei 表示,那么

Yi − Yˆi =
ei (2.11)

或者 βˆ1 + βˆ2 X i + ei
Yi = (2.12)

式(2.12)是样本回归函数的另一种表达形式,与式(2,10)是等价的,这里的 ei 称为剩余

项,或称为残差, ei 在概念上类似于总体回归的随机扰动项 ui 。在样本回归函数中引入 ei 的

原因,与将 ui 引入总体回归函数的理由是相同的。

必须明确,样本回归函数与总体回归函数是有区别的。首先,总体回归函数虽然未知,

但它是确定的;而由于从总体中每次抽样都能获得一个样本,就都可以拟合一条样本回归线,

所以样本回归线是随抽样波动而变化的,可以有许多条。所以,样本回归线还不是总体回归

线,至多只是未知的总体回归线的近似反映。其次,总体回归函数的参数 β 1 和 β 2 是确定的

12
常数;而样本回归函数的参数 β̂1 和 β̂ 2 是随抽样而变化的随机变量。此外,总体回归函数中

的 ui 是不可直接观测的;而样本回归函数中的 ei 是只要估计出样本回归的参数就可以计算

的数值。

表示总体经济活动规律的总体回归函数是未知的,在计量经济学中进行回归分析的目

的,就是要根据有可能获得的样本回归函数去对总体回归函数作出合理的估计。然而,样本

毕竟不等于总体,样本回归函数 SRF 几乎总是与总体回归 PRF 存在着差异,二者的关系可以

从图 2.5 中看出:

Yi

et SRF
ui
Yˆi PRF

E (Y X i )
A

Xi X
图 2.5 总体回归函数与样本回归函数的关系

回归分析的目的是要用样本回归函数去尽可能准确的估计总体回归函数。由于样本对总

体存在代表性误差,SRF 又总会过高或过低估计 PRF。例如,图 2.5 中 A 点右边部分就过高

估计了 PRF,A 点左边部分又过低估计了 PRF。显然,需要寻求一种规则和方法,使得到的

样本回归函数的参数 β̂1 和 β̂ 2 能够“尽可能地接近”总体回归函数中的参数 β 1 和 β 2 。这是

计量经济学应当解决的参数估计的基本问题。

第二节 简单线性回归模型参数的估计

估计线性回归模型中参数的方法有若干种,这些估计方法都是以对模型的某些假定条件

为前提的。因为只有具备这些假定条件,所作出的估计才具有良好的统计性质。所以,这些

假设与所采用的估计方法是紧密相关的。

一、简单线性回归的基本假定
对简单线性回归模型的基本假定有两个方面:一是对变量和模型的假定;二是对随机扰

13
动项 ui 统计分布的假定。

在简单线性回归模型中对变量和模型的假定,首先是假定解释变量 X i 是确定性变量,

是非随机的,这是因为在重复抽样中 X i 是取一组固定的值。或者 X i 虽然是随机的,但与随

机扰动项 ui 也是不相关的。其次,是假定模型中的变量没有测量误差。此外,还要假设模

型对变量和函数形式的设定是正确的,即不存在设定误差。

为了使对模型的估计具有良好的统计性质,在计量经济研究中对无法直接观测的随机扰

动项 ui 的分布,需要作如下一些基本假定 3:

假定 1 零均值假定, 即在给定解释变量 X i 的条件下,随机扰动项 ui 的条件期望或条

件均值为零

E (ui X i ) = 0 (2.13)

假定 2 同方差假定, 即对于给定的每一个 X i ,随机扰动项 ui 的条件方差都等于某一

个常数 σ
2

2
Var (ui X i ) =
E[ui − E (ui X i )] = σ2
E (ui2 ) = (2.14)

其中,Var 表示方差。

假定 3 无自相关假定,即随机扰动项 ui 的逐次值互不相关,或者说对于所有的 i 和 j

( i ≠ j ), ui 和 u j 的协方差为零

Cov(ui , u j ) =
E[ui − E (ui )][u j − E (u j )]

= E (ui u j )
(2.15)
=0

其中,Cov 表示协方差。

假定 4 随机扰动项 ui 与解释变量 X i 不相关,可表示为

Cov(ui , X i ) =E[ui − E (ui )][ X i − E ( X i )] =


0 (2.16)

这一假定表明模型中的 X i 和 ui 是各自独立影响 Yi 的,这样才能分清楚解释变量 X i 与随机

3在计量经济学中,被解释变量和随机扰动项的期望、方差、协方差通常均为条件期望、条件方差、条件
协方差,但为了表述更为简洁,本书各章的公式中除了特别说明以外将不标出其条件。

14
扰动项 ui 分别对 Yi 的影响各为多少。

正态性假定,即假定随机扰动项 ui 服从期望为零,方差为 σ 的正态分布,表


2
假定 5

示为

ui ~ N (0, σ 2 ) (2.17)

以上这些对随机扰动项 ui 分布的假定是德国数学家高斯最早提出的,也称为高斯假定

或古典假定。满足以上古典假定的线性回归模型,也称为古典线性回归模型(Classical Linear

Regression Model, CLRM)


β1 + β 2 X i + ui , Yi 的分布性质决定于 ui ,为此,对 ui 的零均值、


顺便指出,由于 Yi =

同方差、无自相关及正态性假定也可以用对 Yi 的假定来表示:

由假定 1 式(2.13)有

) β1 + β 2 X i
E (Yi X i= (2.18)

由假定 2 式(2.14)有

Var (Yi X i ) = σ 2 (2.19)

由假定 3 式(2.15)有

Cov(Yi , Y j ) = 0 (i ≠ j ) (2.20

由假定 5 式(2.17)有

Yi ~ N ( β1 + β 2 X i , σ 2 ) (2.21)

容易证明,以上对 Yi 分布性质的假定与对随机扰动项 ui 分布的古典假定是等价的。

二、普通最小二乘法

β1 + β 2 X i + ui ,然而能够得到的只
计量经济研究的直接目的是确定总体回归函数 Yi =

是来自总体的若干样本的观测值,要用样本信息建立的样本回归函数“尽可能接近”地去估

计总体回归函数。为此,可以从不同的角度去确定建立样本回归函数的准则,也就有了估计

回归模型参数的多种方法。例如用产生该样本概率最大的原则去确定样本回归函数,称为极

大似然准则;用使估计的剩余平方和最小的原则确定样本回归函数,称为最小二乘准则。本

章只介绍在古典假定下的最小二乘法,也称为普通最小二乘估计(Ordinary Least Squares

Estimators,OLS 或 OLSE)。

15
为了使样本回归函数“尽可能接近”总体回归函数,就是要使样本回归函数

ˆ βˆ + βˆ X 估计的 Yˆ 与实际的 Y 的误差尽量小,即是说要使剩余项 e 越小越好。可是作


Y=i 1 2 i i i i

为误差 ei 有正有负,其简单代数和 ∑ ei 会相互抵消而趋于零。为使在数学上便于处理,可采

用剩余平方和 ∑ ei2 最小的准则,这就是最小二乘准则,即

− Yˆi ) 2 min ∑ (Yi − βˆ1 − βˆ2 X i ) 2


∑ ei2 min ∑ (Yi =
min=

根据微积分中多元函数极值原理,要使 ∑ ei2 达到最小,待定系数 β̂1 和 β̂ 2 应满足以下条件

∂ (∑ ei2 )
=−2∑ (Yi − βˆ1 − βˆ2 X i ) =
0 (2.22)
ˆ
∂β1

∂ (∑ ei2 )
=−2∑ (Yi − βˆ1 − βˆ2 X i ) X i =
0 (2.23)
∂βˆ
2

从而得如下方程组

∑=
Y i nβˆ1 + βˆ2 ∑ X i (2.24)


= XY i i βˆ1 ∑ X i + βˆ2 ∑ X i2 (2.25)

其中的 n 为样本容量。式(2.24)和式(2.25)的方程组称为最小二乘的正规方程组。根据克莱姆

法则解正规方程组,得

n∑ X iYi − ∑ X i ∑ Yi
βˆ2 = (2.26)
n∑ X i2 − (∑ X i ) 2

βˆ1 = ∑
X i2 ∑ Yi − ∑ X i ∑ X iYi
(2.27)
n∑ X i2 − (∑ X i ) 2

式(2.26)和式(2.27)即是用样本观测值 X i 和 Yi 表现的 β̂1 和 β̂ 2 的最小二乘估计量。

如果令 x=
i X i − X , y=
i Yi − Y , xi 和 yi 分别称为 X i 和 Yi 的离差形式 4。容易证明,

式(2.26)和式(2.27)可用离差形式表示为

=βˆ2 ∑
=
( X − X )(Y − Y ) ∑ x y
i i i i
(2.28)
∑(X − X ) i ∑x 2 2
i

4 为了使表现形式尽量简洁,本书中一律用大写字母 X i 、 Yi 等表示观测值,用小写字母 xi 、 yi 等表示观


测值的离差。

16
βˆ1= Y − βˆ2 X (2.29)

式(2.26)和式(2.27)或者式(2.28)和式(2.29)是根据最小二乘准则推导出来的,称为简

单线性回归模型参数的最小二乘估计量,由这些估计量可直接用样本观测值计算出参数的估

计值。

【例 2.2】 为了估计【例 2.1】的样本回归函数,通过表 2.2 样本(一)的数据可计算相

关的数据,如表 2.4 所示。

表 2.4 样本(一)相关数据 (单位:元)

序号 人均可 人均消费
x=i X i − X y=i Yi − Y xi yi xi2
支配收 支出 Yi
入 Xi
1 3000 2195 -2250 -1240.6 2791350 5062500
2 3500 2313 -1750 -1122.6 1964550 3062500
3 4000 2675 -1250 -760.6 950750 1562500
4 4500 2976 -750 -459.6 344700 562500
5 5000 3244 -250 -191.6 47900 62500
6 5500 3527 250 91.4 22850 62500
7 6000 3899 750 463.4 347550 562500
8 6500 4109 1250 673.4 841750 1562500
9 7000 4618 1750 1182.4 2069200 3062500
10 7500 4800 2250 1364.4 3069900 5062500
合计 52500 34356 12450500 20625000
平均 5250 3435.6
将有关数据代入式(2.28)和式(2.29),得

=βˆ2 ∑
=
xy i i 12450500
= 0.60366
∑x 2
i 20625000

βˆ1 =−
Y βˆ2 X =
3435.6 − 0.60366 × 5250 =
266.382

即样本回归函数为

=Yˆi 266.382 + 0.60366 X i

三、OLS 回归线的性质
用普通最小二乘法拟合的样本回归线有以下性质:

(1)样本回归线通过样本均值。由式(2.29)可得 Y= βˆ1 + βˆ2 X ,所以样本回归线必

然通过( X , Y ),如图 2.6 所示。

17
Y

× × SRF

× × ×

Y × ×

× ×

0 X X

图 2.6 样本回归线通过样本均值

(2)估计值 Yˆi 的均值


∑Yˆ i
等于实际值 Yi 的均值 Y 。因为
n

∑Yˆ i 1 (βˆ + βˆ X )
=
n n
∑ 1 2 i
1
= βˆ1 + βˆ2 ∑ X i
n
= βˆ1 + βˆ2 X

=Y (2.30)

(3)剩余项 ei 的均值为零。由最小二乘准则已知式(2.22),且

ei = Yi − βˆ1 − βˆ2 X i

所以

∑ e= ∑ (Y − βˆ − βˆ X =)
i i 1 2 i 0

可知

=e

=
e i
0 (2.31)
n

(4)被解释变量估计值 Yˆi 与剩余项 ei 不相关。这是因为 Yˆi 与 ei 由离差形式表示的样本

相关系数为

rYˆ ,e =
∑ yˆ e i i
i i
∑ yˆ ∑ e2
i
2
i

18
其中, ∑ yˆi ei
= ∑ yˆ ( y − βˆ x )
i i 2 i

= ∑ (βˆ x )( y − βˆ x )
2 i i 2 i

= βˆ2 ∑ xi yi − βˆ22 ∑ xi2

= βˆ22 ∑ xi2 −βˆ22 ∑ xi2

=0

rYˆ ,e = 0 (2.32)
i i

(5)解释变量 X i 与剩余项 ei 不相关。因为 X i 与 ei 由离差形式表示的样本相关系数为

rX i ,ei =
∑X e i i

∑ x ∑e
2
i
2
i

由 OLS 正规方程式(2.23)

∑ (Y − βˆ − βˆ X )=
i X ∑ X=
1 e 2 i i i i 0

所以

rX i ,ei = 0 (2.33)

普通最小二乘法估计的回归线所具有的以上性质,在计量经济方法的估计、检验以及一些结

论的证明中都会用到,具有重要的意义。

四、最小二乘估计量的统计性质

(一)参数估计量的评价标准
计量经济模型中的的参数一般是未知的,需要根据样本信息去加以估计。所估计的参数

β̂1 和 β̂ 2 等都是样本数据的函数。由于取得的样本不同,样本数据也不同,即存在“抽样波

动”,因此参数的估计值是随抽样而变化的随机变量,加之估计方法和假设前提不一定那么

完备,用样本估计的参数数值不一定等于总体参数的真实值。那么,在比较不同估计方法的

估计结果时,需要有一定的评价标准,这个标准就是应使参数估计值“尽可能地接近”总体

参数的真实值。作为一个随机变量,参数估计值怎样才算“尽可能地接近”总体参数的真实

值呢?理论计量经济学一般并不直接分析具体的参数估计值本身,而是研究所得出的参数估

计量是否符合一定的标准。通常选择参数的估计量时主要应考虑以下一些标准:

19
1.无偏性

如果已经确定了模型参数 β 的估计量 β̂ ,在重复抽样中可取得变量一系列的观测值,

将这些样本观测值代入参数估计量 β̂ ,可得到参数的一系列估计值,这些参数估计值的分

布称为 β̂ 的抽样分布,其密度函数记为 f ( βˆ ) 。假如用另外一种方式确定了模型参数 β 的另

一个估计量 β ,其抽样分布的密度函数记为 f ( β ) 。
* *

如果参数的估计量 β̂ 的期望等于参数的真实值 β ,即 E ( βˆ ) = β ,则称 β̂ 是参数 β 的

无偏估计量。如果参数估计量 β 的期望值不等于参数 β 的真实值,则称 β 是有偏的,其偏


* *

倚为 E ( β ) − β 。其关系如图 2.7 所示:


*



密 f ( βˆ ) f (β ∗ )

偏倚

β E (β ∗ ) β估计值

图 2.7 无偏估计与有偏估计

显然,在计量经济研究中应尽可能寻求符合无偏性要求的参数估计量。

2. 有效性

在计量经济研究中,通常用不同的方法可以获得若干不同的参数估计量,虽然这些估计

量可能都具有无偏性,但其抽样分布的方差可能不同。一个估计量若不仅具有无偏性而且具

有最小方差性时,称这个估计量为有效估计量。即是说,对于无偏估计量 β̂ ,如果参数 β 的

任意一个无偏估计量 β ,都有 Var ( βˆ ) ≤ Var ( β ) ,则称 β̂ 是参数 β 的有效估计量。如图


* *

2.8 所示,若 β̂ 和 β 的期望值都是 β ,但若 β̂ 的方差最小,则 β̂ 是有效估计量。


*

20
概 f ( βˆ )


f (β ∗ )

β β估计值
图 2.8 有效估计量

3. 一致性

在样本容量较小的情况下,有时很难找到最佳无偏估计量,这时还需要考虑当样本容量

充分大或趋于无穷大时估计量的渐近性质。

当样本容量趋于无穷大时,如果估计量 β̂ 的抽样分布依概率收敛于总体参数的真实值

β ,即

P lim βˆ = β
n →∞

lim P ( βˆ − β ) < ε ) =
1 (2.34)
n →∞

也就是说当样本容量 n → ∞ 时,估计量 β̂ 与总体参数真实值 β 的距离 β̂ − β 的绝对值小于

任意给定的正数 ε 的概率等于 1,则称估计量 β̂ 为一致估计量。

(二)OLS 估计量的统计特性

可以证明,在古典假定完全满足的条件下,回归模型参数的最小二乘估计量具有以下

统计性质:

1. 线性特性

对于简单线性回归模型的最小二乘估计,因为

βˆ2 = ∑
xi yi
∑x 2
i

=
∑xY
i i

∑x 2
i

21
xi
=∑ Yi
∑ xi2
xi
若令 = ki ,在重复抽样中, X i 取一组固定的值, ki 是一组常数。且 ki 具有 ∑ ki = 0 ,
∑ xi2
∑k X i i = 1 的性质。则有

βˆ2 = ∑ kiYi (2.35)

其中 ki 是一组常数,所以 β̂ 2 是 Yi 的线性函数。

类似地,

βˆ1= Y − βˆ2 X

= Y − X ∑ kiYi

1
= ∑ ( n − Xk )Y i i (2.36)

其中:n、 X 、 ki 均为固定常数,所以 β̂1 也是 Yi 的线性函数。

2.无偏性

由式(2.35) βˆ2 = ∑ kiYi

= ∑ k (β
i 1 + β 2 X i + ui )

β1 ∑ ki + β 2 ∑ ki X i + ∑ ki ui
=

= β 2 + ∑ ki ui (2.37)

则有 ( βˆ2 ) E ( β 2 ) + E (∑ ki ui )
E=

= β 2 + ∑ ki E (ui ) (2.38)

由古典假定 E (ui ) = 0 ,所以

E ( βˆ2 ) = β 2 (2.39)

此外 βˆ1 ) E (Y − βˆ2 X )
E (=

= E (Y ) − XE ( βˆ2 )

=( β1 + β 2 X ) − X β 2

22
则有 E ( βˆ1 ) = β1 (2.40)

这表明普通最小二乘法估计的参数 β̂1 和 β̂ 2 的期望值等于总体回归函数参数真实值 β1

和 β 2 ,所以 OLS 估计式是无偏估计量。

3.有效性

为了说明 OLS 估计式的方差特性,必须导出 β̂1 和 β̂ 2 方差的公式:

βˆ2 ) E[ βˆ2 − E ( βˆ2 )]2


Var (=

= E ( βˆ2 − β 2 ) 2

由式(2.37)

Var ( βˆ2 ) =E ( β 2 + ∑ ki ui − β 2 ) 2

= E ( ∑ ki ui ) 2

= E[
∑xu ]i i 2

∑x 2
i

∑ x E (u
2
i
2
i ) + 2∑ xi x j E (ui u j )
i≠ j
=
(∑ x ) 2 2
i

在同方差 Var (u=


i Xi ) (ui )
E= 2
σ 2 和无自相关 Cov(=
ui , u j ) E=
(ui u j ) 0 假定成立时,有

σ2
Var ( βˆ2 ) = (2.41)
∑ xi2
类似地可以导出

Var ( βˆ ) = σ 2
∑X i
2

(2.42)
n∑ x
1 2
i

可以证明,在总体回归函数参数 β1 和 β 2 的所有无偏估计量中,普通最小二乘估计 β̂1 和

β̂ 2 具有最小的方差,其证明过程较为繁琐,可见本章附录 2.1。

在计量经济学中还常用标准误差去度量估计量的精确性,标准误差是方差的平方根,可

用 SE(Standerd error)表示,,所以

23
σ
SE ( βˆ2 ) = (2.43)
∑ xi2

SE ( βˆ ) = σ
∑X i
2

(2.44)
n∑ x
1 2
i

在 β̂1 和 β̂ 2 的方差和标准误差的计算公式中,除了样本观测值以外,都包含了随机扰动

项 ui 的方差 σ 或 σ ,然而 σ 作为总体随机扰动项 ui 的方差是未知的,也需要通过样本去


2 2

估计。可以证明,在简单线性回归模型中,用式(2.45)计算的 σ 的估计值 σˆ 是对 σ 的
2 2 2

无偏估计(证明过程见本章附录 2.2):

σˆ 2 = ∑
ei2
(2.45)
n−2

式中: ∑e2
i 是剩余平方和; n − 2 是自由度。

例如,在【例 2.2】中运用表 2.2 样本(一)的数据已估计出参数为 βˆ1 = 266.382 ,

βˆ2 = 0.60366 。 由 于 总 体 方 差 σ 2 未 知 , 可 用 估 计 的 Yˆi 和 表 2.4 中 的 数 据 算 出

∑e 2
i = 46116.02 通过式(2.45)去估计,即

σˆ 2
=

=
e 2
i 46116.02
= 5764.50
n−2 10 − 2

σˆ
= σˆ 2
= 5764.50
= 75.9243

由以上的分析可以看出,在古典假定条件下,OLS 估计量 β̂1 和 β̂ 2 是总体参数 β1 和 β 2 的

最佳线性无偏估计量(Best Linear Unbiased Estimator, 简记为 BLUE),这一结论称为高斯—

马尔可夫定理。OLS 估计量的这些特性具有很重要的意义。因为在其他条件不变的情况下,

线性估计量不仅比非线性估计量更为简单,计算更为方便,而且线性估计量比较容易确定其

概率分布性质。此外 OLS 估计的最小方差特性和无偏特性结合起来,使得按同样的置信度,

OLS 估计量的置信区间最小,最集中于真实值周围。所以寻求最佳线性无偏估计量是计量

经济学努力的目标,这也是 OLS 估计法能得到广泛应用的重要原因。不过应当特别强调,

OLS 估计量 β̂1 和 β̂ 2 之所以具有最佳线性无偏的优良性质,其前提条件是我们一开始就明确

的基本假定都满足,在本章及附录 2.1 对 OLS 估计量 β̂1 和 β̂ 2 无偏性和有效性的证明中,直

24
接用到了基本假定条件,如果这些假定条件不满足,OLS 估计量将不一定是最佳线性无偏

估计量。

第三节 拟合优度的度量

样本回归线是对样本数据的一种拟合,对于同一组样本数据来说,用不同的方法估计回

归函数的参数,可拟合出不同的回归线。从散点图上看,样本回归线对样本观测值总是存在

或正或负的偏离。所估计的样本回归线对样本观测数据拟合的优劣程度,称为样本回归线的

拟合优度。为了评价所建立的样本回归函数对样本观测值的拟合程度,需要对模型的拟合优

度加以度量。在计量经济学中,度量模型拟合优度的可决系数建立在对被解释变量总变差分

解的基础之上。

一、总变差的分解
回顾已经估计的样本回归函数

Yi = βˆ1 + βˆ2 X i + ei = Yˆi + ei

如果以被解释变量平均值 Y 为基准,说明被解释变量观测值 Yi 和估计值 Yˆi 对 Y 的偏离程度,

上式可用离差表示为

(Yi − Y ) = (Yˆi − Y ) + ei (2.46)

式(2.46)中各变量的关系如图 2.9 所示:

Y
Yi
SRF
ei
Yi − Y

Yˆi − Y
Y

0 Xi
X X

图 2.9 总变差的分解

将式(2.46)两边平方并对所有观测值加总,得到
__ __

∑ (Y − Y ) = ∑ (Yˆ − Y ) + ∑ (Y − Yˆ )
i
2
i
2
i i
2
(2.47)

25

∑=
y ∑ yˆ + ∑ e
2
i
2
i
2
i (2.48)

在式(2.47)或式 (2.48)中:
__
(1)被解释变量 Y 的样本观测值与其平均值的离差平方和 ∑ (Y − Y ) =
i ∑y 2 2
i ,称为

总变差或总离差平方和(total sum of squares),用 TSS 表示。


__
(2)被解释变量 Y 的样本估计值与其平均值的离差平方和 ∑ (Yˆi − Y )2 =
∑ yˆi2 ,称为
由回归解释的平方和(explained sum of squares),是由模型回归线作出解释的变差,用 ESS

表示。

(3)被解释变量观测值与估计值之差的平方和 ∑ (Y − Yˆ ) =
i ∑e i
2 2
i ,是回归线未作出

解释的平方和或残差平方和(residual sum of squares),用 RSS 表示。

这样,式(2.47)或式(2.48)也可写为

TSS = ESS + RSS (2.49)

二、可决系数
__
将式(2.47)两边同除以 TSS= ∑ (Yi − Y )2 ,得
__

=1
∑ (Yˆ − Y ) + ∑ (Y − Yˆ )
i
2
i i
2

(2.50)
__ __

∑ (Y − Y ) ∑ (Y − Y )
i
2
i
2

=1
∑ yˆ2
i
+
∑e 2
i
(2.51)
∑y 2
i ∑y i
2

式(2.50)或式(2.51)中 ∑ (Yˆ − Y ) ∑ (Y − Y ) =
i
2
∑ yˆ ∑ y i
2 2
i
2
i 是由样本回归作出解释的离

^
差平方和在总离差平方和中占的比重; ∑ (Y − Y ) ∑ (Y − Y ) =
i i∑e ∑ y
2
i
2 2
i
2
i 是模型回

归线没有作出解释的离差平方和在总离差平方和中占的比重。

显然,如果样本回归线对样本观测值拟合程度越好,各样本观测点与回归线靠得越近,

由样本回归作出解释的离差平方和在总离差平方和中占的比重也将越大,反之拟合程度越

差,这部分所占比重就越小。所以 ∑ (Yˆ − Y ) ∑ (Y − Y ) =
i ∑ yˆ ∑ y
2
i
2 2
i
2
i 可以作为综合

度量回归模型对样本观测值拟合优度的指标,这一比例称为可决系数(或称判定系数),在

26
2 2
简单线性回归中一般用 r 或 R 表示,即

2 ∑ (Yˆ − Y )
i ∑ yˆ 2 2
i
=R = (2.52)
∑ (Y − Y ) ∑ y
i
2 2
i

或 R 2
1−
=
∑ (Y − Yˆ ) i i
2

1−
=
∑e 2
i
(2.53)
∑ (Y − Y ) i
2
∑y i
2

例如【例 2.2】用样本(一)数据估计的样本线性回归模型,由估计的 Yˆi 和表 2.4 中的相

关数据可以计算出 ∑e 2
i =46116.02 和 ∑y 2
i =7561992,则可计算出可决系数为:

R 2
1−
=
∑e 2
i
1−
=
46116.02
1 − 0.006098 =
= 0.9939
∑y i
2
7561992

这说明,在样本(一) 被解释变量(人均月消费支出) 观测值的总变差中,有 99.39%由所估计

的样本回归模型作出了解释。

2
可决系数 R 有如下特点:

(1)可决系数是非负的统计量;

2
(2)可决系数取值范围: 0 ≤ R ≤ 1 ;

2
(3)可决系数是样本观测值的函数,可决系数 R 是随抽样而变动的随机变量;

三、可决系数与相关系数的关系
2
可决系数与相关系数既有联系又有区别。在一元线性回归中,可决系数 R 在数值上是

2
简单线性相关系数 r 的平方,即 r = ± R 。

由式(2.2),样本相关系数为

rXY =
∑ ( X − X )(Y − Y ) i i

∑ ( X − X ) ∑ (Y − Y )
i
2
i
2

2
容易证明,可决系数 R 也可表示为

[∑ ( X i − X )(Yi − Y )]2
R2 = (2.54)
∑(X i − X ) 2 ∑ (Yi − Y ) 2

虽然可决系数在数值上等于简单线性相关系数的平方,但是应注意二者在概念上是有明

2
显区别的。首先,从意义上讲,可决系数 R 是就估计的回归模型而言,度量回归模型对样

27
本观测值的拟合程度,也就是模型中解释变量对被解释变量变差的解释程度;相关系数是就

两个变量而言,说明两个变量的线性依存程度。其次,可决系数度量的是解释变量与被解释

变量不对称的因果关系,是在回归分析的基础上说明 X 对 Y 的变差的解释比例,并不说明

Y 对 X 的解释;而相关系数 r 度量的是 X 与 Y 对称的相关关系,不涉及 X 与 Y 具体的因果

2
关系。而且,可决系数具有非负性,取值范围为 0≦ R ≦1;而相关系数可正可负,取值范

围为-1≦ r ≦1。

在计量经济学中,主要研究回归模型的估计、检验和应用,所以从回归分析的实际应用

看,可决系数比相关系数更有意义。

第四节 回归系数的假设检验和区间估计

一、OLS 估计的分布性质

用样本数据通过 OLS 法估计的参数 β̂1 和 β̂ 2 都是随抽样而变化的随机变量,由于存在抽

样波动,用样本得出的估计值并不一定等于参数的真实值。为此,还需要通过估计的 β̂1 和 β̂ 2

去对总体参数 β1 和 β 2 的真实值作进一步的说明和推断,这要求首先明确 β̂1 和 β̂ 2 的具体分

布性质。

前面已经指出,在古典假定条件下,假定随机扰动项 ui 服从正态分布,为此 Yi 也服从

正态分布。本章第二节已证明了 β̂1 和 β̂ 2 都是 Yi 的线性函数,所以即使在小样本情况下, β̂1

和 β̂ 2 也服从正态分布。在大样本情况下,即使 Yi 不服从正态分布, β̂1 和 β̂ 2 的分布也会趋

于正态分布。前面还证明了 β̂1 和 β̂ 2 是无偏估计,并确定了其方差的计算公式,所以 β̂1 和 β̂ 2

的具体分布性质可以表示为

βˆ1 ~ N ( β1 , σ 2 ∑X i
2

) (2.55)
n∑ x i
2

σ2
βˆ2 ~ N ( β 2 , ) (2.56)
∑x 2
i

若将正态随机变量 β̂1 和 β̂ 2 作标准化变换

28
βˆ1 − β1 βˆ1 − β1
=z1 = ~ N (0,1) (2.57)
SE ( βˆ1 )
σ 2 ∑ i2
X2
n∑ xi

βˆ2 − β 2 βˆ2 − β 2
=z2 = ~ N (0,1) (2.58)
SE ( βˆ2 ) σ2 ∑ xi2
即经标准化变换的 z1 和 z2 均服从标准正态分布。

可是, β̂1 和 β̂ 2 的方差以及标准正态变量 z1 和 z2 的确定,都要涉及随机扰动项 ui 的方

差 σ ,而总体随机扰动项 ui 是随机变量,其方差是未知的,只能通过(2. 45)式计算 σ 的


2 2

无偏估计 σˆ 。
2

在大样本情况下,用无偏估计 σˆ 去代替 σ ,可计算参数估计值的标准误差,这时用估


2 2

计的标准误差作 β̂1 和 β̂ 2 的标准化变换得到的 z1 和 z2 ,仍可视为标准正态分布变量。

^ ^
在小样本情况下,若用无偏估计 σˆ 代替 σ 去估计标准误差,可得 SE ( βˆ1 ) 和 SE ( βˆ2 ) ,
2 2

^
可以证明,用估计的标准误差作 β̂1 和 β̂ 2 的标准化变换,所得的 ( βˆ1 − β1 ) SE ( βˆ1 ) 和
^
( βˆ2 − β 2 ) SE ( βˆ2 ) 已不再服从正态分布,而是服从自由度为 n-2 的 t 分布,设这时的变换

值为 t,则

βˆ1 − β1 βˆ1 − β1
=t = ~ t (n − 2) (2.59)
∑X
^
SE ( βˆ1 )
2

σˆ 2 i

n∑ x i
2

βˆ2 − β 2 βˆ2 − β 2
=t = ~ t (n − 2) (2.60)
∑x
^
SE ( βˆ2 ) σˆ 2 2
i

二、回归系数的假设检验

前面已经指出,简单线性回归模型的系数 β1 、 β 2 和方差 σ 都不能直接观测或准确计


2

算,只能通过样本观测值去估计,所得到的样本回归系数的估计量是随抽样而变动的随机变

量。那么,像这样估计的回归系数和方差是否可靠?是否仅仅为抽样的偶然结果呢?还需要

进行统计推断检验。

对回归系数假设检验的基本思想是,在所估计样本回归系数概率分布性质已确定的基础

上,在对总体回归系数某种原假设(或称零假设)成立的条件下,利用适当的有明确概率分布

29
的统计量和给定的显著性水平 α ,构造一个小概率事件,判断原假设结果合理与否,是基

于“小概率事件不易发生”的原理,可以认为小概率事件在一次观察中基本不会发生,如果该

小概率事件竟然发生了,就认为原假设不真,从而拒绝原假设,不拒绝备择假设。

对总体参数的假设检验可能有不同的要求,可以检验总体参数是否等于、大于或小于某

特定的数值 β ,这时原假设分别为 H 0 : β 2 = β 2 、 H 0 : β 2 ≥ β 2 、 H 0 : β 2 ≤ β 2 ;也可以检


* * * *

验总体参数是否等于零。而且,原假设和备择假设的设定方式不同,判断是否拒绝区域的方

式也不同,例如设定 H 0 : β 2 = β 2 ,H1 : β 2 ≠ β 2* ,进行的是双侧检验;而设定 H 0 : β 2 ≥ β 2*


*

或 H1 : β 2 < β 2 时,进行的是单侧检验。
*

如果 σ 已知,或者样本容量充分大时,按式(2.58)根据样本计算的 z 有
2 *

βˆ2 − β 2
z* = ~ N (0,1) (2.61)
SE ( βˆ2 )

针对原假设 H 0 : β 2 = β 2 ,备择假设 H1 : β 2 ≠ β 2* ,可以利用服从正态分布的 z * 统计量去作


*

假设检验。给定显著性水平 α (例如 α = 0.05 ),由正态分布表查出 Z 的临界值,例如为

* *
1.96。把根据样本计算的 z 与 Z 的临界值作比较,如果 −1.96 ≤ z ≤ 1.96 ,就不拒绝原假

设 H 0 : β 2 = β 2 ; 如 果 z < −1.96 或 z > 1.96 , 就 拒 绝 H 0 : β 2 = β 2 , 而 不 拒 绝


* * * *

H1 : β 2 ≠ β 2* ,即认为 β 2 显著不等于 β 2* 。

可是,在计量经济研究中通常面临的是 σ 未知,且样本容量较小,这时只能用无偏估
2

计 σˆ
= 2
∑e 2
i (n − 2) 去代替 σ 2 ,由式(2.60)已知

βˆ2 − β 2
=t ^
~ t (n − 2) (2.62)
SE ( βˆ2 )

针对原假设 H 0 : β 2 = β 2 ,备择假设 H1 : β 2 ≠ β 2* ,给定显著性水平 α ,由 t 分布表可查出


*

自由度为 n-2,对应概率为 α 2 的临界值 tα 2 ( n − 2) 。将根据样本计算的 t 统计量与临界值

tα 2 (n − 2) 比较,如果 −tα 2 ≤ t ≤ tα 2 ,就不拒绝 H 0 : β 2 = β 2* ;如果 t < −tα 2 或 t > tα 2 ,

就拒绝 H 0 : β 2 = β 2 ,而不拒绝 H1 : β 2 ≠ β 2* ,也就是认为 β 2 显著不等于 β 2* 。像这样利用


*

t 分布进行的显著性检验,称为 t 检验。

30
在计量经济学中,为了检验所建立的回归模型中解释变量对被解释变量是否有显著影响,

经常把回归系数 β 2 = 0 作为原假设。当原假设为 H 0 : β 2 = 0 ,备择假设为 H1 : β 2 ≠ 0 时

βˆ2 − β 2 βˆ2
=t =^ ^
~ t (n − 2) (2.63)
ˆ ˆ
SE ( β 2 ) SE ( β 2 )

给定显著性水平 α ,由 t 分布表可查出自由度为 n-2,对应概率为 α 2 的临界值

tα 2 (n − 2) 。如果 −tα 2 ≤ t ≤ tα 2 ,就不拒绝 H 0 : β 2 = 0 ,即认为对应的解释变量对被解释

变 量 没 有 显 著 影 响 ; 反 之 , 如 果 t < −tα 2 或 t > tα 2 , 就 拒 绝 H 0 : β2 = 0 , 而 不 拒 绝

H1 : β 2 ≠ 0 ,即认为对应解释变量对被解释变量有显著影响。

对回归系数的假设检验是在给定的显著性水平下作出的,因此当给定的显著性水平不同

时,对检验所得的结论很可能不同,甚至会得出相反的结论。例如,对于 H 0 : β 2 = 0 ,在

n=20 , 由 样 本 值 计 算 的 t 统 计 量 为 2.5000 时 , 若 显 著 性 水 平 取 0.05 , 临 界 值 为

tα 2 (n − 2) = t 0.025 (18) = 2.1009 ,应当拒绝 H 0 : β 2 = 0 ;但若显著性水平取 0.01,临界

值为 tα 2 ( n − 2) = t 0.005 (18) = 2.8784 ,则应当不拒绝 H 0 : β 2 = 0 。由此可以看出,在原

假设既定,t 统计量已确定的情况下,对参数假设检验的结论与显著性水平息息相关,那么

就可以从显著性水平出发去判断检验结果。在既定原假设 H 0 : β 2 = 0 下,由样本数据计算

* *
回归系数的 t 统计量 t ,由 t 分布的性质可确定 t 统计量大于 t 值的概率:

P(t ≥ t * H 0 ) = α * (2.64)

式中, α 是 t 统计量大于 t 值的概率,称为所估计的回归系数的 P 值。显然,所取的显著


* *

性水平 α (例如取 0.05)只要比 P 值更大,就可在显著性水平 α 下拒绝 H 0 : β 2 = 0 。反之,

所取的 α 还小于 P 值,就应在显著性水平 α 下不拒绝 H 0 : β 2 = 0 。这就是回归系数显著性

的 P 值检验方法。在 Eviews 及各种回归分析的软件中,在给出回归分析的结果时,通常都

同时给出了原假设 H 0 : β 2 = 0 下所估计参数的 P 值,这给判断参数显著性检验的结论带来

很大方便。

例如【例 2.2】中已估计出 βˆ2 = 0.60366 ,为了进一步检验家庭人均月可支配收入是否

31
对人均月消费支出有显著影响,针对原假设 H 0 : β 2 = 0 ,备择假设 H1 : β 2 ≠ 0 ,可以计算

t 统计量

βˆ2 0.60366
=t =^
= 36.1085
ˆ
SE ( β 2 ) 0.01672

如 果 给 定 显 著 性 水 平 α = 0.05 , 由 t 分 布 表 可 查 出 自 由 度 为 n-2=8 的 临 界 值

t0.025 (8) = 2.306 。因为


= t 36.1085 > t=
α 2 2.306 ,所以可以拒绝 H 0 : β 2 = 0 ,而不拒绝

H1 : β 2 ≠ 0 ,即认为解释变量人均月可支配收入对被解释变量人均月消费支出确实有显著

影响。

在回归分析的计算机软件(例如 Eviiews)中,在给出回归系数的估计结果的同时,也

给出了对应解释变量回归参数估计值的 P 值,例如在本例中与 βˆ2 = 0.60366 对应的 P 值为

0.0000,远小于给定的 α = 0.05 ,通过 P 值也可以判断应当拒绝 H 0 : β 2 = 0 的假设。

三、回归系数的区间估计
用 OLS 法得到的参数估计值只是对总体回归函数参数的点估计值,尽管在重复抽样中

可以预期它的期望会等于参数的真实值,但还不能说明所得参数点估计值的可靠性。虽然前

面已经确定了参数估计值的标准误差 SE ( βˆ1 ) 和 SE ( βˆ2 ) ,可是标准误差只是说明估计值与

其均值的离散程度,还不能说明参数真实值的可能范围。参数估计值 β̂ 2 可能比 β 2 小,也可

能比 β 2 大,只是在 β̂ 2 左右的一定区间范围内可能包含了 β 2 。我们可以设法找到可能包含

参数真实值 β 2 的一定范围,并确定这样的范围包含参数真实值的可靠程度,这就是参数的

区间估计。

参数的区间估计与假设检验既有联系又有区别。假设检验是根据已知的样本观测值,判

断它是否与对总体参数作的某一个假设相一致;而参数的区间估计主要回答什么样的区间包

含总体参数真实值以及可靠程度问题。

为了确定 β̂ 2 对真实值 β 2 “靠近”的程度,可设法找出两个正数 δ 和 α ,(其中

0 < α < 1 ),以使得 ( βˆ2 − δ , βˆ2 + δ ) 这样的区间包含真实 β 2 的概率为 1 − α ,可表示为:

P( βˆ2 − δ ≤ β 2 ≤ βˆ2 + δ ) =1 − α (2.65)

32
这样的区间如果存在,就称为 β 2 的置信区间,其中 α 称为显著性水平,1 − α 称为置信系数

或置信概率, β̂ 2 − δ 和 β̂ 2 + δ 分别称为下置信限和上置信限。

式(2.65)是回归模型中斜率系数 β 2 的区间估计式,类似地也可导出截距系数 β1 的区间

估计式。区间估计式的意义是,在重复抽样之下,像这样的区间构造很多次,平均说来,这

样的区间将有 1 − α 的比例是包含参数真实值的。显然,构造参数的置信区间需要先确定参

数估计式的抽样分布。前面对 ui 的分布已作了正态性假定,并据此确定了 Yi 、β̂1 、β̂ 2 和 σˆ


2

的分布,这就为构造置信区间创造了条件。

对回归系数的区间估计,可分为以下三种情况。

(1)当总体方差 σ 已知时,在 ui 的正态性假定下:


2

βˆ2 − β 2
z= ~ N (0,1)
SE ( βˆ2 )

由于 σ 已知, SE ( βˆ2 ) = σ ∑x 可以确定,取定显著性水平 α 可得 Z 的临界值,例


2 2
i

如取 α = 0.05 ,即 1 − α =
0.95 ,查正态分布表可知

βˆ2 − β 2
P[−1.96=
<z ^
< 1.96]
= 0.95
SE ( β 2 )

即 P[ βˆ2 − 1.96 SE ( βˆ2 ) < β 2 < βˆ2 + 1.96 SE ( βˆ2 )] =


0.95

所以,回归系数 β 2 的 95%置信区间为 [ βˆ2 − 1.96 SE ( βˆ2 ), βˆ2 + 1.96 SE ( βˆ2 )] 。

(2)当总体方差 σ 未知,且样本容量充分大时,可用无偏估计
2
= σˆ 2
∑e 2
i (n − 2) 去

代替 σ 。此时由于样本容量充分大,仍可认为
2

βˆ2 − β 2
z= ~ N (0,1) (2.66)
σˆ ∑ xi2
同样可以利用正态分布去确定 β 2 的置信区间。

(3)当总体方差 σ 未知,且样本容量较小时,若用无偏估计
2
= σˆ 2
∑e2
i (n − 2) 去代

替 σ ,此时由式(2.60)有
2

33
βˆ2 − β 2
=t ^
~ t (n − 2)
SE ( βˆ2 )
这里的统计量 t 不再服从正态分布,而服从自由度为 n-2 的 t 分布,可利用 t 分布去建立置

信区间。

如果选取置信度为 1 − α ,查 t 分布表得显著性水平为 α 2 ,自由度为 n-2 的临界值 tα 2 ,

可建立置信区间

βˆ2 − β 2
P[−tα 2 ≤ t = ^
≤ tα 2 ] = 1 − α (2.67)
SE ( βˆ2 )

^ ^
P[ βˆ2 − tα 2 SE ( βˆ2 ) ≤ β 2 ≤ βˆ2 + tα 2 SE ( βˆ2 )] =−
1 α (2.68)

同理, β1 的置信区间也可按以上三种情况分别用类似的方法导出。

例 如 ,【 例 2.2 】 中 运 用 表 2.2 样 本 ( 一 ) 的 数 据 已 估 计 出 参 数 为 βˆ1 = 266.382 ,

βˆ2 = 0.60366 。由于总体方差 σ 2 未知,且样本容量较小,为 10,可用估计的 σˆ 2 = 5764.50

代替 σ ,表 2.4 中已算出
2
∑x 2
i = 20625000 ,则可计算出

^ σˆ 2 5764.50
SE
= ( βˆ2 ) = = 0.01672
∑ xi2 20625000

以对参数 β 2 的区间估计为例,可取 α = 0.05 ,查 t 分布表得自由度为 n-2 的临界值

= 2.306 ,将有关数据代入式(2.68),即可得到 β 2 的置信度为 95%的置信区


tα 2 t0.025
=

^ ^
P[ βˆ2 − tα 2 SE ( βˆ2 ) ≤ β 2 ≤ βˆ2 + tα 2 SE ( βˆ2 )]
= P(0.60366 − 2.306 × 0.01672 ≤ β 2 ≤ 0.60366 + 2.306 × 0.01672)
= P(0.5651 ≤ β 2 ≤ 0.6422)
= 95%

应当强调,由于 β̂ 2 是随机变量,式(2.68)那样的区间是随机区间,只是说明在重复

抽样中,在 1 − α 的概率基础上,像这样的区间构造许多次,从长远看平均地说,这些区间

中将有 95%包含着 β 2 的真实值。

34
第五节 回归模型预测

一、回归分析结果的报告
回归模型经过估计检验以后,得到了一系列的数据,在以后的计量经济分析中还会得

出更多的说明模型特性的有意义的数据。为了更清晰、更简明地表现这些数据,通常将这些

数据加以整理,并用一定规范的格式去报告回归分析的结果。

例如对于【例 2.2】用 OLS 法所作的回归分析的结果得到以下数据:


^ ^
β̂1 = 266.382 、SE ( βˆ1 ) = 90.9941、β̂ 2 = 0.60366、SE ( βˆ2 ) = 0.01672、R 2 = 0.9939、

n=10 等。在 H 0 : β1 = 0 的假设下,t 统计量为 2.9275;在 H 0 : β 2 = 0 的假设下,t 统计量

为 36.1085。

在计量经济研究中,通常按以下规范格式表述以上各项数据:

Yˆi = 266.382 + 0.60366 X i (2.69)

(90.9941) (0.01672)

t= (2.9275) (36.1085)

R 2 = 0.9936 n=10

其中,列在回归方程下方与估计的参数对正的第一排圆括号内的数据,是对应参数估计值的

标准误差;第二排圆括号内与之对正的数据,分别是对应参数等于零的原假设下,所计算的

t 统计量(有时也可不列出标准误差,而只列出 t 统计量)。

按这种规范格式报告回归分析计算的结果,一是比较规范简洁,便于交流;二是可以较

方便地看出所估计回归模型的特性,如回归系数是否显著。因此这种表现方式已被广泛采用。

二、被解释变量平均值预测
回归分析的目的之一是对被解释变量作合理的预测。所谓预测是指由已知的或预先测

定的解释变量,去预测被解释变量在所观测的样本数据以外的数值。预测可以是对被解释变

量未来时期的动态预测,也可以是对被解释变量在不同空间状况的空间预测。如果所建立的

回归方程通过了各项统计检验,并且在经济上也是有实际意义的,我们估计出参数的回归模

型就可以用于对被解释变量的预测。预测的基本方法是将解释变量预测期的数值 X f 代入估

计的模型,对被解释变量的预测期或样本以外的数值 Yˆf 作出定量的估计。

利用计量经济模型对被解释变量所作的预测,是在一定前提条件下进行的条件预测。

35
首先要对模型在预测期的适应性作出判断,要在经济理论分析和研究的基础上,判定所研究

的经济总体的经济结构在样本期和预测期并无明显变化。具体来说,这种预测是假定模型所

设定的 Y 与 X 的关系式保持不变,而且认为用样本所估计的参数在预测期保持不变条件下的

预测。当然,还必须是对解释变量在预测期的取值已经确定或已做出预测条件下的预测。

对被解释变量的预测可分为对被解释变量 Y 的平均值预测和个别值预测。对 Y 的平均

值预测又分为对平均值的点预测和区间预测。这几种预测的关系如图 2.10 所示:

Y SRF

Yˆf
PRF
E (Y f | X f ) ef
uf
Yf

Xf X
图 2.10 平均值预测与个别值预测的关系

对被解释变量预测的基本依据,是用样本估计的回归方程 Yˆ=
f βˆ1 + βˆ2 X f ,由于存在

抽样波动,估计的参数与总体真实参数有误差,因此用样本回归函数预测的被解释变量平均

值 Yˆf 与预测期总体的真实平均值 E (Y f X f ) 亦会有误差。此外,由于存在随机扰动,被解

释变量在预测期的个别值 Y f 与平均值 E (Y f X f ) 也有误差。因此对 Y 的平均值预测和个别

值预测要分别进行讨论。

(一)对 Y 平均值的点预测

把解释变量的预测值 X f 直接代入所估计的样本回归函数,就可以计算出被解释变量平

均值的预测值

Yˆ=
f βˆ1 + βˆ2 X f (2.70)

例如,对于【例 2.2】, 若是要预测当家庭人均月收入达到 7000 元时家庭人均月消费

支出的平均水平,可将 X f = 7000 代入经过估计和检验的回归模型,得

Yˆ=
f 266.382 + 0.60366 × 7000
= 4492.00 (元)

36
由样本回归函数的意义不难理解,用式(2.70)计算的 Yˆf 只是对 Y f 的平均值作的点估

计。 Yˆf 是由样本回归方程计算的,因为 β̂1 和 β̂ 2 是随样本而变化的随机变量, Yˆf 也是一个

随机变量。点预测值 Yˆf 不一定等于被解释变量预测期的真实平均值 E (Y f X f ) ,我们还需

要对 E (Y f X f ) 可能的置信区间作出预测,也就是说要对 E (Y f X f ) 进行区间预测。

(二)对 Y 平均值的区间预测

为了由预测值 Yˆf 去对真实平均值 E (Y f X f ) 作区间预测,应考虑预测值 Yˆf 的抽样分布,

并寻找与 Yˆf 和 E (Y f X f ) 都有关的统计量。

由前面的分析已知

E (Yˆf = ) β1 + β 2 X f
) E (Y f X f = (2.71)

还可以证明 5
2
1 (X f − X )
(Yˆf ) σ 2 [ +
Var= ] (2.72)
n ∑ xi2
2
1 (X f − X )
(Yˆf ) σ
SE = + (2.73)
n ∑ xi2
一般情况下 σ 未知,可用无偏估计
2
= σˆ 2
∑e 2
i (n − 2) 去代替,此时

Yˆf − E (Yˆf ) Yˆf − E (Y f X f )


=t = ^
: t (n − 2) (2.74)
ˆ
SE (Y f ) 1 ( X − X ) 2

σˆ + f

n ∑ xi2
显然,这里的 t 统计量与 Yˆf 和 E (Y f X f ) 都有关,且服从自由度为 n-2 的 t 分布。给定显著

性水平 α ,查 t 分布表可得临界值 tα 2 ( n − 2) ,因此

^ ^
P{[Yˆf − tα 2 SE (Yˆf )] ≤ E (Y f X f ) ≤ [Yˆf + tα 2 SE (Yˆf )]} =−
1 α (2.75)

即预测期平均值 E (Y f X f ) 的置信度为 1 − α 的预测区间为:

2 2
ˆ 1 (X f − X ) ˆ 1 (X f − X )
[(Y f − tα 2σˆ + ), (Y f + tα 2σˆ + )] (2.76)
n ∑ xi2 n ∑ xi2
例如对于【例 2.2】, 要对当人均收入 X f = 7000 元时平均人均月消费支出点预测值

5 此式证明过程较繁琐,本书对证明从略。可参考:庞皓.计量经济学学习辅导.北京科学出版社, 2011.17.

37
Yˆf = 4492.00 元的基础上,进一步对家庭人均月消费支出的平均水平作区间预测。给定显

著性水平 α =0.05,查 t 分布表可得临界值 tα 2 ( n − 2) = t0.025 (10 − 2) =


2.306 ,。前面利用式

(2.45)式已经计算出 σˆ = 75.9243 ,在表 2.4 中已由样本数据计算出 ∑x


2
i = 20625000 ,

X = 5250 。由式(2.74)可计算人均月消费支出平均值 E (Y f X f ) 预测区间的上下限:

2
ˆ 1 (X f − X )
E (Y f X f ) Y f m tα 2σ
= ˆ +
n ∑ xi2
1 (7000 − 5250) 2
= 4492.00 m 2.306 × 75.9243 × +
10 20625000

= 4492.00 m 87.28 (元)


即是说,当家庭人均月收入达到 7000 元时,人均月消费支出平均水平置信度为 95%的

区间预测值为(4404.72,4579.28)元。

三、被解释变量个别值预测

对应于给定的预测期解释变量的数值 X f ,要在平均值预测的基础上,进一步确定 Y 个

别值的预测区间,必须明确与预测值 Yˆf 和个别值 Y f 都有关的统计量的概率分布。

由前面的分析已知,与预测期解释变量对应的残差项 e=
f Y f − Yˆf ,正是与 Yˆf 和 Y f 都

有关的随机变量,而且在 ui 正态性假定下, e f 也服从正态分布,在简单线性回归时可证明

E (e f ) = E (Y f − Yˆf ) = 0 (2.77)

__
2
ˆ 1 (X f − X )
Var (e f )= E (Y f − Y f ) = σ [1 + +
2 2
] (2.78)
n ∑ xi2
__
2
1 (X f − X )
SE (e f )= σ 1 + + (2.79)
n ∑ xi2
当 σ 未知,用
2
= σˆ 2
∑e 2
i /(n − 2) 代替时,可以证明对 e f 标准化的变量服从自由度 n-2 的 t

分布,即

6 证明过程较繁琐,本书对证明从略。

38
e f − E (e f ) Y f − Yˆf
=t = ^ ^
~ t (n − 2) (2.80)
SE (e f ) SE (e f )

这里的 t 统计量可用于关于个别值 Y f 的区间预测。给定显著性水平α,查 t 分布表得自由度

为 n-2 的临界值 tα 2 ( n − 2) ,则有

^ ^
P{[Yˆf − tα 2 SE (e f )] ≤ Y f ≤ [Yˆf + tα 2 SE (e f )]} =−
1 α (2.81)

因此,简单线性回归时 Y 的真实值 Y f 的置信度为 1-α的预测区间为

__ __
2 2
ˆ 1 (X f − X ) ˆ 1 (X f − X )
{[Y f − tα 2σˆ 1 + + ],[Y f + tα 2σˆ 1 + + ]} (2.82)
n ∑ xi2 n ∑ xi2
例如,对于【例 2.2】, 当家庭人均月收入 X f = 7000 元时,家庭人均月消费支出点预

测值 Yˆf = 4492.00 元的基础上,进一步对家庭人均月消费支出个别值作区间预测。给定显

著性水平 α =0.05,由式(2.80)可计算人均消费支出个别值 Y f 预测区间的上下限:

2
1 (X f − X )
Yˆf m tα 2σˆ 1 + +
n ∑ xi2
1 (7000 − 5250) 2
= 4492.00 m 2.306 × 75.9243 × 1 + +
10 20625000

= 4492.00 m195.63 (元)


这就是说,当家庭每月人均收入达到 6000 元时,每月人均消费支出个别值置信度为 95%的

区间预测值为(4296.37,4687.63)元。

从对被解释变量的平均值预测和个别值预测,可以看出有以下特点:

(1)由于抽样误差的存在,用样本估计的 β̂1 和 β̂ 2 去预测的被解释变量平均值 Yˆf 与总

体真实平均值 E (Y f X f ) 存在误差,这主要决定于抽样波动。而用 Yˆf 对个别值 Y f 的预测,

不仅存在由于抽样波动引起的误差,而且要受随机扰动项 ui 的影响。对比式(2.70)和式

(2.76)可以看出,由 Yˆf 对个别值预测的方差要大于对平均值预测的方差。从图 2.11 也可

看出对个别值的预测区间比对平均值的预测区间更宽。

39
Y

Y 平均值预测区间

Y 个别值预测区间

X X

图 2.11 平均值和个别值的预测区间

(2)对 Y f 的平均值预测区间和个别值预测区间都不是常数,它们是随解释变量预测值

__ __ __
X f 的变化而变化的,当 X f = X 时,( X f − X ) 2 =0,此时预测区间最窄, X f 越是远离 X ,
__
( X f − X ) 2 越大,预测区间也越宽(图 2.11)。所以用回归模型作预测时, X f 的取值不宜
__
偏离 X 过远,否则预测的精度会大大降低。

(3)预测区间与样本容量 n 有关。由式(2.74)和式(2.80)可看出,样本容量越大,

不仅 n 越大,而且 ∑x 2
i 越大,预测误差的方差将越小,预测区间也将越窄。为此,随着样

本容量的增加,预测的精度会提高,如果样本容量过小,预测的精度也将较差。当样本容量

趋于无穷大(即 n→∞)时,抽样误差趋于 0,此时对平均值的预测误差亦趋于 0,而对个

别值的预测误差则只决定于随机扰动 u i 的方差 σ 。
2

第六节 案例分析

一、研究目的和要求
改革开放以来,中国经济增长迅速,已经发展为世界第二大经济体。随着经济的迅速发

展,人民的收入日益提高,1978 年中国的人均 GDP 只有 385 元,属于低收入国家,2016

年达到 53980 元,已进入中等偏上收入国家,实现了由贫困到温饱,再由温饱到总体小康的

历史性跨越。随着经济的快速发展,中国居民的消费水平发生了巨大变化。全体居民按当年

价格计算的人均消费 1978 年只有 184 元,2016 年已达到 17110.70 元。消费对经济增长的

40
贡献率增长明显,并连续 4 年成为拉动经济增长的第一驱动力。随着居民收入的进一步提高,

不仅居民的消费支出有了很大提高,居民消费结构也加快升级,消费者对高品质、个性化商

品的需求不断提升,高品质商品和服务需求旺盛。居民消费结构变化特别引人关注的是,由

于居民流动性增加,社会交流需求增强,外出出行、旅游、通信等服务消费保持快速增长,

在居民的各项消费中,交通通信消费成为居民消费结构升级的重要体现。交通通信消费指用

于交通和通信工具及相关的各种服务费、维修费和车辆保险等支出,已成为研究居民消费结

构特征的重要方面。从全国居民平均水平看,2016 年中国居民人均交通通信支出 2338 元,

年均增长 11.7%,快于全国居民人均消费支出年均增速 4.3 个百分点,占人均消费支出的比

重为 13.7%,已居除食品和居住消费外的第三位。但是,从各地区居民的消费支出看, 2016

年居民人均交通通信消费支出,北京为 4701.7 元,甘肃为 1573 元,西藏仅为 990 元,各地

区居民交通通信消费支出的差异还很大。影响居民消费规模和消费结构的因素有多方面,同

居民收入水平有关,但从根本上说还是由其社会经济的发展水平所决定,各地区经济发展不

平衡不充分,已经成为满足人民日益增长的美好生活需要的主要制约因素。

深入研究中国各地区居民人均交通通信消费与经济发展水平的数量关系,对于探求居民

交通通信消费增长的规律性,分析各地区居民交通通信消费的差异,认识地区发展不平衡不

充分的影响程度,预测其发展趋势,通过发展经济减小地区差异,预测各地区居民交通通信

消费增长,合理规划交通和信息化产业的发展,都有重要的意义。

二、模型设定
为了分析各地区居民交通通信消费与经济发展水平的关系,选择“居民交通通信消费支

出”(单位:元)为被解释变量(用 Y 表示);选择“人均地区生产总值”
(单位:元)为解

释变量(用 X 表示)。表 2.5 为由《中国统计年鉴 2017》得到的“分地区居民人均消费支出

(2016 年)”中的 31 个省市的“交通通信消费支出”和 “人均地区生产总值”的数据。


表 2.5 2016 年中国各地区居民交通通信消费支出和人均地区生产总值
地区 居民交通通信消费支出 Y/元 人均地区生产总值 X/元
北京 4701.7 118198
天津 3752.2 115053
合并 2062.2 43062
山西 1709.0 35532
内蒙古 2525.5 72064
辽宁 2837.3 50791
吉林 2073.0 53868
黑龙江 2040.9 40432
上海 4228.5 116562

41
江苏 3372.2 96887
浙江 4377.3 84916
安徽 1975.2 39561
福建 2504.2 74707
江西 1576.9 40400
山东 2324.8 68733
河南 1550.8 42575
湖北 1931.0 55665
湖南 1915.5 46382
广东 3296.5 74016
广西 1541.6 38027
海南 1762.2 44347
重庆 1941.6 58502
四川 1850.3 40003
贵州 1610.6 33246
云南 1723.5 31093
西藏 990.0 35184
陕西 1664.1 51015
甘肃 1573.0 27643
青海 2287.0 43531
宁夏 2748.6 47194
新疆 2052.4 40564

为分析居民交通通信消费支出 (Y)与人均地区生产总值(X)的数量关系,可以运用计算

机软件 EViews 去作计量经济分析 7。利用 EViews 作简单线性回归分析的基本步骤为 8:

1.建立工作文件

首先,双击 EViews 图标,进入 EViews 主页。依此点击 File\New\Workfile,在出现的

“ Workfile Create” 对 话 框 的 “ Data spedfication” 菜 单 中 选 择 文 件 数 据 的 结 构 类 型

(Frequency),如“dated-regular frequency”,在“date specification”中选择数据频率:例如,

multi-year(多年度)、Annual (年度)、Semi annual (半年)、Quartrly (季度)、Monthly (月度)、

Weekly (周数据)、……,以及“integer date”(截面数据)。

在本例中分析的是 2016 年各地区的横截面数据,则选择“integer date”。在“Start date”

,在“end date”中输入最后顺序号“31”。在对话框“Workfile name”


中输入开始顺序号“1”

中输入文件名称,如“第二章案例”。点击“ok”
,出现文件 “Workfile 第二章案例”的工

作框。其中已有对象:“c”为截距项,“resid”为剩余项。

7 EViews 软件的基本操作可参考:计量经济学学习辅导.庞皓主编.科学出版社,2011.第十三章。
8 本书第四版对 EViews 的操作与输出形式采用 EViews8 版本,其他版本与之类似。

42
若要将工作文件存盘,点击窗口上方的“Save”,在“Save As”对话框中选择存盘路径,

再点击“ok”
,文件即被保存。

2、输入数据

在“Quick”菜单中点击“Empty Group”,出现数据编辑窗口。将第一列数据命名为 Y:

方法是按上行键“↑”,对应“obs”格自动上跳,在对应的第二行有边框的“obs”空格中

输入变量名“Y”,再按下行键“↓”,变量名以下各格出现“NA”,依顺序输入 Y 的对应

数据。 按同样方法,可对“X”等其他变量命名,并输入对应数据。

也可以在 EViews 命令框中直接输入“data X Y ”(一元时) 或 “data Y X 1 X 2 … ”(多

元时),回车出现“Group”窗口数据编辑框,在对应的 Y、X 下输入数据。还可以从 Excel 、

Word 等文档的数据表中直接将对应数据粘贴到 EViews 的数据表中。若要对数据存盘,点击

“File/Save”

3、作 Y 与 X 的相关图形

为了初步分析居民交通通信消费支出 (Y)与人均地区生产总值(X)的关系,可以作以 X

为横坐标,以 Y 为纵坐标的散点图。方法是按住“ctrl”键依次选择工作文件中的对象 X 和

Y,双击得 X 和 Y 的数据表,点“View/Graph”在“Graph type”中选“scatter”


,可在“Details”

的“Fit lines”中选择“Regression line”,点“ok”


,得到如图 2.12 的带回归线的散点图:

图 2.12 各地区居民交通通信消费支出与人均地区生产总值的散点图

从散点图可以看出各地区居民交通通信消费支出随着人均地区生产总值水平的提高而

增加,近似于线性关系,为分析中国各地区居民居民交通通信消费支出随人均地区生产总值

变动的数量规律性,可以考虑建立如下简单线性回归模型:

β1 + β 2 X t + ut
Yt =

三、估计参数

43
假定所建模型及其中的随机扰动项 ui 满足各项古典假定,可以用 OLS 法估计其参数。

EViews 软件估计参数的方法如下:

方法一:在 EViews 工作框主页点击“Quick”菜单,点击“Estimate Equation”,出现

“Equation specification”对话框,在“Method”中选“Least Squares”,在“Equation

specification”对话框中键入“Y C X”,点“ok”或按回车,即出现回归结果。

方法二:在 EViews 命令框中直接键入“LS Y C X”,按回车,即出现回归结果。

EViews 的回归结果如图 2.13 所示。

图 2.13 回归结果

可用规范的形式将参数估计和检验的结果写为:

=Yˆt 521.5179 + 0.032012 X t

(182.5074) (0.002937)

t= (2.857517) (10.90108)

R 2 = 0.803834 F=118.8336 n=31

若要显示回归结果的图形,在“Equation”框中,点击“Resids”,即出现剩余项(Residual)

实际值(Actual)、拟合值(Fitted)的图形,如图 2.14 所示。

44
图 2.14 剩余项、实际值、拟合值图形

四、模型检验
1、经济意义检验

所估计的参数 βˆ1 = 521.5179 , βˆ2 = 0.032012 ,说明人均地区生产总值每增加 1 元,平

均说来居民交通通信消费支出将增加 0.032012 元,这与预期的经济意义相符。

2、拟合优度和统计检验

用 EViews 得出回归模型参数估计结果的同时,已经给出了用于模型检验的相关数据。

拟合优度的度量:由表 2.6 中可以看出,本例中可决系数为 0.803834,说明所建模型整

体上对样本数据拟合较好,即解释变量 “人均地区生产总值”对被解释变量“居民交通通

信消费支出”的绝大部分差异作出了解释。

需要说明的是,如果模型用的是非平稳的时间序列数据 9,一些时间序列数据往往具有

相同的变动趋势,即使两个变量没有实际联系, 也可能表现出较显著的“联系”,也会产生较

高的可决系数,这时时间序列变量间的联系有可能是虚假的。我们将在第十章具体讨论时间

序列变量可能出现的“虚假回归”问题。

对回归系数的 t 检验:针对 H 0 : β1 = 0 和 H 0 : β 2 = 0 ,由表 2.6 中还可以看出,估计的

回归系数 β̂1 的标准误差和 t 值分别为: SE ( βˆ1 ) = 182.5074 , t ( βˆ1 ) = 2.857517 ; β̂ 2 的标

准误差和 t 值分别为: SE ( βˆ2 ) = 0.002937 , t ( βˆ2 ) = 10.90108 。取 α = 0.05 ,查 t 分布表

得 自 由 度 为 n − 2 = 31 − 2 = 29 的 临 界 值 t0.025 (29) = 2.045 。 因 为

t ( βˆ1 ) = 2.857517 > t0.025 (29) = 2.045 , 所 以 应 拒 绝 H 0 : β1 = 0 ; 因 为

9 关于时间序列的平稳性等问题,将在第 10 章中讨论。

45
t ( βˆ2 ) = 10.90108 > t0.025 (29) = 2.045 ,所以应拒绝 H 0 : β 2 = 0 。对斜率系数的显著性检验

表明,人均地区生产总值对居民交通通信消费支出确有显著影响。

五、回归预测
中国西部地区除了重庆市以外,2016 年各省的人均地区生产总值都还低于全国人均国

内生产总值水平,如果西部地区某省的人均地区生产总值能达到 2016 年全国人均国内生产

总值 54000 元/人的水平,利用所估计的模型可预测该省居民交通通信消费支出可能达到的

水平,点预测值的计算方法为:

Yˆ=
f 521.5179 + 0.032012 × 54000
= 2250.145 (元)

利用 EViews 作回归预测,首先在“Workfile”窗口点击“Range”,将“End data”由“31”

改为“32”,点“OK”,将“Workfile”中的“Range”扩展为 1—32。在“Workfile”窗口点

击“sample”,将“sample”窗口中的“1 31”改为“1 32”,点“OK”,从而将样本区间改为

1—32。

为了输入 X f = 54000 ,在 EViews 命令框键入 data x /回车, 在 X 数据表中的“32”位

置输入“54000”,将数据表最小化。然后在“E quation ”框中,点击“Forecast”


,打开对

话框。在“Forecast name”(预测值序列名)中键入“ Y f ”, 回车即得到模型估计值及标准

误差的图形。双击“Workfile”窗口中出现的“ Y f ”,在“ Y f ”数据表中的“32”位置出现

Y f = 2250.145 ,这是当 X f = 54000 时居民交通通信消费支出的点预测值。

为了作区间预测,取 α = 0.05 , Y f 平均值置信度 95%的预测区间为:

2
1 (X f − X )
Yˆf m tα 2σˆ +
n ∑ xi2
为 获 得 相 关 数 据 , 在 用 EViews 作 回 归 分 析 中 , 已 经 得 到 Y f = 2250.145 、

t0.025 (29) = 2.045 、 σˆ = 413.7048 、 n = 31 。在 X 和 Y 的数据表中,点击“View”选

“Descriptive Stats\Cmmon Sample”,则得到 X 和 Y 的描述统计结果,见图 2.15。

46
图 2.15 X 和 Y 的描述统计结果

根据图 2.15 的数据可计算出:

∑ x= ∑ ( X
2
i i
2
− X )= σ X2 (n − 1)
= 25721.242 × (31 − 1)
= 19847465614.128

2 2
( X f − X )= (54000 − 56766.23)= 7652028.4129

当 X f = 54000 时,将相关数据代入计算得到

1 7652028.4129
2250.145 m 2.045 × 413.7048 × + =2250.145 m152.856
31 19847465614.128

即是说,当人均地区生产总值达到 54000 元时,居民交通通信消费支出 Y f 平均值置信度 95%

的预测区间为(2097.289,2403.001)元。

Y f 个别值置信度 95%的预测区间为:

2
ˆ 1 (X f − X )
ˆ
Y f m tα 2σ 1 + +
n ∑ xi2
当 X f = 54000 时,将相关数据代入计算得到

1 7652028.4129
2250.145 m 2.045 × 413.7048 × 1+ + 2250.145 m 859.724
=
31 19847465614.128

即是说,当人均地区生产总值达到 54000 元时,居民交通通信消费支出 Y f 个别值置信度 95%

的预测区间为(1390.421,3109.869)元。

在“E quation ”框中,点击“Forecast”可得预测值及标准误差的图形如图 2.16。

47
图 2.16 预测值及标准误差

本章小结

1. 变量间的关系分为函数关系与相关关系。相关系数是对变量间线性相关程度的度量。

2. 现代意义的回归是一个被解释变量对若干个解释变量依存关系的研究,回归的实质

是由解释变量去估计被解释变量的平均值。简单线性回归模型是只有一个解释变量的线性回

归模型。

3. 总体回归函数(PRF)是将总体被解释变量 Y 的条件期望 E (Yi X i ) 表现为解释变量

^
X 的某种函数。样本回归函数(SRF)是将被解释变量 Y 的样本条件均值 Yi 表示为解释变

量 X 的某种函数。总体回归函数与样本回归函数的区别与联系。

4. 随机扰动项 ui 是被解释变量实际值 Yi 与条件期望 E (Yi X i ) 的偏差,代表排除在模型

以外的所有因素对 Y 的影响。

5. 简单线性回归的基本假定:对模型和变量的假定、对随机扰动项 u 的假定(零均值

假定、同方差假定、无自相关假定、随机扰动与解释变量不相关假定、正态性假定)

6. 普通最小二乘法(OLS)估计参数的基本思想及估计式;OLS 估计式的分布性质及

期望、方差和标准误差;OLS 估计式是最佳线性无偏估计式。

7. 对回归系数区间估计的思想和方法。

8. 拟合优度是样本回归线对样本观测数据拟合的优劣程度,可决系数是在总变差分解

基础上确定的。可决系数的计算方法、特点与作用。

9. 对回归系数假设检验的基本思想。对回归系数 t 检验的思想与方法;用 P 值判断参

数的显著性。

48
10. 被解释变量平均值预测与个别值预测的关系,被解释变量平均值的点预测和区间预

测的方法,被解释变量个别值区间预测的方法。

11. 运用 EViews 软件实现对简单线性回归模型的估计和检验。

12. 主要公式见表 2.6。

表 2.6 主要公式表

1.总体回归函数 β1 + β 2 X i + ui
Yi = ) β1 + β 2 X i
E (Yi X i=
2. 样本回归函数 βˆ1 + βˆ2 X i + ei
Yi = ˆ βˆ + βˆ X
Y=i 1 2 i

3. 基本假定 E (ui ) = 0 ) β1 + β 2 X i
E (Yi=

Var
= (ui ) Var
= (Yi ) σ 2 Cov(=
ui , u j ) E=
(ui u j ) 0
Cov(ui , X i ) = 0 ui ~ N (0, σ 2 )
4. 最小二乘估计
βˆ2 =
n∑ X iYi − ∑ X i ∑ Yi
=
∑x y i i
n∑ X − (∑ X i )
∑x
2 2
2
i i

βˆ1 = ∑
X i2 ∑ Yi − ∑ X i ∑ X iYi βˆ1= Y − βˆ2 X
n∑ X − (∑ X i ) 2 2
i

5. 参数 OLS 估计式的期望 E ( βˆk ) = β k

6. 参数 OLS 估计式的方差 Var ( βˆ2 ) =


σ2
Var ( βˆ ) = σ 2
∑X i
2

∑x 2
i
1
n∑ x i
2

σ
7. 参数估计式的标准误差 SE ( βˆ ) =
2 SE ( βˆ1 ) = σ
∑X i
2

∑x 2
i n∑ x i
2

σˆ 2 = ∑
8. σ 2 的无偏估计 ei2
n−2
9. t 检验统计量 βˆ2 − β 2 βˆ2
=t* =^ ^
~ t (n − 2)
ˆ ˆ
SE ( β 2 ) SE ( β 2 )

8. 样本可决系数
=1
∑ yˆ 2

+
∑e 2
i
R 2
=
∑ yˆ 2

∑e
2

∑y ∑y ∑y
i
2 2 2
R2 = 1 −
i i i
∑y
i
2

^ ^
9. 参数估计的置信区间 P[ βˆ2 − tα SE ( βˆ2 ) ≤ β 2 ≤ βˆ2 + tα SE ( βˆ2 )] =−
1 α
2 2

10. 平均值预测区间
1 ( X F − X )2 ˆ 1 ( X F − X )2
[Yˆf − tα 2σˆ + , Y + t σˆ + ]
∑ xi2 ∑ xi2
f α 2
n n

49
11. 个别值预测区间 1 ( X − X )2
=Y f Yˆf m tα 2σˆ 1 + + F 2
n ∑ xi

思考题
2.1 相关分析与回归分析的关系是什么?

2.2 什么是总体回归函数和样本回归函数?它们之间的区别是什么?

2.3 什么是随机扰动项和剩余项(残差)?它们之间的区别是什么?

2.4 普通最小二乘估计量的统计性质与对模型的基本假定的关系是什么?

2.5 总体方差和参数估计方差的区别是什么?

2.6 为什么可决系数可以度量模型的拟合优度?在简单线性回归中它与对参数的 t 检验

的关系是什么?

2.7 有人说:
“得到参数区间估计的上下限后,说明参数的真实值落入这个区间的概率

为 1 − α ”,如何评论这种说法?

2.8 对参数假设检验的基本思想是什么?

2.9 为什么对被解释变量个别值的预测区间会比对被解释变量平均值的预测区间更

宽?

2.10 如果有人利用中国 1978 年—2000 年的样本估计的计量经济模型直接预测:


“中国

综合经济水平将在 2050 年达到美国 2002 年的水平”,你如何评论这种预测?

2.11 对本章开始的”引子”中提出的”中国旅游业总收入将超过 3000 亿美元?”,你认为

可以建立什么样的简单线性回归模型去具体分析?

练习题

2.1 表 2.7 中是中国历年国内旅游总花费(Y)、国内生产总值(X1)、铁路里程(X2)


、公

路里程数据(X3)的数据。

表 2.7 中国历年国内旅游总花费、国内生产总值、铁路里程、公路里程数据
年份 国内旅游总花费(亿元) 国内生产总值(亿元) 铁路里程(万公里) 公路里程(万公里)
1994 1023.5 48637.5 5.9 111.78

50
1995 1375.7 61339.9 6.24 115.7
1996 1638.4 71813.6 6.49 118.58
1997 2112.7 79715 6.6 122.64
1998 2391.2 85195.5 6.64 127.85
1999 2831.9 90564.4 6.74 135.17
2000 3175.5 100280.1 6.87 167.98
2001 3522.4 110863.1 7.01 169.8
2002 3878.4 121717.4 7.19 176.52
2003 3442.3 137422 7.3 180.98
2004 4710.7 161840.2 7.44 187.07
2005 5285.9 187318.9 7.54 334.52
2006 6229.7 219438.5 7.71 345.7
2007 7770.6 270232.3 7.8 358.37
2008 8749.3 319515.5 7.97 373.02
2009 10183.7 349081.4 8.55 386.08
2010 12579.8 413030.3 9.12 400.82
2011 19305.4 489300.6 9.32 410.64
2012 22706.2 540367.4 9.76 423.75
2013 26276.1 595244.4 10.31 435.62
2014 30311.9 643974 11.18 446.39
2015 34195.1 689052.1 12.1 457.73
2016 39390 743585.5 12.4 469.63

资料来源:中国统计年鉴

(1)分别建立线性回归模型,分析中国国内旅游总花费与国内生产总值、铁路里程、公

路里程数据的数量关系。

(2)对所建立的回归模型进行检验,对几个模型估计检验结果进行比较。
2.2 为了研究浙江省一般预算总收入与地区生产总值的关系,由《浙江省统计年鉴》得到
如表 2.8 所示的数据。
表 2.8 浙江省财政预算收入与地区生产总值数据
年份 一般预算总收入 地区生产总值 年份 一般预算总收入 地区生产总值
(亿元) (亿元) (亿元) (亿元)
Y X Y X
1978 27.45 123.72 1998 401.80 5052.62
1979 25.87 157.75 1999 477.40 5443.92
1980 31.13 179.92 2000 658.42 6141.03
1981 34.34 204.86 2001 917.76 6898.34
1982 36.64 234.01 2002 1166.58 8003.67
1983 41.79 257.09 2003 1468.89 9705.02
1984 46.67 323.25 2004 1805.16 11648.70
1985 58.25 429.16 2005 2115.36 13417.68
1986 68.61 502.47 2006 2567.66 15718.47

51
1987 76.36 606.99 2007 3239.89 18753.73
1988 85.55 770.25 2008 3730.06 21462.69
1989 98.21 849.44 2009 4122.04 22998.24
1990 101.59 904.69 2010 4895.41 27747.65
1991 108.94 1089.33 2011 5925.00 32363.38
1992 118.36 1375.70 2012 6408.49 34739.13
1993 166.64 1925.91 2013 6908.41 37756.58
1994 209.39 2689.28 2014 7421.70 40173.03
1995 248.50 3557.55 2015 8549.47 42886.49
1996 291.75 4188.53 2016 9225.07 47251.36
1997 340.52 4686.11
(1)建立浙江省一般预算收入与全省地区生产总值的计量经济模型,估计模型的参数,检
验模型的显著性,用规范的形式写出估计检验结果,并解释所估计参数的经济意义
(2)如果 2017 年,浙江省地区生产总值为 52000 亿元,比上年增长 10%,利用计量经济模
型对浙江省 2017 年的一般预算收入做出点预测和区间预测
(3)建立浙江省一般预算收入的对数与地区生产总值对数的计量经济模型,估计模型的参
数,检验模型的显著性,并解释所估计参数的经济意义。

2.3 在线性消费函数 Cˆ=


i βˆ1 + βˆ2Yi 中, C 是消费支出,Y 是可支配收入,收入的边际消

费倾向(MPC)是斜率 β̂ 2 ,而平均消费倾向(APC)为 Cˆ i / Yi 。由中国统计年鉴得到 2016 年

中国各地区居民人均消费支出和居民人均可支配收入数据:

表 2.9 2016 年中国居民消费支出与可支配收入数据


居民消费 居民可支配 居民消费 居民可支配
地区 地区
支出(元) 收入(元) 支出(元) 收入(元)
北 京 35415.7 52530.4 湖 北 15888.7 21786.6
天 津 26129.3 34074.5 湖 南 15750.5 21114.8
河 北 14247.5 19725.4 广 东 23448.4 30295.8
山 西 12682.9 19048.9 广 西 12295.2 18305.1
内蒙古 18072.3 24126.6 海 南 14275.4 20653.4
辽 宁 19852.8 26039.7 重 庆 16384.8 22034.1
吉 林 14772.6 19967.0 四 川 14838.5 18808.3
黑龙江 14445.8 19838.5 贵 州 11931.6 15121.1
上 海 37458.3 54305.3 云 南 11768.8 16719.9
江 苏 22129.9 32070.1 西 藏 9318.7 13639.2
浙 江 25526.6 38529.0 陕 西 13943.0 18873.7
安 徽 14711.5 19998.1 甘 肃 12254.2 14670.3
福 建 20167.5 27607.9 青 海 14774.7 17301.8
江 西 13258.6 20109.6 宁 夏 14965.4 18832.3
山 东 15926.4 24685.3 新 疆 14066.5 18354.7
河 南 12712.3 18443.1

(1)在 95%的置信度下,求 β 2 的置信区间。

52
(2)以可支配收入为 x 轴,画出估计的 MPC 和 APC 图。

(3)当居民人均可支配收入为 60000 元时,预计人均消费支出 C 的点预测值。

(4)在 95%的置信度下,人均消费支出 C 平均值的预测区间。

(5)在 95%的置信度下,人均消费支出 C 个别值的预测区间。

2.4 假设某地区住宅建筑面积与建造单位成本的有关资料如表 2.10:


表 2.10 某地区住宅建筑面积与建造单位成本数据

建筑地编号 建筑面积(万平方米)X 建造单位成本(元/平方米)Y


1 0.6 1860
2 0.95 1750
3 1.45 1710
4 2.1 1690
5 2.56 1678
6 3.54 1640
7 3.89 1620
8 4.37 1576
9 4.82 1566
10 5.66 1498
11 6.11 1425
12 6.23 1419
根据上表资料:
(1)建立建筑面积与建造单位成本的回归方程;
(2)解释回归系数的经济意义;
(3)估计当建筑面积为 4.5 万平方米时,对建造平均单位成本作区间预测。

2.5 由 12 对观测值估计得消费函数为: Cˆ=


i 50 + 0.6 X i 其中,C 是消费支出,X 是可支

配收入(元),已知 X = 800 , ∑ (X − X )
i
2
8000 , ∑ ei2 = 300 , t0.025 (10) = 2.23 。当
=

X f = 1000 时,试计算:

(1)消费支出 C 的点预测值;

(2)在 95%的置信概率下消费支出 C 平均值的预测区间。

(3)在 95%的置信概率下消费支出 C 个别值的预测区间。

2.6 按照“弗里德曼的持久收入假说”: 持久消费 Y 正比于持久收入 X ,依此假说建立

=
的计量模型没有截距项,设定的模型应该为: Yi β 2 X i + ui ,这是一个过原点的回归。在

古典假定满足时,证明过原点的回归中 β 2 的 OLS 估计量 β̂ 2 的计算公式是什么?对该模型

是否仍有 ∑e i = 0 和 ∑ ei X i = 0 ?对比有截距项模型和无截距项模型参数的 OLS 估计有

53
什么不同?

2.7 练习题 2.2 中如果将浙江省“一般预算总收入”和“地区生产总值”数据的计量单位分

别或同时由”亿元”更改为”万元”,分别重新估计参数,对比被解释变量与解释变量的计量单

位分别变动和同时变动的几种情况下,参数估计及统计检验结果与计量单位与更改之前有什

么区别? 你能从中总结出什么规律性吗?
2.8 联系自己所学的专业选择一个实际问题,设定一个简单线性模型,并自己去收集样
本数据,用本章的方法估计和检验这个模型,你如何评价自己所做的这项研究?

附录 2.1 简单线性回归最小二乘估计有效性的证明

对于 OLS 估计式 β̂1 和 β̂ 2 ,已知其方差为

Var ( βˆ ) = σ 2
∑X i
2

n∑ x
1 2
i

σ2
Var ( βˆ2 ) =
∑ xi2
这里只证明 Var ( βˆ2 ) 最小, Var ( βˆ1 ) 最小的证明可以类似得出。

*
设 β 2 的另一个线性无偏估计为 β 2 ,即

β 2* = ∑ wiYi

xi
其中 wi ≠ ki , ki =
∑ xi2
E ( β 2* ) = E (∑ wiYi )

= E[∑ wi ( β1 + β 2 X i + ui )]

= β1 ∑ wi + β 2 ∑ wi X i

*
因为 β 2 也是 β 2 的无偏估计,即 E ( β 2 ) = β 2 ,必须有
*

∑w = 0,∑w X
i i i =1

同时因为 Var (Yi ) = σ


2

Var ( β 2* ) = Var (∑ wiYi )

54
= ∑ wi2Var (Yi )

= σ 2 ∑ wi2

= σ 2 ∑ ( wi − ki + ki ) 2

= σ 2 ∑ ( wi − ki ) 2 +σ 2 ∑ ki2 + 2σ 2 ∑ ( wi − ki )ki

= σ 2 ∑ ( wi − ki ) 2 +σ 2 ∑ ki2 + 2σ 2 (∑ wi ki − ∑ ki2 )

上式最后一项中因为 ∑w = 0,∑w X
i i i =1

∑wk −∑k 2
=
∑w x i i

∑x 2
i

∑x (∑ x )
i i i 2 2 2
i i

=
∑ w (X − X ) − 1
i i

∑x ∑x 2
i
2
i

=
∑w X − X∑w − 1 i i i

∑x ∑x 2
i
2
i

=0

xi2
所以 Var ( β
= ) σ ∑ ( wi − ki ) +σ ∑ [
* 2
] 2 2

(∑ xi2 ) 2
2

σ2
= σ 2 ∑ ( wi − ki ) 2 +
∑x 2
i

= σ 2 ∑ ( wi − ki ) 2 + Var (βˆ2 )

而 σ ≥ 0 ,因为 wi ≠ ki ,则有 ( wi − ki ) ≥ 0 ,为此


2 2

Var ( β 2* ) ≥ Var ( βˆ2 )

只有 wi = ki 时,Var ( β 2 ) = Var ( βˆ2 ) ,由于 β 2 是任意设定的 β 2 的线性无偏估计式,这表明


* *

β 2 的 OLS 估计式具有最小方差性。

附录 2.2 σ 2 最小二乘估计的证明

用离差形式表示模型时

55
y=
i Yi − Y

= ( β1 + β 2 X i + ui ) − ( β1 + β 2 X + u )

= (ui − u ) + β 2 xi

而且 yˆ=
i Yˆi − Y

= ( βˆ1 + βˆ2 X i ) − ( βˆ1 + βˆ2 X )

= βˆ2 xi
^
因此 ei = yi − yi = (ui − u ) − ( βˆ2 − β 2 ) xi

则有 e ∑ [(u − u ) − ( βˆ
∑= 2
i i 2 − β 2 ) xi ]2

= ∑ (u − u )
i
2
+ ( βˆ2 − β 2 ) 2 ∑ xi2 − 2( βˆ2 − β 2 )∑ (ui − u ) xi

取 ∑e
2
i 的期望

E (∑ e=
2
i ) E[∑ (ui − u ) 2 ] + ∑ xi2 E ( βˆ2 − β 2 ) 2 − 2 E[( βˆ2 − β 2 )∑ (ui − u ) xi ]

式中

E[∑ (ui − u )=
2
] E[∑ ui2 − n(u ) 2 ]

1
= ∑ E (u
) − E (∑ ui ) 2
n
2
i

1
= ∑ σ 2 − E (u12 + u22 + L + un2 + 2u1u2 + L + 2un −1un )
n
1
= ∑ σ 2 − E (u12 + u22 + L + un2 )
n
1
=∑ σ 2 − n nσ 2 =(n − 1)σ 2

σ2
∑ x E (βˆ2 −=
2
β 2 )2 ∑x 2
= σ2
∑ xi
i i 2

−2 E[( βˆ2 − β 2 )∑ (ui − u ) xi ] =


− 2 E[
∑ x u (∑ x u − u ∑ x )]
i i

∑x 2 i i i
i

(∑ xi ui ) 2
= −2 E[ ]
∑x 2
i

−2 E[( βˆ2 − β 2 ) 2 ∑ xi2 ]


=

56
−2∑ xi2 E (βˆ2 − β 2 ) 2 =
= −2σ 2

所以

E (∑ ei2 ) =(n − 1)σ 2 + σ 2 − 2σ 2 =(n − 2)σ 2

如果定义

σˆ 2
=
∑e 2
i

n−2

其期望值为

E (σˆ 2 ) E=
= [
∑ ei2 ] σ 2
n−2

这说明

σˆ 2
=
∑e 2
i

n−2

是 σ 的无偏估计。
2

57
第三章 多元线性回归模型

引子:

为什么各地区的地方财政性教育经费支出会差异明显?
《国家中长期教育改革和发展规划纲要(2010-2020 年)》强调:“教育是民族振兴、社会进

步的基石,是提高国民素质、促进人的全面发展的根本途径,寄托着亿万家庭对美好生活的期盼。”

要实现到 2020 年基本实现教育现代化,进入人力资源强国的战略目标,需要大幅度增加教育投入,

提高国家财政性教育经费支出占国内生产总值的比例。

改革开放以来,随着经济的快速增长,各级政府对教育的投入不断增加,在中央和地方一般公

共预算教育支出中,地方财政的支出约占 94.84%,地方财政支出是财政教育经费的主要来源。然而,

由于各地区社会经济发展不平衡不充分,各地区的一般公共预算教育支出水平差异明显。2016 年各

地区人均地方一般公共预算教育支出中,最高的是北京市为 4083.62 元,最低的是河南省仅为

1409.74 元,
北京市是河南省的 2.90 倍。为什么各地区的地方财政性教育经费支出差异如此明显呢?

影响中国地方财政性教育经费支出的因素很多,人口数量、经济发展、地方财力、政府教育投

入意愿、价格因素、居民对高质量教育的需求等,都可能会影响地方财政教育支出。

很明显,简单线性回归模型不能解决这类需要同时考虑多种因素问题的分析,还需要进一步寻

求有多个解释变量的回归分析方法。

》、《中国统计年鉴 2017》
资料来源:《国家中长期教育改革和发展规划纲要(2010-2020 年)

简单线性回归模型主要讨论一个被解释变量和一个解释变量之间的线性关系,但是,由于实际

经济问题的复杂性,一个经济变量可能会同多个变量相联系。例如,消费者对某种商品的需求量不

仅受该种商品价格的影响,而且还可能受消费者的收入水平、其他代用商品的价格等因素的影响;

又如,影响一个国家货币需求量的不仅有经济总量 GDP,而且还有利率、物价水平、外汇储备等多

种因素。因此,有必要将只有一个解释变量的一元回归模型推广到有多个解释变量的情况。本章将

把上一章讨论的结论推广到包含多个解释变量的多元回归模型。

第一节 多元线性回归模型及古典假定
一、多元线性回归模型
社会经济现象是复杂的,通常一种社会经济现象总是和许多种现象相联系。一种社会经济现象
与多种现象相联系的最简单形式,是一个被解释变量与多个解释变量的线性关系。例如,在生产理

论中,著名的 Cobb-Douglas 生产函数描述了产出量与投入要素之间的关系,其形式为

Y = AK α Lβ u (3.1)

其中 Y 表示产出量,K、L 分别表示资本和劳动投入,α、β为参数,u 为随机误差项。只是这

里的被解释变量 Y 与解释变量 K、L 之间的关系是非线性的,但通过对数变换后可转化为如下形式

ln Y =ln A + α ln K + β ln L + ln u (3.2)

如果将 lnY 视为被解释变量,将 lnK 和 lnL 视为解释变量,ln u 是随机误差项,该式关于参数 lnA、

α、β是线性的。

又如,随着经济的发展,对流通货币的需求也不断增长,货币当局的货币供应总量既要满足经

济增长的需要,又要控制其过分增长以保证不引起通货膨胀。为了把握中国货币供应量的发展趋势,

同时研究货币供应量与国内生产总值及其通货膨胀等因素的关系,这时的解释变量已不止一个,可

以考虑建立如下计量经济模型:

β1 + β 2 X 2 + β3 X 3 + ui
Yi = (3.3)

其中: Yi 为货币供应量(M2); X 2 为国内生产总值(GDP); X 3 为居民消费价格指数, ui 为随

机误差项。

在计量经济学中,如果总体回归函数描述了一个被解释变量与多个解释变量之间的线性关系,

由此而设定的总体回归函数就是多元线性回归模型。与一元线性回归模型类似,所谓多元线性回归

模型是指对各个回归参数而言是线性的,而对于变量则可以是线性的,也可以不是线性的。

一般地,对于由 n 个单位构成的总体, 包含被解释变量 Y 与 k -1 个解释变量 X 2 , X 3 ,L , X k 的多

元总体线性回归函数的形式为:

Yi = β1 + β 2 X 2i + β 3 X 3i + L + β k X ki + ui (3.4)

其中 β j ( j = 1,2,L , k ) 为模型的参数; u i 为随机扰动项; k -1 为解释变量的个数。

如果对总体全部 n 个单位的被解释变量 Y 及解释变量 X 2 , X 3 ,L , X k 作观测,所得的 n 组观测值

(Yi , X 2i , X 3i ,L X ki )(i = 1,2,L , n ) 将都满足如下线性关系

Yi = β1 + β 2 X 2i + β 3 X 3i + L + β k X ki + ui (i = 1,2,L , n ) (3.5)

在 E (ui X 2i , X 3i ,L , X ki ) = 0 条件下,多元总体线性回归函数的条件均值形式为:
E (Y X 2i , X 3i ,L , X ki ) = β1 + β 2 X 2i + β 3 X 3i + L + β k X ki (3.6)

多元线性回归模型与简单线性回归模型不同,简单线性回归模型中除了一个解释变量以外,其

他影响因素均被归入了随机扰动项。多元线性回归模型把多个解释变量纳入模型,即将原归入随机

项的某些因素纳入了模型,这对于经济计量分析有重要的意义。多元线性回归模型中有多个解释变

量,可以同时估计和检验多个因素对被解释变量的影响,从而避免重要解释变量被遗漏而导致设定

误差。不过,对于 Yi 和 X 2i 、 X 3i … X ki 的观测值,已不能再像简单线性回归那样用二维平面坐标的

散布图来表现了。

在有多个解释变量的模型中,由于多个解释变量会同时对被解释变量 Y 的变动发挥作用,因此,

如果要考察其中某个解释变量对 Y 的影响,就必须使其它解释变量保持不变。对于社会经济问题,

要获得象自然科学实验那样控制其他条件不变的实验数据通常是不现实的,往往只能去观测各种因

素都在变化的实际经济运行过程,而取得非实验的观测数据。在多元线性回归模型中,回归系数

β j ( j = 1,2,L , k ) 表示的正是当控制其它解释变量不变的条件下,第 j 个解释变量的单位变动对被解

释变量平均值的影响,这样的回归系数称为偏回归系数。多元线性回归模型中回归系数的偏回归系

数性质,可以实现保持某些控制变量不变的情况下,分析所关注的变量对被解释变量的真实影响。

在总体线性回归函数中,各个回归系数是未知的,只能利用样本观测值对之进行估计。如果将

被解释变量的样本条件均值 Yˆi 表示为各个解释变量的线性函数,即得多元样本线性回归函数:

Yˆi = βˆ1 + βˆ2 X 2i + βˆ3 X 3i + L + βˆk X ki (3.7)

其中 βˆ j ( j = 1,2,L , k ) 是对总体回归参数 β j 的估计。

与简单线性回归类似,多元回归中,由样本估计的被解释变量样本条件均值 Yˆi 与实际观测值 Yi 之

间通常也存在偏差,即剩余项或残差 ei ,所以多元样本线性回归函数也可表示为:

Yi = Yˆi + ei

如果有 n 次样本观测值则

Yi = βˆ1 + βˆ2 X 2i + βˆ3 X 3i + L + βˆk X ki + ei (i = 1,2,L n ) (3.8)

多元线性回归分析要解决的主要问题,仍然是如何根据变量的样本观测值去估计回归模型中的

各个参数,即要用样本回归函数去估计总体回归函数,并且对估计的参数及回归方程进行统计检验,

最后利用回归模型进行预测和经济分析。只不过多元线性回归模型包含了多个解释变量,相应的分
析过程及计算更为复杂。为了表达和分析的简便,对多元线性回归模型需要利用矩阵去表示和运算。

在实际运用中,借助于 EViews 等计量经济软件进行运算也十分方便。

二、多元线性回归模型的矩阵形式
对 被 解 释 变 量 Y 及 多 个 解 释 变 量 作 n 次 观 测 , 所 得 的 n 组 观 测 值

(Yi , X 2i , X 3i ,L X ki )(i = 1,2,L , n ) 的线性关系,实际可写成方程组的形式

Y1 = β1 + β 2 X 21 + β 3 X 31 + L + β k X k 1 + u1

Y2 = β1 + β 2 X 22 + β 3 X 32 + L + β k X k 2 + u2 (3.9)

Yn = β1 + β 2 X 2 n + β 3 X 3n + L + β k X kn + un

这样的方程组可表示成矩阵形式

 Y1  1 X 21 X 31 L X k 1   β1   u1 
Y  1 X X 32 L X k 2   β 2   u2 
= 2  22  +   (3.10)
 M M M M M   M  M
      
Yn  1 X 2 n X 3n L X kn   β k  un 

 Y1   β1   u1 
Y  β  u 
Y=  
2
β=  2  U=  2 
 M  M  M
     
Yn  βk  un 
1 X 21 X 31 L X k1 
1 X X 32 L Xk2 
X=  
22

M M M M
 
1 X 2 n X 3n L X kn 

这里的 X 是由解释变量 X ij 的数据构成的矩阵,其中截距项可视为解释变量总是取值为 1。X 一般是

非随机变量构成的,有时也称为 X 的数据矩阵或设计矩阵。

这样,多元总体线性回归函数的矩阵形式可表示为

Y = Xβ + U (3.11)

E ( Y ) = Xβ (3.12)

类似地,多元样本线性回归函数的矩阵形式表示为
Y = Xβˆ + e (3.13)

或 Ŷ = Xβˆ (3.14)

其中,

 Y^ 
 βˆ1   e1   1
  e  ^
 βˆ  ˆ = Y2 
βˆ =  2  e=  
2
Y
M  M  M
    ^
 βˆk   en  Y 
 n

分别为回归系数估计值向量、残差向量和 Y 的样本估计值向量。

三、多元线性回归模型的古典假定
在多元回归分析中,为了使参数估量量具有良好的统计性质,便于对模型进行统计检验,也需

要对模型及随机扰动项作一些假定。多元线性回归模型的基本假定条件有

1.零均值假定

假定随机扰动项的期望或均值为零

E (ui ) 0=
= i 1,2,L , n (3.15)

用矩阵形式可表示为

 u1   E (u1 )  0
u   E (u )  0
 2
E ( U ) E=
=  = 2 
  (3.16)
 M  M   M
     
un   E (un )  0
2. 同方差和无自相关假定

假定随机扰动项互不相关且方差相同

Cov(ui , uk ) =E [ ( ui − Eui )(uk − Euk ) ]


σ 2 , i = k (3.17)
(ui uk ) 
= E= (i, k 1, 2, L , n)
=
 0 , i≠k

其中 σ 是常数。也就是说,随机扰动项的方差—协方差矩阵为
2
Var ( U ) = E [ ( U − EU )( U − EU )′] = E ( UU′)
 E (u1u1 ) E (u1u2 ) L E (u1un ) 
 E (u u ) E (u u ) L E (u2un ) 
= 2 1 2 2 
 M M M 
 
 E (un u1 ) E (un u2 ) L E ( un u n ) 
σ 2 0 L 0
 
 0 σ2 L 0
=
 M M M
 
0 0 L σ 2

Var (U) = σ 2 I n (3.18)

其中 I n 为 n 阶单位阵。

3.随机扰动项与解释变量不相关假定

即假定

( X ji , ui ) 0=
Cov= ( j 2,3,
= L , k ; i 1,2,L , n ) (3.19)

4.无多重共线性假定

假定各解释变量之间不存在线性关系,或者说各解释变量的观测值之间线性无关;在此条件下,

解释变量观测值矩阵 X 列满秩

Rank(X)=k (3.20)

此时,方阵 X′X 满秩

Rank( X′X )=k (3.21)

从而 X′X 可逆, (X′X) 存在。


-1

5.正态性假定

假定随机扰动项 u i 服从正态分布,即

u i ~ N (0, σ 2 )

上述这些假定条件称为多元线性回归模型的古典假定。在对实际经济问题的回归分析中,这些

假定条件有时可能并不成立。如何识别这些假定条件是否满足,以及假定条件不成立时如何进行参

数估计和检验,将在后面几章中讨论。
第二节 多元线性回归模型的估计
在对模型作出古典假定的基础上,即可对多元线性回归模型的参数加以估计,并分析参数估计

量的统计性质。估计多元线性回归模型参数的方法有很多种,例如最小二乘估计、极大似然估计、

矩估计、广义矩估计等等,在对多元线性回归模型的古典假定全都满足的条件下,最常用的是普通

最小二乘估计法(OLS)。

一、多元线性回归模型参数的最小二乘估计
与简单线性回归模型参数的估计类似,多元线性回归模型也需要用样本信息建立的样本回归函

数“尽可能接近”地去估计总体回归函数。可以按最小二乘准则,采用使估计的剩余平方和最小的

原则去确定样本回归函数。

设 (Yi , X 2i , X 3i ,L , X ki ) 为第 i 次观测样本 (i = 1,2,L , n ) ,由(3.8)式,残差为

ei = Yi − ( βˆ1 + βˆ2 X 2i + βˆ3 X 3i + L + βˆk X ki ) (3.22)

要使残差平方和

∑e 2
i = ∑[Y − ( βˆ + βˆ X
i 1 2 2i + βˆ3 X 3i + L + βˆk X ki )]2

达到最小,其必要条件是

∂ ( ∑ ei2 )
= 0= ( j 1,2,L , k )
∂βˆj

−2∑ [Yi − ( βˆ1 + βˆ2 X 2i + βˆ3 X 3i + L + βˆk X ki )] =


0

−2∑ X 2i [Yi − ( βˆ1 + βˆ2 X 2i + βˆ3 X 3i + L + βˆk X ki )] =


0

−2∑ X ki [Yi − ( βˆ1 + βˆ2 X 2i + βˆ3 X 3i + L + βˆk X ki )] =


0

注意上述各式中方括号内的各项恰好为残差 ei ,从而上述 k 个方程可写成如下矩阵形式:

 ∑ ei  0
   
 ∑ X 2i ei  = 0
 M   M
   
 ∑ X ki ei  0
或者表示为
 ∑ ei   1 1 L 1   e1  0
  X
 ∑ X 2i ei  = X 22 L X 2n  e  0
 21   2  = X′e =   (3.23)
 M   M M M  M  M
       
 ∑ X ki ei   X k1 Xk2 L X kn   en  0
对样本回归函数式(3.13)两边同乘以样本观测值矩阵 X 的转置矩阵 X′ ,有

X′Y = X′Xβˆ + X′e (3.24)

由极值条件(3.23)式,可得正规方程组

X′Y = X′Xβˆ (3.25)

由古典假定条件中的无多重共线性假定,可知 (X′X) 存在,用 (X′X) 左乘上述方程两端,得


-1 -1

多元线性回归模型参数向量 β 最小二乘估计量的矩阵表达式为

βˆ = (X′X)-1 X′Y (3.26)

对于只有两个解释变量的线性回归模型 Yi = β1 + β 2 X 2i + β 3 X 3i + ui ,其参数最小二乘估计量的

代数表达式为

βˆ2 = ∑ y x ∑x −∑ y x ∑x
i 2i
2
3i i 3i x
2 i 3i
(3.27)
∑ x ∑ x − (∑ x x )
2 2 2
2i 3i 2 i 3i

βˆ3 = ∑ y x ∑x −∑ y x ∑x
i 3i
2
2i i 2i x
2 i 3i (3.28)
∑ x ∑ x − (∑ x x )
2 2 2
2i 3i 2 i 3i

βˆ1 =
Y − βˆ2 X 2 − βˆ3 X 3 (3.29)

其中, xi = X i − X , y i = Yi − Y 。

【例 3.1】国家的货币政策要考虑经济发展的需要,也要考虑控制通货膨胀。为研究中国的货币

供应量与国内生产总值及其通货膨胀等因素的关系,从《中国统计年鉴 2017》中取得 2000 年-2016

年中国货币供应量(M2)年底余额、国内生产总值(GDP)、居民消费价格指数(以 1978 年为 100

的定基指数)等数据作为样本,列于表 3.1 中:

表 3.1 2000—2016 年中国货币供应量等数据


货币供应量 M2 国内生产总值 GDP 居民消费价格指数
年份 (亿元) (当年价格/亿元) (1978=100)
Y X2 X3
2000 134610.3 100280.1 434.0
2001 158301.9 110863.1 437.0
2002 185007.0 121717.4 433.5
2003 221222.8 137422.0 438.7
2004 254107.0 161840.2 455.8
2005 298755.7 187318.9 464.0
2006 345577.9 219438.5 471.0
2007 403442.2 270232.3 493.6
2008 475166.6 319515.5 522.7
2009 610224.5 349081.4 519.0
2010 725851.8 413030.3 536.1
2011 851590.9 489300.6 565.0
2012 974148.8 540367.4 579.7
2013 1106525.0 595244.4 594.8
2014 1228374.8 643974.0 606.7
2015 1392278.1 689052.1 615.2
2016 1550066.7 744127.2 627.5
根据式(3.3)所建模型,被解释变量观测值向量和解释变量数据矩阵分别为

 134610.3  1 100280.1 434.0 


 158301.9  1 110863.1 437.0 
Y=  X= 
 M  M M M 
   
1550066.7  1 744127.2 627.5 
将有关数据代入(3.26)式,得到

 2454225 
ˆβ = (X′X)-1 X′Y =  4.083754 
 
-6332.294 

所估计的样本回归模型为

=Yˆi 2454225 + 4.083754 X 2i -6332.294X 3i

二、参数最小二乘估计的性质
从(3.26)式可以看出,参数的最小二乘估计量是样本观测值的函数,因此,参数估计量是随抽

样而变化的随机变量,当我们将具体的样本观测值代入时,就可得到参数的估计值。

类似于简单线性回归,在模型古典假定成立的情况下,多元线性回归模型参数的最小二乘估计

也具有线性性、无偏性与有效性等优良性质。

1.线性性质

最小二乘估计的参数估计量是被解释变量观测值 Yi 的线性组合。由式(3.26)可以看出, β̂ 等于

取 固 定 值 的 解 释 变 量 构 成 的 ( X′X) X′ 与 被 解 释 变 量 观 测 值 列 向 量 Y 的 乘 积 , 从 而
−1

βˆ j ( j = 1,2,L , k ) 为 Yi 的线性函数。
2.无偏性

因为 βˆ = (X′X)-1 X′Y = (X′X)-1 X′(Xβ + U)

= (X′X)-1 (X′X)β + (X′X)-1 X′U

= β + (X′X)-1 X′U

对两边取期望, ˆ = β + (X′X)-1 X′[ E (U)] = β


E (β) (3.30)

由零均值假定: E(U) = 0 ,则 β̂ 是 β 的无偏估计。

3.有效性

参数向量 β 的最小二乘估计 β̂ 是 β 的所有线性无偏估计量中方差最小的估计量。最小方差性的

证明较为繁琐,可参阅本章附录 3.1。

这就是说,在古典假定都满足的条件下,多元线性回归模型的最小二乘估计量也是最佳线性无

偏估计量(BLUE)。

三、OLS 估计的分布性质

在多元线性回归中,各个参数的估计量 β̂ 是随样本观测值而变动的的随机变量,必须确定其分

布性质,才可能进行区间估计和假设检验。

根据正态性假定, u i 是服从正态分布的,这决定了 Yi 也是服从正态分布的随机变量。由于最小

二乘估计的线性性质, βˆ j ( j = 1,2,L , k ) 是 Yi 的线性函数,这决定了 β̂ 也是服从正态分布的随机变

量。

ˆ =β
由最小二乘估计的无偏性性质,已知 E(β)

β̂ 的方差—协方差矩阵为

Var − Cov(βˆ ) =E{[βˆ − E (βˆ )][βˆ − E (βˆ )]′}

= E[(βˆ − β)(βˆ − β)′]

= E[(X′X)−1 X′UU′X(X′X)−1 ]

= (X′X)−1 X′E (UU′) X(X′X)−1

= (X′X)−1 X′σ 2 IX(X′X)−1


= σ 2 (X′X)−1 (3.31)

这里用到

βˆ= (X′X)−1 X′Y= (X′X)−1 X′( Xβ + U)= β + (X′X)−1 X′U

所以 βˆ j 的方差和标准误差为

Var ( βˆ j ) = σ 2 c jj (3.32)

SE ( βˆ j ) = σ c jj (3.33)

其中 c jj 是矩阵 (X′X) 中第 j 行第 j 列位置上的元素。


-1

也就是说,在古典假定下, βˆ j ( j = 1,2,L , k ) 服从正态分布。即

βˆ j ~ N [ β j , σ 2 c jj ] (3.34)

四、随机扰动项方差的估计
参数估计量的方差或标准差是衡量参数估计量接近真实参数的重要指标,据此可以判断参数估

计量的可靠性。但在表达参数估计量方差的式(3.31)~式(3.33)中,随机扰动项的方差 σ 是未知
2

的,参数估计量方差实际上无法直接计算。为此,需要对 σ 进行估计。
2

根据(3.13)式和(3.14)式,在得到参数估计值以后,即可计算残差向量

ˆ = Y - Xβˆ
e = Y-Y

据此可得残差平方和

∑e 2
i = e′e

可以证明,残差平方和具有如下性质(证明见本章附录 3.2)

E (∑ ei2 ) = E (e′e) = [n − k ]σ 2

E(
∑e 2
i
) =σ2 (3.35)
n−k

若记

σˆ 2 = ∑e 2
i
(3.36)
n−k
则 σ̂ 就是随机扰动项方差 σ 的无偏估计。一般地,称 σ̂ 为估计的方差, σ̂ 为估计的标准误差。
2 2 2

于是由式(3.32),参数估计量 βˆ j ( j = 1,2,L , k ) 的方差 Var ( βˆ j ) 可借助 σ̂ 去估计,从而有如下估计

Var =

( βˆ2 ) σˆ=
2
c jj (
∑ ei ) c 2

(3.37)
jj
n−k

例如,对于【例 3.1】,可计算出

σˆ 2
=

=
e 2
i 7518882170
= 537063012.14
n−k 17 − 3

ˆ ( β 2 ) ==
Var (
∑ ei2 )c 7518882170 × 0.00000000012917 = 0.0693727
22
n−k 17 − 3

同理,可计算出 Var ( βˆ1 ) = 112974973806.25 , Var ( βˆ3 ) = 690496.3497 。

第三节 多元线性回归模型的假设检验和区间估计
对已经估计出参数的多元线性回归模型的检验,除了对假定条件是否满足的检验以外,主要是

所估计的模型拟合优度的检验、整个回归方程显著性的检验以及模型中各个参数显著性的检验。

一、拟合优度检验
2
在简单线性回归模型中,我们用可决系数 R 来衡量估计的模型对观测值的拟合程度。在多元线

性回归模型中,我们也需要讨论所估计的模型对观测值的拟合程度。

(一)多重可决系数
与简单线性回归类似,为了说明多元线性回归线对样本观测值的拟合情况,也可以考察在 Y 的

总变差中由多个解释变量作出了解释的那部分变差的比重,即“回归平方和”与“总离差平方和”

2
的比值。在多元回归中这一比值称为多重可决系数,用 R 表示。

多元线性回归中 Y 的变差分解式为

变差 ∑ (Y − Y )
i
2
= ∑ (Yˆ − Y ) + ∑ (Y − Yˆ )
i
2
i i
2
(3.38)

TSS = ESS + RSS

自由度 (n-1) = ( k-1) + ( n-k)


其中,总离差平方和 TSS 反映了被解释变量观测值总变差的大小;回归平方和 ESS 反映了被解

释变量回归估计值总变差的大小,它是被解释变量观测值总变差中由多个解释变量作出解释的那部

分变差;残差平方和 RSS 反映了被解释变量观测值与估计值之间的变差,是被解释变量观测值总变

差中未被列入模型的解释变量解释的那部分变差。显然,回归平方和 ESS 越大,残差平方和 RSS 就

越小,从而被解释变量观测值总变差中能由解释变量解释的那部分变差就越大,模型对观测数据的

拟合程度就越高。因此我们定义多重可决系数为
ESS
R2 = (3.39)
TSS
或者表示为

2
R =
TSS − RSS
= 1−
RSS
= 1−
∑ ei 2

(3.40)
TSS TSS ∑ (Yi − Y ) 2
2
多重可决系数是介于 0 和 1 之间的一个数, R 越接近 1,模型对数据的拟合程度就越好。

多重可决系数可以用矩阵去表示,因为

TSS = ∑ (Y − Y ) = ∑Y
i
2
i
2
− nY 2 = Y′Y − nY 2 (3.41)

ESS βˆ ′X′Y − nY 2
= (3.42)

ESS βˆ ′X′Y − nY 2
所以 R2
= = (3.43)
TSS Y′Y − nY 2

(二)修正的可决系数
由式(3.43)可以看出,多重可决系数有一个重要性质,即它是模型中解释变量个数的不减函数,

也就是说,在样本容量不变时,随着模型中解释变量的增加,总离差平方和 TSS 不会改变,而解释

2
了的平方和 ESS 可能增大,多重可决系数 R 的值也会变大。当被解释变量相同而解释变量个数不

同时,这给运用多重可决系数去比较两个模型的拟合程度会带来缺陷。这时模型的解释变量个数不

同,不能简单地直接对比多重可决系数。可决系数只涉及到变差,没有考虑自由度 1。显然,如果用

自由度去校正所计算的变差,可以纠正解释变量个数不同引起的对比困难。因为在样本容量一定的

情况下,增加解释变量必定使得待估参数的个数增加,从而会损失自由度。为此,可以用自由度去

2 2
修正多重可决系数 R 中的残差平方和与回归平方和,从而引入修正的可决系数 R (adjusted

coefficient of determination),其计算公式为

1统计量的自由度指可自由变化的样本观测值个数,它等于所用样本观测值的个数减去对观测值的约束个数。
R 2 =1 −
∑e 2
i (n − k )
1
= −
n −1 ∑ ei2 (3.44)
∑ (Yi − Y )2 (n − 1) n − k ∑ (Yi − Y ) 2

修正可决系数与未经修正的多重可决系数之间有如下关系:
n −1
R 2 = 1 − (1 − R 2 ) (3.45)
n−k
2 2 2 2
由式(3.45)可以看出,当 k >1 时, R < R ,这意味着随着解释变量的增加, R 将小于 R 。

2 2
需要注意,可决系数 R 必定非负,但按式(3.45)计算的修正的可决系数 R 有可能为负值,这时

2
规定 R =0。

RSS
例 如 , 对 于 【 例 3.1 】, 已 知 = ∑=
2
e
i 7518882170 , 可 计 算 得=
TSS ∑ (Y − Y )
i
2

=3427020132178 ,所以可决系数为

2
R =1 −
∑e 2
i
1−
=
7518882170
0.9978
=
∑ (Yi − Y ) 2
3427020132178

修正的可决系数为
n −1 17 − 1
R 2 =1 − (1 − R 2 ) =1 − (1 − 0.9978) × =0.9975
n−k 17 − 3
需要强调,对用样本估计的回归模型计算的可决系数和修正的可决系数,也是随抽样而变动的

2 2
随机变量。在实际的计量经济分析中,往往希望所建立模型的 R 或 R 越大越好。但应明确,可决

2 2
系数只是对模型拟合优度的度量, R 和 R 越大,只是说明列入模型中的解释变量对被解释变量的

联合影响程度越大,并非说明模型中各个解释变量对被解释变量的影响程度也大。在回归分析中,

不仅要模型的拟合程度高,而且还要得到总体回归系数的可靠估计量。因此,在选择模型时,不能

单纯地凭可决系数的高低断定模型的优劣。

二、回归方程的显著性检验(F-检验)
由于多元线性回归模型包含多个解释变量,它们同被解释变量之间是否存在显著的线性关系呢?

还需进一步作出判断。也就是要对模型中被解释变量与所有解释变量之间的线性关系在总体上是否

显著作出推断。

对回归模型整体显著性的检验,所检验假设的形式为

H 0 : β=
2 β=
3 L= β=
k 0
H 1 : β j ( j = 2,3, L , k ) 不全为零

这种检验是在方差分析的基础上利用 F 检验进行的。如前所述,被解释变量 Y 观测值的总变差

有(3.38)式的分解形式,将自由度考虑进去进行方差分析,可得如表 3.2 所示的方差分析表:

表 3.2 方差分析表
变差来源 平方和 自由度 方差
源于回归 ESS= ∑ (Yˆ − Y )
i
2 k-1 ESS/(k-1)

源于残差 RSS= ∑ (Y − Yˆ ) 2 n-k RSS/( n-k)


i i

TSS= ∑ (Y − Y ) n-1
总变差 2
i

可以证明,在 H 0 成立的条件下,统计量

ESS (k − 1)
=F ~ F (k − 1 , n − k ) (3.46)
RSS (n − k )

即统计量 F 服从自由度为 k-1 和 n-k 的 F 分布。

给定显著性水平 α ,在 F 分布表中查出自由度为 k-1 和 n-k 的临界值 Fα (k − 1, n − k ) ,将样本观

测值代入式(3.46)计算 F 值,然后将 F 值与临界值 Fα (k − 1, n − k ) 比较。若 F> Fα (k − 1, n − k ) ,

则拒绝原假设 H 0 : β=
2 β=
3 L= β=
k 0 ,说明回归方程显著,即列入模型的各个解释变量联合起

来对被解释变量有显著影响;若 F< Fα (k − 1, n − k ) ,则不能拒绝原假设 H 0 :β=


2 β=
3 L= β=
k 0,

说明回归方程不显著,即列入模型的各个解释变量联合起来对被解释变量的影响不显著。

例 如 , 对 于 【 例 3.1 】, 已 计 算 得 TSS = ∑ (Y − Y )
i
2
3427020132178 ,
=

RSS = ∑ ei2 = 7518882170 ,则有 ESS = 3419501250008 。对于 H 0 : β=


2 β=
3 0 ,给定显著性水

平 α = 0.05 ,在 F 分布表中查出自由度为 k-1=3-1 和 n-k=17-3 的临界值 F0.05 (2,14) = 3.74 ,计算 F

统计量为

ESS / (k − 1) 3419501250008 / (3 − 1)
=F = = 3184
RSS / (n − k ) 7518882170 / (17 − 3)

由于 F=3184> F0.05 (2,14) = 3.74 ,说明回归方程是显著的,即列入模型的解释变量“国内生产

总值”和“居民消费价格指数”联合起来对被解释变量“货币供应量”有显著影响。

需要指出的是,在一元线性回归中,由于解释变量只有一个,不存在解释变量联合影响的整体
检验问题,也就用不着进行 F 检验。事实上,在一元回归情形下,F 检验与 t 检验是一致的,它们之

间存在如下关系:

(Yˆ − Y ) ∑ βˆ ( X − X )
2
∑= 2 2
ESS (2 − 1) i 2 i
=F =
RSS (n − 2) ∑ e (n − 2) ∑ e (n − 2)
2
i
2
i
2 (3.47)
 ˆ
βˆ22 ∑ xi2 βˆ22  β 2 
= = = = t2
σˆ 2 σˆ 2 ∑ xi2  SE

ˆ 
 (β2 ) 

即 F 统计量等于 t 统计量的平方。给定显著性水平 α ,查 Fα (1, n − 2)与tα 2 ( n − 2) ,临界值之

间也存在这种平方关系。也就是说,在一元回归情形下,对参数 β 2 的显著性检验(t 检验)与对回

归总体上的显著性检验(F 检验)是等价的。

由方差分析可以看出,F 检验与可决系数有密切联系。事实上,F 检验与拟合优度检验都是在把

总变差 TSS 分解为回归平方和 ESS 与残差平方和 RSS 的基础上构造统计量进行的检验,区别在于

前者考虑了自由度,后者未考虑自由度。一般来说,模型对观测值的拟合程度越高,模型总体线性

2
关系的显著性就越强。F 统计量与可决系数 R 之间有如下关系:

n − k R2
F= ⋅ (3.48)
k −1 1 − R2

2 2 2
可以看出,伴随着可决系数 R 和修正可决系数 R 的增加,F 统计量的值将不断增加。当 R =0

2 2
时,F=0;当 R 越大时,F 值也越大;当 R =1 时,F → ∞ 。这说明两者之间具有一致性,对

H 0 : β=
1 β=
2 L= β K= 0 的检验,实际等价于对 R 2 = 0 的检验。也就是说,对方程联合显著性检

2
验的 F 检验,实际上也是对 R 的显著性检验。可决系数和修正可决系数只能提供对拟合优度的度

量,它们的值究竟要达到多大才算模型通过了检验呢?并没有给出确定的界限。而 F 检验则不同,

它可以在给定显著性水平下,给出统计意义上严格的结论。

三、回归参数的显著性检验(t-检验)
多元线性回归分析的目的,不仅是获得较高拟合优度的模型,也不仅是要寻求方程整体的显著

性,而是要对各个总体回归参数作出有意义的估计。因为方程的整体线性关系显著并不一定表示每

个解释变量对被解释变量的影响都是显著的。因此,还必须分别对每个解释变量进行显著性检验。

多元回归分析中对各个回归系数的显著性检验,目的在于分别检验当其它解释变量不变时,该回归

系数对应的解释变量是否对被解释变量有显著影响。检验方法与简单线性回归的检验基本相同。
由参数估计量的性质已知,回归系数的估计量服从如下正态分布,见式(3.34):

βˆ j ~ N [ β j ,Var ( βˆ j )]

因此其标准化随机变量服从标准正态分布

βˆ j − β j
Z= ~ N (0,1) (3.49)
Var ( βˆ j )

由式(3.32)已知 Var ( βˆ j ) = σ c jj ,而 σ 未知,故 Var ( βˆ j ) 也未知。但正如前面已经讨论过的,


2 2

可以用 σ̂ 代替 σ 对 βˆ j 作标准化变换,而且可以证明所构造的统计量服从自由度为 n-k 的 t 分布,


2 2

βˆ j − β j βˆ j − β j
t= = ~ t (n − k ) (3.50)
σˆ 2 c jj σˆ c jj

这样,就可以用 t 统计量对各个回归参数作显著性检验。具体过程如下:

1.提出检验假设

β j 0=
H 0 := ( j 1,2,L , k )

H1 : β j ≠ 0 ( j =
1,2,L , k )

2.计算统计量

在 H 0 成立的条件下,式(3.50)变为

βˆ j − 0 βˆ j
=t = ~ t (n − k ) (3.51)
σˆ c jj σˆ c jj

根据样本观测值计算 t 统计量的值

βˆ j
t= (3.52)
σˆ c jj
3. 检验

给定显著性水平 α ,查自由度为 n-k 的 t 分布表,得临界值 tα 2 ( n − k ) 。

若 t ≥ tα ( n − k ) ,即 t ≤ −tα 2 ( n − k ) 或 t ≥ tα 2 ( n − k ) ,就拒绝 H 0 ,不拒绝 H 1 ,说明在其它


2

解释变量不变的情况下,解释变量 X j 对被解释变量 Y 的影响是显著的。

若 t < tα ( n − k ) ,即 −tα 2 ( n − k ) < t < tα 2 ( n − k ) ,就不能拒绝 H 0 ,说明在其它解释变量不变


2
的情况下,解释变量 X j 对被解释变量 Y 的影响不显著。

从 t 分布表可以看出,在给定显著性水平 α = 0.05 的情况下,当自由度大于 10 时,临界值 tα 2 基

本上都接近 2。因此,当参数估计的 t 统计量的绝对值超过 2 时,我们可以粗略作出判断,在显著性

水平 0.05 下可拒绝原假设 H 0 ,认为相应解释变量对被解释变量的影响是显著的,此时犯错误的概

率不超过 0.05。如果系数估计的 t 统计量的绝对值远大于 2,则犯错误的概率更小。

例如【例 3.1】,对于 H 0 : β 2 = 0 和 H 0 : β 3 = 0 ,给定显著性水平 α = 0.05 ,查自由度为

n-k=17-3=14 的 t 分布表,得临界值 t0.025 (14) = 2.145 。已知 σˆ =23174.62 ,可分别计算

βˆ2 4.083754
=tβ2 = = 15.51
σˆ c22 23174.62 × 0.0000113644

βˆ -6332.294
=t β3 = = 7.62
σˆ c33 23174.62 × 0.03585

可以看出,t β 2 = 15.51 和 tβ3 = -7.62 的绝对值均大于 t0.025 (14) = 2.145 ,在显著性水平 α = 0.05

下可以拒绝 H 0 : β 2 = 0 和 H 0 : β 3 = 0 。这说明在其它解释变量不变的情况下,在显著性水平

α = 0.05 下,可以认为解释变量“国内生产总值”和“居民消费价格指数”对被解释变量“货币供
应量”的影响是显著的。

一般来说,多元线性回归模型在经过参数估计和模型检验后,应对回归分析结果作出分析判断。

倘若某些解释变量对被解释变量的影响不显著,则应重新建立多元线性回归模型,对新模型参数进

行估计和假设检验,直到获得较为满意的结果为止。

四、多元线性回归模型参数的区间估计
为了说明参数真实值的可能范围和可靠性,还需要在对参数点估计的基础上对多元线性回归模

型参数作区间估计。

当用式(3.36)对随机扰动项的方差 σ 作出估计以后,用 σˆ 替代 σ ,可以证明


2 2 2

βˆ j − β j βˆ j − β j
=t* =^
~ t (n − k ) (3.53)
SE ( βˆ j ) σˆ c jj

给定 α ,查 t 分布表的自由度为 n-k 的临界值 tα 2 ( n − k ) ,则有


βˆ j − β j
P[−tα 2 (n − k ) ≤ t * = ^ ≤ tα 2 (n − k )] =1 − α ( j = 1L k )
ˆ
SE ( β j )
^ ^
即 P[ βˆ j − tα 2 SE ( βˆ j ) ≤ β j ≤ βˆ j + tα 2 SE ( βˆ j )] =−
1 α (3.54)

或 P[ βˆ j − tα 2σˆ c jj ≤ β j ≤ βˆ j + tα 2σˆ c jj ] =−
1 α

这就是多元线性回归模型参数的置信度为 1 −α 的置信区间。

例如,对于例 3.1 的参数,前面已估计出 βˆ2 = 4.083754 , βˆ3 = −6332.294 ,而且可计算得

c22 0.00000000012915 0.0000113644


= = , c33 0.0012855 0.03585 , 并 且 可 得
=

σˆ 537063012.1444 23174.62 。
=

若取 α = 0.05 ,查 t 分布表得 t0.025 ( 20) = 2.145 ,则有

P[ βˆ2 − tα 2σˆ c22 ≤ β 2 ≤ βˆ2 + tα 2σˆ c22 ] =−


1 α

P[4.083754 − 2.145 × 23174.62 × 0.0000113644 ≤ β 2


≤ 4.083754+2.145 × 23174.62 × 0.0000113644] =
1 − 0.05

P(3.518835 ≤ β3 ≤ 4.648673) =
0.95

同理得 P[ βˆ3 − tα 2σˆ c33 ≤ β 3 ≤ βˆ3 + tα 2σˆ c33 ] =1 − α

P[-6332.294 − 2.145 × 23174.62 × 0.03585 ≤ β 2


≤ -6332.294+2.145 × 23174.62 × 0.03585] =
1 − 0.05

P(−8114.3817 ≤ β3 ≤ -4550.2063) =
0.95

第四节 多元线性回归模型的预测
多元线性回归模型用于经济预测,是指对各个解释变量给定样本以外数值

X f = (1, X 2 f , X 3 f ,L , X kf ) 的条件下,对预测期被解释变量 Y 的平均值 E (Y f ) 及个别值 Y f 进行估计,

这种预测也分为点预测与区间预测。

一、点预测
设多元线性回归模型为
Y = Xβ + U

若根据观测的样本已经估计出参数的估计量 β̂ ,且模型通过检验,即得到样本回归方程

Ŷ = Xβˆ

把样本以外各个解释变量的值表示为行向量 X f = (1, X 2 f , X 3 f ,L , X kf ) ,直接代入所估计的多元样

本回归函数,就可以计算出被解释变量的点预测值 Yˆf :

Yˆf = Xf βˆ

= βˆ1 + βˆ2 X 2 f + βˆ3 X 3 f + L + βˆk X kf (3.55)

对(3.55)式两边取期望得

) E ( βˆ1 + βˆ2 X 2 f + βˆ3 X 3 f + L + βˆk X kf )


E (Yˆf =

= β1 + β 2 X 2 f + β3 X 3 f + L + β k X kf

= E (Y f ) (3.56)

说明 Yˆf 是 E (Y f ) 的无偏估计,从而可以用 Yˆf 作为 E (Y f ) 和 Y f 的点预测值。

例如,对于【例 3.1】
,如果 2020 年中国的“国内生产总值”达到 976000 亿元,
“居民消费价格

指数”(定基指数,以 1978 年为 100)控制在 650.0,可预测其“货币供应量”(M2)将可能达到:

Yˆf = 2454225 + 4.083754 × 976000-6332.294 × 650.0=2323977.8 (亿元)

二、平均值 E (Y f ) 的区间预测

为了对预测期平均值 E (Y f ) 作区间预测,必须明确得到的点预测值 Yˆf 与预测期平均值 E (Y f ) 的

关系,并分析其概率分布性质。如果记 Yˆf 和 E (Y f ) 的偏差为 w f ,即

w=
f Yˆf − E (Y f ) (3.57)

因为 Yˆf 服从正态分布, w f 也服从正态分布,而且

E ( w f ) =E[Yˆf − E (Y f )] =E (Yˆf ) − E (Y f ) =0 (3.58)

可以证明, w f 的方差为 σ Xf (X′X) X′f ,即


2 -1

w f ~ N [0 , σ 2 Xf (X′X)-1 X′f ] (3.59)


若用 σ̂ 代替未知的 σ ,构造如下统计量
2 2

wˆ f − E ( w f ) Yˆf − E (Y f )
=t = (3.60)
SE ( wˆ f ) σˆ Xf (X′X)-1 X′f
该统计量 t 服从自由度为 n-k 的 t 分布。

给定显著性水平 α ,查自由度为 n-k 的 t 分布表,可得临界值 tα 2 ( n − k ) 。则 Y f 平均值 E (Y f ) 的

置信度为 1 − α 的预测区间为

Yˆf − tα 2σˆ Xf (X′X)-1 X′f ≤ E (Y f ) ≤ Yˆf + tα 2σˆ Xf (X′X)-1 X′f (3.61)

三、个别值 Y f 的区间预测

要对预测期个别值 Y f 作区间预测,除了已经得到的点预测值 Yˆf 以外,还需要分析已知的点预测

值 Yˆf 和预测期个别值 Y f 的联系,并明确其概率分布性质。显然,与点预测值 Yˆf 和预测期个别值 Y f

有关的是残差 e f :

e=
f Y f − Yˆf (3.62)

因为 Y f 和 Yˆf 均服从正态分布, e f 也服从正态分布,而且

(e f ) E (Y f − Yˆf )
E=

= E ( Xf β + u f − Xf βˆ )

= Xf E (β) + E (u f ) − Xf E (βˆ )

=0 (3.63)

还可以证明, e f 的方差为 σ [1 + Xf (X′X) X′f ] ,即


2 -1

e f ~ N {0 , σ 2 [1 + Xf (X′X)-1 X′f ]} (3.64)

若用 σ̂ 代替未知的 σ ,构造如下统计量
2 2

e f − E (e f ) Y f − Yˆf
=t = (3.65)
SE (e f ) σˆ 1 + Xf (X′X)-1 X′f
则该统计量 t 服从自由度为 n-k 的 t 分布。

给定显著性水平 α ,查自由度为 n-k 的 t 分布表,可得临界值 tα 2 ( n − k ) 。则 Y f 的置信度为 1 − α


的预测区间为

Yˆf − tα 2σˆ 1 + Xf (X′X)-1 X′f ≤ Y f ≤ Yˆf + tα 2σˆ 1 + Xf (X′X)-1 X′f (3.66)

第五节 案例分析

一、研究的目的和要求
《国家中长期教育改革和发展规划纲要(2010-2020 年)》明确提出:“国运兴衰,系于教育;

教育振兴,全民有责”。“强国必先强教。优先发展教育、提高教育现代化水平,对实现全面建设小

康社会奋斗目标、建设富强民主文明和谐的社会主义现代化国家具有决定性意义”。教育投入是支

撑国家长远发展的基础性、战略性投资,是教育事业的物质基础,是公共财政保障的重点。所以,

必须始终坚持把教育摆在优先发展的位置,充分认识加大财政教育投入的重要性和紧迫性。各级政

府要优化财政支出结构,统筹各项收入,把教育作为财政支出重点领域予以优先保障,切实提高财

政教育支出占公共财政支出比重。纲要明确提出,到 2012 年实现国家财政性教育经费支出占国内

生产总值比例达到 4%的目标。

改革开放以来,随着经济的快速增长,各级政府高度重视增加财政教育投入,先后出台了一系

列加大财政教育投入的政策措施,财政教育投入持续大幅增长。2016 年中央和地方一般公共预算教

育支出 28072.78 亿元,占一般公共预算支出的 14.95%,已成为公共财政的第一大支出。国家财政

性教育经费占 GDP 的比重,2000 年为 2.87%,2016 年提高到 4.22%,已连续第五年保持在4%以上。

在中央和地方一般公共预算教育支出中,地方一般公共预算教育支出 26625.06 亿元,约占全国一般

公共预算教育支出的 94.84%,地方财政支出是财政教育经费的主要来源,为教育事业改革发展铸就

了稳固的物质基础。

但是如本章的“引子”中注意到的,由于各地区社会经济发展不平衡不充分,各地区政府财政

性教育经费支出的差异还比较明显。为了研究影响中国各地区地方一般公共预算教育支出变动的主

要原因,分析地方财政教育支出增长的数量规律,预测地方一般公共预算教育支出的增长趋势,可

以建立计量经济模型。

影响地方财政教育支出的因素很多,据分析主要的因素可能有:(1)各地区居民对教育数量、

质量、品质的需求有差异,地区的人口数量不同决定了各地区教育规模不同;(2)由地区经济规模

决定的地方整体财力是地方财政教育支出的基本源泉,关系到地方政府对教育投入的能力;(3)地

方政府对教育投入的意愿和重视程度的不同,可能构成地方财政教育支出差异的原因;(4)物价水
平,特别是教育消费的价格变动,会影响地方财政对教育的支出;(5)现在社会及民办教育发展很

快,可以适应部分居民对教育消费的需求,可能对政府公共预算教育投入形成一定的补充。

二、模型设定
为了全面反映中国地方一般公共预算教育支出的差异,选择“地方一般公共预算教育支出”为

被解释变量。根据对影响中国地方一般公共预算教育支出主要因素的分析,选择各地区的“年末人

口数量”作为居民对教育需求的代表性变量;选择“地方一般公共预算收入”度量地区财政教育投

入的能力;地方政府教育投入意愿难以直接量化,选择“教育支出在地方财政支出中的比重”作为

其代表;选择“教育消费价格指数”作为价格变动影响的因素;选择“居民人均教育文化娱乐消费”

代表居民对高质量、高品质教育的需求和社会及民办教育的补充因素。

以国家统计局已经公布的 2016 年 31 个省市区的数据为样本,从《中国统计年鉴 2017》中收集

到以下数据(见表 3.3)

表 3.3 2016 年各地区地方一般公共预算教育支出及主要影响因素数据


地区 地方一般公 年末人口数 地方一般 教育支出在 教育消费价
居民人均教育
共预算教育 (万人) 公共预算 地方一般公 格指数
文化娱乐消费
支出(亿元) 收入(亿 共预算支出
(元/人)
元 中的比重%
Y X2 X3 X4 X5 X6
北京 887.37 2173 5081.26 13.85 101.2 3686.6

天津 502.49 1562 2723.5 13.58 100.8 2404

河北 1134.9 7470 2849.87 18.76 102.1 1449.2

山西 606.97 3682 1557 17.70 101.6 1810.7

内蒙古 554.97 2520 2016.43 12.30 101.1 2165.8

辽宁 633.96 4378 2200.49 13.85 104.9 2422.1

吉林 499.7 2733 1263.78 13.93 100.8 1850.1

黑龙江 558.87 3799 1148.41 13.22 102.3 1688.3

上海 840.97 2420 6406.13 12.15 104.6 4174.6

江苏 1842.94 7999 8121.23 18.46 101.6 2514.5

浙江 1300.03 5590 5301.98 18.64 104 2794.3

安徽 910.87 6196 2672.79 16.49 103 1558.8

福建 789.11 3874 2654.83 18.46 101.6 1905.4

江西 848.88 4592 2151.47 18.38 102.7 1424.4

山东 1825.99 9947 5860.18 20.86 102.2 1754.6


河南 1343.76 9532 3153.47 18.03 104.1 1439.5

湖北 1047.37 5885 3102.06 16.31 103.5 1739.5

湖南 1032.37 6822 2697.88 16.29 100.5 2392.7

广东 2318.47 10999 10390.35 17.24 102.5 2451.2

广西 854.55 4838 1556.27 19.24 101.6 1444

海南 214.24 917 637.51 15.56 102.9 1544.9

重庆 575.18 3048 2227.91 14.37 101.3 1745.9

四川 1301.85 8262 3388.85 16.26 101.9 1284.8

贵州 843.54 3555 1561.34 19.79 101.9 1602.5

云南 871.14 4771 1812.29 17.36 102 1429.8

西藏 169.64 331 155.99 10.68 100.6 370.1

陕西 777.53 3813 1833.99 17.71 100.7 1785.2

甘肃 548.95 2610 786.97 17.43 100.2 1502.1

青海 171.36 593 238.51 11.24 102.8 1568.2

宁夏 152.57 673 387.66 12.16 103.2 1772.1

新疆 664.52 2398 1298.95 16.06 101.3 1471.2

为利用 EViews 软件分析和估计模型的参数,用第二章案例中介绍的方法,建立工作文件,选择

数据类型“integer data”,在“Start date”中输入“1”,在“End date”中输入“31”,在 EViews 命

令框直接键入“data Y X2 X3 X4 X5 X6 ”, 在对应的“Y、X2、X3、X4、 X5、 X6”下输入或粘贴

相应的数据。为初步观察数据的关系,在命令栏输入“Sort Y”,其中 Y 为按其递增排序的变量名称,

实现数据按 Y 递增排序。在“workfile”中按住“ctrl”键,点击“Y、X2、X3、X4 、X5、 X6”,在双

击的菜单中点“open group”,出现“Y、X2、X3、X4 、X5 、X6”数据表“Group”。在数据表“Group”

中点 “View/graph/line/ok”,出现序列 Y、X2、X3、X4、X5、X6 的线性图(如图 3-.1 )


图 3.1 地方财政教育支出及影响因素数据图形
可以看出各地区地方财政教育经费支出及各影响因素的差异明显,但其变动的方向基本相同,相

互间可能具有一定的相关性。探索将模型设定为线性回归模型形式:

β1 β 2 X 2i + β 3 X 3i + β 4 X 4i + β 5 X 5i + β 6 X 6i + ui
Yii =+

三、估计参数
利用 EViews 估计模型参数,可点击“Quick”下拉菜单中的“Estimate Equation”,在出现的对话

框的“Equation Specification”栏中键入“Y C X2 X3 X4 X5 X6”,在“Estimation Settings”栏中选择

“Least Sqares”(最小二乘法),点“ok”
,或者在命令栏中直接输入“LS Y C X2 X3 X4 X5 X6”,回

车即出现回归结果(图 3.2):

图 3.2 回归结果

根据图 3.2 中数据,模型估计的结果写为:

Yˆi =
1807.610 + 0.078621X 2 + 0.125787 X 3 + 25.78046 X 4 -19.21102 X 5 -0.054383 X 6

(967.2413) (0.007994) (0.010103) (5.426062) (9.461518) (0.025146)

t= (1.868831) (9.835376) (12.45009) (4.751229) (-2.030438) (-2.162720)

R 2 = 0.988633 R 2 = 0.98636 F=434.8814 n=31

四、模型检验
1. 经济意义检验
模型估计结果表明,在假定其它变量不变的情况下,地区年末人口每增长 1 万人,平均说

来地方一般公共预算教育支出会增长 0.078621 亿元;地区地方一般公共预算收入每增长 1 亿元,平

均说来地方一般公共预算教育支出将增长 0.125787 亿元;当教育支出在地方财政支出中的比重增加

1%,平均说来地方一般公共预算教育支出会增长 25.78046 亿元;当教育消费价格指数增加 1 个百分

点,平均说来地方一般公共预算教育支出会减少 19.21102 亿元;当居民人均教育文化娱乐消费每增

加 1 元,平均说来地方一般公共预算教育支出可减少 0.054383 亿元;这与理论分析和经验判断基本

相一致。

2. 统计检验

2 2
(1)拟合优度:由图 3.2 中数据可以得到:R = 0.988633 ,修正的可决系数为 R = 0.98636 ,

这说明模型对样本的拟合很好。

(2)F 检验:针对 H 0 : β=
2 β=
3 β=
4 β=
5 β=
6 0 ,给定显著性水平 α = 0.05 ,在 F 分布表中

查出自由度为 k-1=5 和 n-k=25 的临界值 Fα (5,25) = 2.61 。由图 3.2 中得到 F=434.8814,由于

F=434.8814> Fα (5, 25) = 2.61 ,应拒绝原假设 H 0 : β=


2 β=
3 β=
4 β=
5 β=
6 0 ,说明回归方程显著,

即 “年末人口数”、
“地方一般公共预算收入”、
“教育支出在地方一般公共预算支出中的比重”
、“教

育消费价格指数”、“居民人均教育文化娱乐消费”等变量联合起来,确实对“地方一般公共预算教

育支出”有显著影响。

(3)t 检验:分别针对 H 0:
= ( j 1, 2,3, 4,5, 6) ,若给定显著性水平 α = 0.05 ,查 t 分
β j 0=

2.060 ;若给定显著性水平 α = 0.10 ,查 t 分布表得


布表得自由度为 n-k=25 临界值 t0.05 2 ( n − k ) =

1.708 。由图 3.2 中数据可得, β̂ 2 、 β̂3 、 β̂ 4 、 β̂ 6 所对应的


自由度为 n-k=25 临界值 t0.10 2 ( n − k ) =

t 统计量分别为 9.835376、12.45009、4.751229、-2.162720,其绝对值均大于 t0.05 2 ( n − k ) =


2.060 ,

这说明在显著性水平 α = 0.05 下,分别都应当拒绝 H 0:


=β j 0=
( j 2,3, 4, 6) ,也就是说,在其它

解释变量不变的情况下,解释变量 “年末人口数”( X 2 )、“地区一般公共预算收入”( X 3 )、“教

育支出在一般公共预算支出中的比重”( X 4 )、“居民人均教育文化娱乐消费”( X 6 )分别对被解释

变量“地方一般员工工预算教育支出”Y 都有显著的影响。除此以外, 与 β̂1 、 β̂ 5 对应的 t 统计量分

别为 1.868831 和-2.030438,其绝对值均小于 t0.05 2 ( n − k ) =


2.060 ,也就是说在给定显著性水平
α = 0.05 下 , 还 不 能 拒 绝 H : β 6 = 0 。 可 是 , 与 β̂1 、 β̂5 对 应 的 t 统 计 量 的 绝 对 值 都 大 于

1.708 ,也就是说在 α = 0.10 的显著性水平下,可以拒绝 H 0:


t0.10 2 (n − k ) = = β j 0=
( j 1,5) ,

认为“教育消费价格指数”对“地方财政一般公共预算教育支出”Y 有显著的影响。这样的结论从

表 3.4 中的 P 值也可以判断,与 β̂ 2 、β̂ 3 、β̂ 4 、β̂ 6 估计值对应的 P 值均小于 α = 0.05 ,表明在 α = 0.05

的显著性水平下,对应解释变量对被解释变量影响显著。与 β̂1 和 β̂ 5 估计值对应的 P 值为 0.0734 和

0.0531,虽然大于 α = 0.05 ,但是小于 α = 0.10 ,表明在 α = 0.10 的显著性水平下,“教育消费价

格指数”对“地方财政一般公共预算教育支出”Y 影响是显著的。

利用所估计的地方一般公共预算教育支出模型,通过某地区相应的“年末人口数”( X 2 )、“地

区一般公共预算收入”( X 3 )、“教育支出在地方一般公共预算支出中的比重”( X 4 )、“教育消费价

格指数”( X 5 )、“居民人均教育文化娱乐消费”( X 6 )等变量的预测数据,可以对各地区“地方一

般公共预算教育支出“(Y)作出点预测和区间预测。

本章小结
1. 多元线性回归模型是将总体回归函数描述为一个被解释变量与多个解释变量之间线性关系

的模型。通常多元线性回归模型可以用矩阵形式表示。

2. 多元线性回归模型中对随机扰动项 u 的假定,除了零均值假定、同方差假定、无自相关假定、

随机扰动与解释变量不相关假定、正态性假定以外,还要求满足无多重共线性假定。

3. 多元线性回归模型参数的最小二乘估计式;参数估计式的分布性质及期望、方差和标准误差;

在基本假定满足的条件下,多元线性回归模型最小二乘估计式是最佳线性无偏估计式。

4. 多元线性回归模型中参数区间估计的方法。

5. 多重可决系数的意义和计算方法,修正可决系数的作用和方法。

6. F 检验是对多元线性回归模型中所有解释变量联合显著性的检验,F 检验是在方差分析基础

上进行的。

7. 多元回归分析中,为了分别检验当其它解释变量不变时,各个解释变量是否对被解释变量有

显著影响,需要分别对所估计的各个回归系数作 t 检验。

8. 利用多元线性回归模型作被解释变量平均值预测与个别值预测的方法。

9.主要公式表见表 3.4。
表 3.4 主要公式表
名称 公式
多元线性回归模型 Yi = β1 + β 2 X 2i + β 3 X 3i + L + β k X ki + ui

E (Yi X 1 , X 2 ,L X k ) = β1 + β 2 X 2i + β 3 X 3i + L + β k X ki

Y=Xβ+U E (Y) = Xβ
样本回归函数
Yi = βˆ1 + βˆ2 X 2i + βˆ3 X 3i + L + βˆk X ki + ei
Yˆi = βˆ1 + βˆ2 X 2i + βˆ3 X 3i + L + βˆk X ki
^ ^
Y=X β̂ + e Y = Xβ
基本假定 E(U)=0

σ 2 , i = k
Cov(=
ui , uk ) E=
(ui uk )  Rank(X)=k
 0 , i≠k
Cov ( X ji= ( j 1,2,L , k ) ui ~ N (0, σ 2 )
, ui ) 0=

最小二乘估计 X′Y = X′Xβˆ

βˆ = (X′X)-1 X′Y
参数 OLS 估计的期望 ˆ =β
E(β)

参数 OLS 估计的方差 ∧
Var ( βˆ j ) = σˆ 2 c jj = (
∑ ei ) c
2

jj
n−k
参数估计的标准误差 SE ( βˆ j ) = σ c jj

σˆ 2 = ∑
σ 2 的无偏估计 ei2
n−k
参数估计的置信区间 P[ βˆ j − tα σˆ c jj ≤ β j ≤ βˆ j + tα σˆ c jj ] =−
1 α
2 2

多重可决系数
R2 =
1−
RSS
1−
=
∑ ei2
TSS ∑ (Yi − Y )2
修正的可决系数
R2 =
1−
∑ ei2 (n − k ) = 1 −
n −1 ∑ ei2
∑ (Yi − Y )2 (n − 1) n − k ∑ (Yi − Y ) 2

F 检验统计量 ESS (k − 1)
=F ~ F (k − 1 , n − k )
RSS (n − k )
t 检验统计量 βˆ j − β j βˆ j − β j
=t =^
~ t (n − k )
SE ( βˆ j ) σˆ c jj
点预测值 Yˆf = Xf βˆ

平均值预测区间
Yˆf − tα 2σˆ X f (X ′X) -1 X ′f ≤ E (Y f ) ≤ Yˆf + tα 2σˆ X f (X ′X) -1 X ′f

个别值预测区间
Yˆf − tα 2σˆ 1 + X f (X ′X) -1 X ′f ≤ Y f ≤ Yˆf + tα 2σˆ 1 + X f (X ′X) -1 X ′f

思考题
3.1 若要将一个被解释变量对两个解释变量作线性回归分析:

(1)写出总体回归函数和样本回归函数;

(2)写出回归模型的矩阵表示;

(3)说明对此模型的古典假定;

(4)写出回归系数及随机扰动项方差的最小二乘估计式,并说明参数估计式的性质;

3.2 什么是偏回归系数?它与简单线性回归的回归系数有什么不同?

3.3 多元线性回归中的古典假定与简单线性回归时有什么不同?

3.4 多元线性回归分析中,为什么要对可决系数加以修正?修正可决系数与 F 检验之间有何区别

与联系?

3.5 什么是方差分析?对被解释变量的方差分析与对模型拟合优度的度量有什么联系和区别?

3.6 多元线性回归分析中,F 检验与 t 检验的关系是什么?为什么在作了 F 检验以后还要作 t 检

验?

β1 β 2 X 2i + β3 X 3i + ui 中,当 X2 和 X3 相互独立时,对
3.7 试证明:在二元线性回归模型 Yi =+

斜率系数 β 2 和 β 3 的 OLS 估计值,等于 Yi 分别对 X 2 和 X 3 作简单线性回归时斜率系数的 OLS 估计

值。

3.8 对于没有截距项的二元回归模型,

Yi = β 2 X 2i + β3 X 3i + µi

试求该模型参数的最小二乘估计量,该模型残差和是否一定为零?

3.9 说明用 EViews 完成多元线性回归分析的具体操作步骤。

练习题
3.1 进入 21 世纪后,中国的家用汽车增长很快。家用汽车的拥有量受到经济增长、公共服务、

市场价格、交通状况、社会环境、政策因素,都会影响中国汽车拥有量。为了研究一些主要因素与

家用汽车拥有量的数量关系,选择“百户拥有家用汽车量”、“人均地区生产总值”、“城镇人口
比重”、“居民消费价格指数”等变量,2016 年全国各省市区的有关数据如表 3.5。

表 3.5 2016 年各地区的百户拥有家用汽车量等数据


地区 百户拥有家用汽 人均 GDP 城镇人口比 居民消费价格指
车量(辆) (万元) 重 数
(%) (上年=100)
Y X2 X3 X4
北 京 47.3 11.81 86.5 101.4
天 津 43.1 11.45 82.93 102.1
河 北 35.3 4.29 53.32 101.5
山 西 24.6 3.54 56.21 101.1
内蒙古 34.1 7.19 61.19 101.2
辽 宁 24.2 5.08 67.37 101.6
吉 林 21.4 5.41 55.97 101.6
黑龙江 14.2 4.05 59.2 101.5
上 海 29.3 11.64 87.9 103.2
江 苏 37.9 9.67 67.72 102.3
浙 江 45.2 8.45 67 101.9
安 徽 18.7 3.94 51.99 101.8
福 建 26.5 7.44 63.6 101.7
江 西 21.5 4.03 53.1 102
山 东 44.1 6.84 59.02 102.1
河 南 23.7 4.25 48.5 101.9
湖 北 17.6 5.55 58.1 102.2
湖 南 21.4 4.62 52.75 101.9
广 东 29.4 7.35 69.2 102.3
广 西 22.2 3.79 48.08 101.6
海 南 18.1 4.42 56.78 102.8
重 庆 19.6 5.82 62.6 101.8
四 川 20.4 3.99 49.21 101.9
贵 州 21.2 3.31 44.15 101.4
云 南 28.7 3.10 45.03 101.5
西 藏 23.3 3.48 29.56 102.5
陕 西 19.9 5.09 55.34 101.3
甘 肃 18 2.76 44.69 101.3
青 海 30.5 4.34 51.63 101.8
宁 夏 30.1 4.69 56.29 101.5
新 疆 25.2 4.02 48.35 101.4
资料来源:中国统计年鉴 2017.中国统计出版社

1)建立百户拥有家用汽车量计量经济模型,估计参数并对模型加以检验,检验结论的依据是什

么?。

2)分析模型参数估计结果的经济意义,你如何解读模型估计检验的结果?

3) 你认为模型还可以如何改进?
3.2 利用 1994 年-2016 年中国的出口货物总额(Y)、工业增加值(X2)、人民币汇率(X3)的

数据(表 3.6)。

表 3.6 出口货物总额、工业增加值、人民币汇率数据
年份 出口货物总额 工业增加值 人民币汇率
(亿元) (亿元) (人民币/100 美元)
Y X2 X3
1994 1210.06 19546.9 861.87
1995 1487.8 25023.9 835.1
1996 1510.48 29529.8 831.42
1997 1827.92 33023.5 828.98
1998 1837.09 34134.9 827.91
1999 1949.31 36015.4 827.83
2000 2492.03 40259.7 827.84
2001 2660.98 43855.6 827.7
2002 3255.96 47776.3 827.7
2003 4382.28 55363.8 827.7
2004 5933.26 65776.8 827.68
2005 7619.53 77960.5 819.17
2006 9689.78 92238.4 797.18
2007 12204.56 111693.9 760.4
2008 14306.93 131727.6 694.51
2009 12016.12 138095.5 683.1
2010 15777.54 165126.4 676.95
2011 18983.81 195142.8 645.88
2012 20487.1 208905.6 631.25
2013 22090 222337.6 619.32
2014 23422.9 233856.4 614.28
2015 22734.7 236506.3 622.84
2016 20976.3 247877.7 664.23
资料来源: 中国统计年鉴 2017.中国统计出版社.

β1 β 2 X 2 t + β 3 X 3t + ut ,估计参数并对模型加以
(1)建立出口货物总额计量经济模型: Yt =+

检验。

α1 α 2 ln X 2 t + α 3 X 3t + ut ,估计参数并
(2)如果再建立如下货物总额计量经济模型: ln Yt =+

对模型加以检验。

(3)分析比较两个模型参数估计结果的经济意义有什么不同。

3.3 经研究发现,家庭书刊消费受家庭收入及户主受教育年数的影响,表中为对某地区部分家庭

抽样调查得到样本数据:

表 3.7 家庭书刊消费、家庭收入及户主受教育年数数据
家庭书刊 家庭月 户主受 家 庭 书 家庭月 户主受
年消费支出 平均收入 教育年数 刊年消费支 平均收入 教育年数
(元)Y (元) (年) 出(元)Y (元) (年)

X T X T
450 1027.2 8 793.2 1998.6 14
507.7 1045.2 9 660.8 2196 10
613.9 1225.8 12 792.7 2105.4 12
563.4 1312.2 9 580.8 2147.4 8
501.5 1316.4 7 612.7 2154 10
781.5 1442.4 15 890.8 2231.4 14
541.8 1641 9 1121 2611.8 18
611.1 1768.8 10 1094.2 3143.4 16
1222.1 1981.2 18 1253 3624.6 20

1) 作家庭书刊消费(Y)对家庭月平均收入(X)和户主受教育年数(T)的多元线性回归:

Yi =β1 + β 2 X i + β 3Ti + ui

利用样本数据估计模型的参数,对模型加以检验,分析所估计模型的经济意义和作用。

2)作家庭书刊消费(Y)对户主受教育年数(T)的一元回归,获得残差 E1;再作家庭月平均

收入(X)对户主受教育年数(T)的一元回归,并获得残差 E2。

=
3)作残差 E1 对残差 E2 的无截距项的回归: E1 α 2 E 2 + vi ,估计其参数。

4)对比所估计的 βˆ2 和 α̂ 2 后,你对家庭书刊消费(Y)对家庭月平均收入(X)和户主受教育年

数(T)的多元线性回归的参数的性质有什么认识?

3.4 为了分析中国税收收入(Y)与国内生产总值(X2)、财政支出(X3)、商品零售价格指数(X4)

的关系,利用 1978-2016 年的数据,用 EViews 作回归,部分结果如下:


表3.8 回归结果

Dependent Variable: LOG(Y)


Method: Least Squares
Date: 02/27/18 Time: 21:39
Sample: 1978 2016
Included observations: 39

Variable Coefficient Std. Error t-Statistic Prob.

C -2.644243 0.492741 (A) 0.0000


LOG(X2) 0.486072 (B) 5.434302 0.0000
LOG(X3) 0.571652 0.091369 (C) 0.0000
X4 (D) 0.004420 2.259756 0.0302

R-squared 0.994202 Mean dependent var 9.053230


Adjusted R-squared (E) S.D. dependent var 1.778090
S.E. of regression (F) Akaike info criterion -0.982145
Sum squared resid 0.696569 Schwarz criterion -0.811523
Log likelihood 23.15183 Hannan-Quinn criter. -0.920927
F-statistic (G) Durbin-Watson stat 0.590885
Prob(F-statistic) 0.000000

填补表中(A)、(B)、(C)、(D)、(E)、(F)、(G)位置空缺的数据,分析回归的结果,并评价所估计

参数的经济意义。

3.5 已知某商品的需求量(Y)、价格(X2)和消费者收入(X3),下表给出了解释变量 X 2 和. X 3 对 Y

线性回归方差分析的部分结果:

表 3.9 方差分析表
变差来源 平方和(SS) 自由度(df) 平 方 和 的 均 值
(MSS)
来自回归(ESS) 377067.19

来自残差(RSS) 470895.00
19
总变差(TSS)

1)回归模型估计结果的样本容量 n、来自回归的平方和(ESS)与残差平方和 RSS 的自由度各为多

少?

2)此模型的可决系数和修正的可决系数为多少?

3)利用此结果能对模型的检验得出什么结论?能否认为模型中的解释变量 X 2 和 X 3 联合起来对

某商品的需求量 Y 的影响是否显著?本例中能否判断两个解释变量 X 2 和 X 3 各自对某商品的需求量

Y 也都有显著影响?

3.6 为了分析四川省各市(州)住户存款变动的趋势,由《四川省统计年鉴》取得 2015 年各市

(州)人民币住户存款年底余额(Y)、年末总人口(X2)、人均可支配收入(X3)、地区生产总值(X4)

等数据:

表 3.10 四川省 2015 年各市(州)住户存款等数据


市 (州) 人民币住户存款 年末总人口 人均可支配收入 市(州)生产总值
(亿元) (万人) (元) (亿元)
Y X2 X3 X4
成都 9944 1228.1 30996 10801.16
自贡 819 327.5 24142 1143.11
攀枝花 462 110.6 27983 925.18
泸州 1140 505.7 24545 1353.41
德阳 1292 390 25138 1605.06
绵阳 1641 545.5 25111 1700.33
广元 733 305.3 21757 605.43
遂宁 788 378.8 23137 915.81
内江 936 420.4 23854 1198.58
乐山 1161 353.8 24251 1301.23
南充 1723 742.3 22074 1516.2
眉山 1020 349.1 24349 1029.86
宜宾 1010 552.1 24288 1225.9
广安 1062 467.4 24118 1005.61
达州 1506 682.8 21992 1350.76
雅安 505 154.9 23421 502.58
巴中 634 379.5 21856 501.34
资阳 1060 503.7 24399 1270.38
阿坝州 187 91.4 24017 265.04
甘孜州 186 109.2 22979 213.04
凉山州 765 503.9 22362 1314.84

资料来源: 四川省统计年鉴 2016.中国统计出版社.

β1 β 2 X 2 + β3 X 3 + β 4 X 4 + ut ,你预期所估计的各个参数的符
(1)如果设定线性回归模型 Yt =+

号应该是什么?,

(2)用 OLS 法估计参数,模型参数估计结果与你的预期是否相符合?对这个计量模型的估计结

果你如何评价?

β1 + β 2 X 2 +β3 X 3 + ut ,用 OLS 法估计其参数,你对该


(3) 如果另外建立线性回归模型: Yt =

模型估计结果有什么评价?

3.7 在第二章练习题 2.8 你自己设定的简单线性回归模型的基础上,将模型拓展,改造成有三个

以上解释变量的多元线性回归模型。并自己去收集样本数据,用本章的方法估计和检验这个多元线

性回归模型,你如何评价自己所做的这项研究?

附录 3.1 多元线性回归最小二乘估计最小方差性的证明
*
设 β 为 β 的另一个关于 Y 的线性无偏估计式,可知

β* = AY ( A 为常数矩阵)

由无偏性可得 E (β* )= E (AY)= E[A(Xβ + U)]

= E (AXβ) + AE (U)

= AXE (β) = β
所以必须有 AX = I

要证明最小二乘法估计式的方差 Var ( βˆ ) 小于其他线性无偏估计式的方差 Var ( β ) ,只要证明协


*

方差矩阵之差

E [(β* - β)(β* - β)′] − E[(βˆ - β)(βˆ - β)′]

为半正定矩阵,则称最小二乘估计 β̂ 是 β 的最小方差线性无偏估计式。

因为 β* - β = AY - β = A(Xβ + U) - β

= AXβ + AU - β

= β + AU - β = AU

所以
*
E[(β= - β)(β* - β)′] E=
[(AU)(AU)′] E ( AUU′A′)

= AE(UU′)A′ = AA′σ 2

已知 E[(βˆ - β)(βˆ - β)′] = (X′X)-1 σ 2

所以 E[(β* - β)(β* - β)′] − E[(βˆ - β)(βˆ - β)′] = AA′σ 2 − (X′X)-1 σ 2

= [ AA′ - (X′X)-1 ]σ 2

由于 [ A - (X′X)-1 X′][A - (X′X)-1 X′]′ = [A - (X′X)-1 X′][A′ - X(X′X)-1 ]

= AA′ - (X′X)-1 X′A′ - AX(X′X)-1 + (X′X)-1 X′X(X′X)-1

= AA′ - (X′X)-1

由线性代数知,对任一非奇异矩阵 C , CC′ 为半正定矩阵。如果令 [ A - (X′X) X′] = C


-1

则 CC′ = [A - (X′X)-1 X′][A - (X′X)-1 X′]′ = AA′ - (X′X)-1

由于半正定矩阵对角线元素非负,因此有 AA′ - (X′X) ≥ 0


-1

即 E ( β *j − β j ) 2 − E ( βˆ j − β j ) 2 ≥ 0 ( j = 1, 2,L k )

这证明了 β j 的最小二乘估计 βˆ j 在 β j 的所有无偏估计中是方差最小的估计式。

附录 3.2 残差平方和 ∑ ei2 的均值为 (n − k )σ 2 的证明


由残差向量的定义及参数的最小二乘估计式,有
ˆ = Y - Xβˆ
e = Y-Y

= Y - X(X′X)-1 X′Y

= [I - X(X′X)-1 X′]Y

可以记 P = I - X(X′X) X′ ,则
-1

e = PY = [I - X(X′X)-1 X′][Xβ + U]

= Xβ - X(X′X)-1 X′Xβ + PU

= PU
容易验证,P 为对称等冪矩阵,即

P = P′

P 2 = PP′ = P
残差向量的协方差矩阵为

Var − Cov (e ) =
E (ee′)

= E[PU(PU)′]

= E[P(UU′)P′]

= P[ E (UU′)]P′

= P(σ 2 I)P′

= PP′σ 2

= Pσ 2

利用矩阵迹的性质,有

∑ e= 2
i
′e tr (ee′)
e=

两边取期望得

E (∑
= ei2 ) E (e′e) − E[tr (ee′)]

[ E (e′e)] tr[Pσ 2 ]
= tr=

= σ 2tr[I - X(X′X)-1 X′]


= σ 2 {tr (I ) − tr[(X′X)-1 X′X]}

= σ 2 [n − tr (I )]

= (n − k )σ 2
第四章 多重共线性

引子

工业增加值增长会减少财政收入吗?
国家财政收入的高低是政府有效实施其各项职能的重要保障。国家财政收入依靠经济

的发展,主要来自各项税收收入,特别是工业企业是税收的重要来源。只有经济持续而健康

地增长,才能提供持续的税收来源,因而经济增长是其重要的影响因素。为了分析各主要因

素对国家财政收入的影响,建立一般公共预算收入(CZSR)为被解释变量,国内生产总值

(GDP)、税收总额 (SSZE)、工业增加值(GYZJZ)等为解释变量的多元线性回归模型。从

中国统计年鉴得到2000年-2016年的统计数据,采用普通最小二乘法得到以下估计检验结果

(见图4.1):

图4.1 财政收入的回归结果
从回归结果可见,可决系数为0.9999,校正的可决系数为0.9999,模型拟合非常好。F

统计量高达38101.22,说明在 α = 0.05水平下回归方程整体上是很显著的,模型对财政收入

的解释程度高达99.99%。t检验结果表明,国内生产总值、税收总额、工业增加值对一般预

算收入的影响都很显著。可是,工业增加值回归系数的符号为负,这就是说工业经济越是增

长,反而会使财政收入减少,这显然与理论分析和实践经验都不相符。为什么会出现这样的

异常结果呢?如果设定的模型和数据的真实性没有问题,问题可能会出在哪里呢?

本章专门讨论古典假定中无多重共线性假定被违反的情况,主要内容包括多重共线性的

实质和产生的原因、多重共线性产生的后果、多重共线性的检测方法及无多重共线性假定违

反后的处置方法。

1
第一节 什么是多重共线性
一、多重共线性的含义
第三章讨论多元线性回归模型的估计时,强调了假定无多重共线性,即假定各解释变

量之间不存在线性关系,或者说各解释变量的观测值之间线性无关。在计量经济学中所谓的

多重共线性(Multi-Collinearity),不仅包括解释变量之间精确的线性关系,还包括解释变量之

间近似的线性关系。

β1 β 2 X 2i + L +β k X ki + ui 中,截距项 β1 可以视为恒等于1的
在有截距项的模型 Yi =+

解释变量 X 1i 对应的偏回归系数,即

Yi = β1 X 1i + β 2 X 2i + L +β k X ki + ui

其中 X 1i ≡ 1 。因此从数学意义上去说明多重共线性,即若存在不全为0的数 λ1 , λ2 , λ3 , L , λk ,

使得

λ1 X 1i + λ2 X 2i + L =
+ λk X ki 0 =(i 1, 2, L ,n) ( 4.1 )

则称解释变量 X 1 , X 2 , X 3 , L X k 之间存在着完全的多重共线性。

用矩阵表示,解释变量的数据矩阵为

 X 11 X 21 X 31 L X k1 
X X 22 X 32 L X k 2 
X= 
12
(4.2)
 M M M M M
 
 X 1n X 2n X 3n L X kn 

当Rank(X)<k时,表明在数据矩阵X中,至少有一个列向量可以用其余的列向量线性表示,

则说明存在完全的多重共线性。

在实际经济问题中,完全的多重共线性并不多见。常见的情形是解释变量

X 1 , X 2 , X 3 , L X k 之间存在不完全的多重共线性。所谓不完全的多重共线性,是指对于解释

变量 X 1 , X 2 , X 3 , L X k ,存在不全为0的数 λ1 , λ2 , λ3 , L , λk ,使得

λ1 X 1i + λ2 X 2i + λ3 X 3i + L + λk X ki + vi = 0 i=
1, 2, L ,n (4.3)

其中, vi 为随机变量。这表明解释变量 X 1 , X 2 , X 3 , L X k 只是一种近似的线性关系。

如果解释变量之间不存在完全或不完全的线性关系,则称无多重共线性。若用矩阵表示,

这时X为满秩矩阵,即Rank(X)= k 。
2
需要强调,解释变量之间不存在线性关系,并非不存在非线性关系,当解释变量存在非

线性关系时,并不违反无多重共线性假定。

回归模型中解释变量的关系可能表现为三种情形:

(1) rxi x j = 0 ,解释变量间毫无线性关系,变量间相互正交。事实上这时已不需要作多

元回归,每个参数βj都可以通过y对xj的一元回归来估计。

(2) rxi x j = 1 ,解释变量间完全共线性。此时模型参数将无法确定。直观地看,当两变

量按同一方式变化时,要区别每个解释变量对被解释变量的影响程度非常困难。

(3) 0<rxi x j <1 ,解释变量间存在一定程度的线性关系。实际中常遇到的是这种情形。

随着共线性程度的加强,会对参数估计值的准确性、稳定性带来影响。因此不完全的

多重共线性事实上有严重程度的问题。

二、产生多重共线性的背景
由于经济现象的变化涉及多个影响因素,而影响因素之间常常存在一定的相关性。多

重共线性产生的经济背景主要有几种情形:

1. 经济变量之间具有共同变化趋势。例如,对于时间序列数据收入、消费、就业率等,

在经济上升时期均呈现增长的趋势,而当经济收缩期,又都呈现下降趋势。当这些变量同时

作为解释变量进入模型时就会带来多重共线性问题。

2. 模型中包含滞后变量。当建立的模型中引入了解释变量的滞后变量时,如,

X t , X t −1 , X t − 2 , 等等,而X变量与其滞后期变量常常呈现高度相关,于是导致出现多重共线

性。

3. 利用截面数据建立模型也可能出现多重共线性。利用截面数据建模时,许多变量变

化与发展规模相关,会呈现出共同增长的趋势,例如资本、劳动力、科技、能源等投入与产

出的规模相关,这时容易出现多重共线性。有时如果出现部分因素的变化与另一部分因素的

变化相关程度较高时,也容易出现共线性。如粮食产量与化肥用量、水浇地面积、农业投入

资金建立回归模型,发现回归效果较差,原因是农业资金的影响已经通过化肥用量、水浇地

面积两个因素体现出来。

4. 样本数据自身的原因。例如,抽样仅仅限于总体中解释变量取值的一个有限范围,

使得变量变异不大;或由于总体受限,多个解释变量的样本数据之间存在相关,这时都可能

出现多重共线性。
3
第二节 多重共线性产生的后果
一、完全多重共线性产生的后果
1. 参数的估计值不确定

完全共线性时,X矩阵的秩小于k,此时 X ′X = 0 ,正规方程组的解不惟一, ( X ′X )
−1

不存在,回归参数的最小二乘估计表达式不成立。

这里以两个解释变量的回归模型 Yi = β1 + β 2 X 2i + β 3 X 3i + ui 为例,说明完全多重共

线性的影响。采用离差形式表示的两个解释变量的回归模型为:

y i = βˆ 2 x 2i + βˆ 3 x3i + µˆ i (4.4)

由第三章(3.27)、(3.28)式得到其OLSE估计式为:

(∑ y x )(∑ x ) − (∑ y x )(∑ x 2
x 3i )
βˆ 2 =
i 2i 3i i 3i 2i
(4.5)
(∑ x )(∑ x ) − (∑ x x )
2
2i
2
3i 2i 3i
2

βˆ3 =
(∑ y x )(∑ x ) − (∑ y x )(∑ x
i 3i
2
2i i 2i x
2 i 3i ) (4.6)
(∑ x )(∑ x ) − (∑ x x )
2
2i
2
3i 2 i 3i
2

假定 X 2i = λX 3i ,这里λ是一非零常数,将其分别带入(4.5)和(4.6)式,可得:

βˆ2 =
(λ ∑ y x )(∑ x ) − (∑ y x )(λ ∑ x x ) = 0
i 3i
2
3i i 3i 3i 3i
(4.7)
(λ ∑ x )(∑ x ) − λ (∑ x x )
2 2
3i
0 2
3i
2
3i 3i
2

(∑ y x )(λ ∑ x ) − (λ ∑ y x )(λ ∑ x ) 0
2 2 2

βˆ
i 3i 3i i 3i 3i
= = (4.8)
3
(λ ∑ x )(∑ x ) − λ (∑ x )
2 2
3i
0 2
3i
2 2 2
3i

式(4.7)和式(4.8)都是不定式,这说明当 X 2i = λX 3i 时,参数的估计值是不确定的。

从回归模型的建模思想看,在回归模型中回归系数 β̂ 2 的含义是指在保持 X 3 不变的情

况下,当 X 2 每变动一个单位时Y的平均变化;回归系数 β̂ 3 的含义是指在保持 X 2 不变的情

况下,当 X 3 每改变一个单位时Y的平均变化。如果 X 2 与 X 3 完全共线性,就没有办法能在

保持 X 2 不变的情况下,分析 X 3 对Y的影响。或者说,没有方法能从所给的样本中把 X 2 和

X 3 各自的影响分解开来。

4
2. 参数估计值的方差无限大

还是以只有两个解释变量的回归模型 Yi = β1 + β 2 X 2i + β 3 X 3i + ui 为例,由第三章的

式(3.27)和式(3.28),已知OLS估计参数的方差为 Var-Cov(βˆ )=σ ( X ′X ) ,容易导出这时


2 −1

参数估计量 βˆ2 和 βˆ3 的方差为

Var ( βˆ2 ) =
∑x 2
3
σ2 (4.9)
( ∑ x )( ∑ x ) − ( ∑ x x )
2
2
2
3 2 3
2

Var ( βˆ3 ) =
∑x 2
2
σ2 (4.10)
( ∑ x )( ∑ x ) − ( ∑ x x )
2
2
2
3 2 3
2

在完全共线性情况下 X 2i = λX 3i ,代入式4.9)和式(4.10)中得

Var ( βˆ2 ) =
∑x 2
3
σ2 = ∑x 2
3
σ2 = ∞
( λ ∑ x )( ∑ x ) − (λ ∑ x x )
2 2
3
2
3 3 3
2
0

λ 2 ∑ x32 ∑x 2

同理 Var ( βˆ3 ) = σ2 = 2
σ2 = ∞
(λ 2
∑ x )(∑ x 2
3
2
3 ) − (λ ∑ x3 x3 ) 2
0

这表明,在解释变量之间存在完全的共线性时,参数估计值的方差将变成无限大。

二、不完全多重共线性下产生的后果
完全多重共线性情形只不过是一种极端。通常,解释变量之间并不一定是完全的线性

关系。如果模型中存在不完全的多重共线性,这种情况下 (X ′X ) 也存在,可以得到参数的
−1

估计值,但是对计量经济分析可能会产生一系列的影响。

(1)数估计值的方差与协方差增大。

仍然以只有两个解释变量的回归模型 Yi = β1 + β 2 X 2i + β 3 X 3i + ui 为例, X 2 与 X 3 不

完全的共线性的关系为

x 2i = λx3i + vi (4.11)

其中, λ ≠ 0 并且 vi 是具有性质 ∑x v = 0 的随机误差项。


3i i

这种情况下,还是可以用OLS法估计回归系数 β 2 和β 3 。若将(4.11)带入(4.6)式得:

(∑ y x )(λ ∑ x + ∑ v ) − (λ ∑ y x + ∑ y v )(λ ∑ x )
2 2 2 2

βˆ 3 =
i 3i 3i i i 3i i i 3i
(4.12)
(λ ∑ x + ∑ v )(∑ x ) − λ (∑ x )
2 2
3i
2
i
2
3i
2 2 2
3i

5
其中利用了关系式 ∑x v = 0 。因此在 X 2 与 X 3 近似共线性时,βˆ3 还是可以估计的。但是,
3i i

如果 X 2 与 X 3 共线程度越高, vi 会充分地小,以至于非常接近于零,此时 βˆ3 会愈加趋于不

确定。对于 β̂ 2 也可推出类似的表达式,并得到类似的结论。

在 X 2 与 X 3 为不完全的共线性时, X 2 与 X 3 的相关系数的平方用离差形式可表示为

(∑ x2 x3 ) 2
r232 = (4.13)
∑ x22 ∑ x32
将其代入到(4.9)和(4.10)式中,容易证明

Var ( β 2
^
)= ∑x 2
3
σ2
(∑ x )(∑ x ) − (∑ x x )
2
2
2
3 2 3
2

1
=σ2
(∑ x2 x3 ) 2
∑ 2
x 2
[1 − ]
∑ x22 ∑ x32
σ2
=
∑ x (1 − r )
2 2
(4.14)
2i 23

同样地,可以得到:

( )
var βˆ 3 =
σ2
( ) (4.15)
∑ x32i 1 − r232
(
cov βˆ 2 , βˆ 3 = ) − r23σ 2
(4.16)
(1 − r ) ∑ x ∑ x
2
23
2
2i
2
3i

从(4.14)和(4.15)式中可以看出,随着共线性增加, r23 趋于1,两个参数估计量的

方差也将增大。同样地,其协方差在绝对值上也增大。由(4.14)、(4.15)、(4.16)式可以看出,

方差和协方差增大的速度决定于方差扩大因子(简称VIF)。VIF定义为:

1
VIF = (4.17)
(
1 − r232 )
VIF表明,参数估计量的方差是由于多重共线性的出现而膨胀起来的。随着共线性的增

2
加,参数估计量的方差也增大,当 r23 趋于1时,甚至可以变至无穷大。而当没有共线性时,

VIF将是1。利用VIF的定义,(4.14)和(4.15)式可表达为:

6
( )
var βˆ 2 =
σ2
⋅ VIF (4.18)
∑ x22i
( )
ˆ
var β 3 =
σ2
⋅ VIF (4.19)
∑ x32i
这表明了 βˆ 2 和βˆ 3 的方差同VIF成正比关系。

(2)对参数区间估计时,置信区间趋于变大。

存在多重共线性时,参数估计值的方差增大,其标准误差也增大,导致总体参数的置信

区间也随之变大。同上例,假设方差已知,正态分布下95%置信度下的分位点为1.96,当

r23 = 0.99 时, β3 的置信区间要比相关系数为零时约大 50 倍(见表4.1)。

表4.1 增加共线性对 β 3 的95%置信区间 βˆ3 ± 1.96 se βˆ3 的影响 ( )


r23 r232 β 3 的95%置信区间

0.00 0.00 βˆ3 ± 1.96 σ 2 ∑x 2


3i

0.50 0.25 βˆ3 ± 1.96 (1.33) σ 2 ∑x 2


3i

0.99 0.9801 βˆ3 ± 1.96 50 σ 2 ∑x 2


3i

0.999 0.998001 βˆ 3 ± 1.96 (500) σ 2 ∑x 2


3i

(3)严重多重共线时,假设检验容易给出错误的判断。

存在严重多重共线时,首先是参数的置信区间扩大,会使得接受一个本应拒绝的假设

的 概 率 增 大 ; 此 外 , 在 对 回 归 系 数 的 原 假 设 ( 例 如 β3 = 0 ) 的 检 验 中 , 使 用 了 t 比 率

t = βˆ3 Var ( βˆ3 ) ,在高度共线性时,参数估计值的方差增加较快,会使得t值变小,而使

本应否定的“系数为0”的原假设被错误的接受。

2
(4)当多重共线性严重时,可能造成可决系数 R 较高,经F检验的参数联合显著性也

很高,但对各个参数单独的 t 检验却可能不显著,甚至可能使估计的回归系数符号相反,

得出完全错误的结论。

出现这种情况,很可能正是存在严重多重共线性的表现。例如,在本章开始的“引子”

里提出的“工业增加值增长会减少财政收入吗?”的例子中,财政收入与国内生产总值就表

现出异常关系(变量的样本数据见练习题4.8)。

7
综上所述,严重的多重共线性常常会导致下列情形出现:使得用普通最小二乘得到的

回归参数估计值很不稳定,回归系数的方差与协方差随着多重共线性强度的增加而加速增

长,对参数难以给出精确的估计;造成回归方程高度显著的情况下,有些回归系数通不过显

著性检验;甚至可能出现回归系数的正负号得不到合理的经济解释。但是应注意,如果研究

目的仅在于预测Y,而各个解释变量X之间的多重共线性关系的性质在未来将继续保持,这

时虽然无法精确估计个别的回归系数,但可估计这些系数的某些线性组合,因此多重共线性

可能并不是严重问题。

第三节 多重共线性的检验
如何检验回归模型中变量之间存在多重共线性呢?下面介绍几种常用的多重共线性的

检验方法。

一、简单相关系数检验法
简单相关系数检验法是利用解释变量之间的线性相关程度去判断是否存在严重多重共

线性的一种简便方法。一般而言,如果每两个解释变量的简单相关系数(零阶相关系数)比较

高,例如大于0.8,则可认为存在着较严重的多重共线性。但要注意,较高的简单相关系数

只是多重共线性存在的充分条件,而不是必要条件。特别是在多于两个解释变量的回归模型

中,有时较低的简单相关系数也可能存在多重共线性。因此并不能简单地依据相关系数进行

多重共线性的准确判断。

二、方差扩大(膨胀)因子法
对于多元线性回归模型来说,如果分别以每个解释变量为被解释变量,作与其他解释

变量的回归,这称为辅助回归。以 X j 为被解释变量作对其他解释变量辅助线性回归的可决

系数,用 R j 表示,则可以证明,解释变量 X j 参数估计值 βˆ j 的方差可表示为 ①


2

σ2 1 σ2
Var ( βˆ j ) = ⋅ = ⋅ VIF j (4.20)
∑ x 2j 1 − R 2j ∑ x 2j
其中的 VIFj 是变量 X j 的方差扩大因子(Variance Inflation Factor),即


证明过程从略。
8
1
VIF j = (4.21)
1 − R 2j

2
注意这里的 VIFj 是多个解释变量辅助回归确定多重可决系数 R j 的基础上计算的方差扩大

因子,是式(4.17)只有两个解释变量情况的拓展。

2
由于 R j 度量了 X j 与其他解释变量的线性相关程度,这种相关程度越强,说明变量间

多重共线性越严重,VIF j 也就越大。反之, X j 与其他解释变量的线性相关程度越弱,说明

变量间的多重共线性越弱, VIF j 也就越接近于1。由此可见,VIF j 的大小反映了解释变量

之间是否存在多重共线性,可用它来度量多重共线性的严重程度。经验表明,VIF j ≥10时,

说明解释变量与其余解释变量之间有严重的多重共线性,且这种多重共线性可能会过度地影

响最小二乘估计。

在Eviews中,当解释变量之间存在完全或高度共线性时,将不能给出回归模型的参数

估计结果,在其“Equation Specification”窗口中会显示错误提示的信息“nearly singular

matrix”。在Eviews中,也可以直接计算解释变量的方差扩大因子,在“Equation”回归结果

中点“View/Coefficient Diagnostics/Variance Inflation Factors”即可,其中以“Centered VIF”

为最终的VIF结果。

三、直观判断法
根据经验,通常以下情况的出现可能提示存在多重共线性的影响:

(1)当增加或剔除一个解释变量,或者改变一个观测值时,回归参数的估计值发生较

大变化,回归方程可能存在严重的多重共线性。

(2)从定性分析认为,一些重要的解释变量的回归系数的标准误差较大,在回归方程

中没有通过显著性检验时,可初步判断可能存在严重的多重共线性。

(3)有些解释变量的回归系数所带正负号与定性分析结果违背时,很可能存在多重共

线性。

(4)模型的可决系数较高,F检验显著,但某些重要解释变量的偏回归系数t检验不显

著,可能会存在多重共线性问题。

四、逐步回归检测法
逐步回归的基本思想是将变量逐个的引入模型,每引入一个解释变量后,都要进行F

检验,并对已经选入的解释变量逐个进行t检验,当原来引入的解释变量由于后面解释变量

9
的引入而变得不再显著时,则将其剔除。以确保每次引入新的变量之前回归方程中只包含显

著的变量。这是一个反复的过程,直到既没有显著的解释变量选入回归方程,也没有不显著

的解释变量从回归方程中剔除为止。以保证最后所得到的解释变量集是最优的。

在逐步回归中,如果解释变量之间是高度相关的,则先前引入的解释变量可能会因为

后来引入与之相关的解释变量而被剔除。逐步回归用这种有进有出的结果说明解释变量之间

是否具有较高的相关性。如果解释变量之间是完全不相关的,那么引入的解释变量就不会再

被剔除,而剔除的解释变量也就不会再被引入。解释变量之间具有怎样程度的相关性才会被

剔除呢?则取决于研究目的与要求。当出现多个解释变量之间高度相关的时候,逐步回归方

法也是一种检测多重共线性的方法。

第四节 多重共线性的补救措施

诊断出多重共线性,还需要采取措施进行补救,以便尽量降低回归模型中存在的多重

共线性。这里我们介绍常用的几种降低多重共线性的方法。

一、修正多重共线性的经验方法
1. 剔除变量法

这是最简单的一种方法。当回归方程中存在严重的多重共线性,可以删除引起多重共

线性的不重要的变量。一般而言,在选择回归模型时,可以将回归系数的显著性检验、方差

扩大因子VIF的多重共线性检验与解释变量经济含义(通过经济分析确定变量的相对重要性)

结合起来考虑。不过,采用该方法时千万要注意,如果剔除的变量是重要变量,又可能引起

模型的设定误差。

2. 增大样本容量

由于多重共线性是一个样本特性,所以可能在同样变量的另一样本中共线性又没有那

样严重。这时,可以通过增大样本容量(如果可能)来减轻共线性的问题。建立一个实际经

济问题的回归模型,如果所收集的样本数据太少,是容易产生多重共线性的,从前面(4.18)

和(4.19)式可知,如果样本容量增加, ∑x 2
ji 也会增加,会减小所估计的回归系数的方差,

标准误差也同样会减小。因此,尽可能地收集足够多的样本数据可以改进模型参数的估计。

3. 变换模型形式

将原设定的模型形式作适当的变换,有可能消除或减弱原模型中解释变量之间的相关

关系。例如,可采用差分法,这是指将原模型变形为差分模型形式进而减低多重共线性的一

10
个方法。

将原模型

Yi = β 0 + β1 X 1i + β 2 X 2i + β3 X 3i + L + β k X ki + ui (4.22)

变形为

∆Yi= β1∆X 1i + β 2 ∆X 2i + L + β k ∆X ki + ∆ui (4.23)

一般而言,差分后变量之间的相关性要比差分前弱得多,所以差分后的模型通常可以

有效地降低出现共线性的可能性,此时可直接估计差分方程。在EViews中运用差分法时,

可以在方程定义栏中输入: Y − Y ( −1) X 1 − X 1( −1) X 2 − X 2 ( −1) L Xk − Xk ( −1) ,

从而得到 β1,β 2,β 3 , L β k 的估计值。

因为差分常常会丢失一些信息,差分模型的误差项可能序列相关,可能会违背经典线

性回归模型的相关假设,在具体运用时要慎重。

4. 利用非样本先验信息

如果通过经济理论分析能够得到某些参数之间的线性关系,可以将这种线性关系作为

约束条件,将此约束条件和样本信息结合起来进行约束最小二乘估计。

例如,考虑以下模型

Yi = β 1 + β 2 X 2i + β 3 X 3i + u i (4.24)

如果依据长期的经验分析可以认为 β 3 = 0.2 β 2 ,这样,我们就可以化简为下列模型

Yi = β1 + β 2 X 2i + β 3 X 3i + ui = β1+β 2 X i + ui (4.25)

其中, X i = X 2i + 0.2 X 3i 。如果估计出 β̂ 2 ,则也估计出了 β̂ 3 。

5. 横截面数据与时序数据并用

这是先验信息法的一个变种,将横截面数据与时间序列数据组合,称为数据并用

(pooling the data)。其基本做法是:首先利用横截面数据估计出部分参数,再利用时序数据

估计出另外的部分参数,最后得到整个方程参数的估计。

假设我们要研究中国家用轿车需求,并收集到了关于家用轿车的销售数据( Yt )、平均

价格( Pt )和消费者收入( I t )的时间序列数据。依据研究目的,设定的模型为

ln Yt = β 1 + β 2 ln Pt + β 3 ln I t + u t (4.26)

11
目的是要估计价格弹性 β 2 和收入弹性 β 3 。

在时间序列分析中,价格和收入变量一般都有高度共线性的趋势。托宾提出了解决此

问题的一种方法。即如果拥有关于消费者定点追踪的横截面数据,如城镇或农村居民住户调

查数据,就可能可靠地估计收入弹性 β 3 。令收入弹性的横截面估计为 β̂ 3 ,就可以将前述时


*

间序列回归写成

Yt * = β 1 + β 2 ln Pt + u t (4.27)

其中, Yt = ln Y − βˆ3 ln I t 。
* *

这样就可以得到价格弹性的估计值。值得注意的是这里包含着假设:收入弹性的横截

面估计和从纯粹时间序列分析中得到的估计是一样的。当横截面估计在不同截面之间没有大

的变化时这是一个值得考虑的方法。

6. 变量变换

有时通过对模型中变量进行变换能够实现降低共线性的目的。例如,常用的变量变换

方式有:

1)计算相对指标。如原来的是总量指标,可计算人均指标或结构相对数(比重)指标等。

经过这样处理的数据有时可以降低共线性。

2)将名义数据转换为实际数据。将名义数据剔除价格影响后反映的信息在统计上常常

是指纯物量的变化,不包含价格变动的影响,有助于描述现象之间真实的数量变化关系。因

此在多数经济分析中采用“实际”数据而不是名义数据,有时名义数据转换为实际数据后可

降低多重共线性。

3)将小类指标合并成大类指标。例如如果将工业增加值、建筑业增加值同时引入模型,

会因这两者之间高度相关而出现严重多重共线性,可将其合并成第二产业增加值。

4)将总量指标进行对数变换。总量指标经过对数变换后,可将原来建立的线性回归模

型转换为双对数模型,分析各解释变量的增减率对被解释变量增减率的影响。

需要指出,变量变换只是一种降低多重共线性的方法,有时可能得到较好的结果,有

时也可能得不到较好的结果。

二、逐步回归法
依据前述逐步回归的思想,可通过逐步回归筛选并剔除引起多重共线性的变量。其具

体步骤如下:先用被解释变量对每一个所考虑的解释变量做简单回归,然后以对被解释变量

12
贡献最大的解释变量所对应的回归方程为基础,再逐个引入其余的解释变量。这个过程会出

2
现3种情形。①若新变量的引入改进了 R 和 F 检验,且其他回归参数的 t 检验在统计上仍

2
是显著的,则可考虑在模型中保留该变量。②若新变量的引入未能明显改进 R 和 F 检验,

且对其他回归参数估计值的 t 检验也未带来什么影响,则认为该变量是多余的。③若新变

2
量的引入未能明显改进 R 和 F 检验,且显著地影响了其他回归参数估计值的数值或符号,

致使某些回归参数也通不过 t 检验,则说明出现了严重的多重共线性。经过对各个引入新

2
变量模型多方面的综合比较,保留 R 改进最大,且不影响原有变量显著性的模型。经逐步

回归,使得最后保留在模型中的解释变量既是重要的,又没有严重的多重共线性。

逐步回归法的好处是将统计上不显著的解释变量剔除,最后保留在模型中的解释变量

之间多重共线性不明显,而且对被解释变量有较好的解释贡献。但是应特别注意,逐步回归

法可能因为删除了重要的相关变量而导致设定误差 ①。

三、岭回归法简介 ②

为了降低多重共线性对回归模型的影响,计量经济学家们还致力于改进古典最小二乘

法,提出以采用有偏的估计为代价来提高估计量的稳定性的方法,如岭回归法、主成分法、

偏最小二乘法等。下面简要介绍岭回归法的思想和方法。

1. 岭回归的含义

岭回归(Ridge Regression)是由A.E.Hoerl(霍尔)在1962年提出的一种改进最小二乘估

计的方法,也叫岭估计(Ridge Estimate)。

当 解 释 变 量 之 间 存 在 多 重 共 线 性 , 即 X ′X ≈ 0 时 , 则

E[( βˆ − β )( βˆ − β )′] = σ 2 ( X ′X ) 会增大,原因在于 X ′X 接近奇异。如果将 X ′X 加上一个


−1

正常数对角矩阵kI(k>0,I为单位矩阵),即 X ′X + kI ,使得 X ′X + kI ≈ 0 的可能性比

X ′X ≈ 0 的可能性更小,那么 X ′X + kI 接近奇异的程度就会比 X ′X 小得多。

这样可以得到 β 的岭回归估计为:


在第九章将讨论模型遗漏重要解释变量设定误差的后果。

这部分内容供本科教学选择使用。
13
βˆ=
(k ) ( X′X + kI )
−1
X ′Y (4.28)

其中,βˆ ( k ) 称为 β 的岭回归估计量, k 为岭回归参数。当解释变量之间存在多重共线

性时,以 βˆ ( k ) 作为 β 的估计应比最小二乘估计稳定,当 k 较小时,回归系数很不稳定,而

当 k 逐渐增大时,回归系数可能呈现稳定状态,因此,要选择合适的 k 值时,岭回归参数才

会优于普通最小二乘估计参数。当 k =0时, βˆ ( k ) = β̂ ,实际就是普通最小二乘估计。

2. 岭回归估计的性质

性质1 岭回归的参数估计是回归参数的有偏估计。

βˆ ( k )] E ( X ′X + kI ) X ′Y
−1
E[=
( X′X + kI ) X′E ( Y )
−1
= (4.29)

( X′X + kI ) X′Xβ
−1
=

( )
显然,只有当 k =0时,才有 E βˆ ( 0 ) = β ,当k≠0时, β̂ (k ) 是 β 的有偏估计。有偏性

是岭回归估计的一个重要性质。

性质2 在岭参数 k 与 Y 无关的情形下, βˆ ( k ) 是最小二乘估计的一个线性变换,也是

理论值 Y 的线性函数。

性质3 可以证明岭估计量 βˆ ( k ) 方差比普通最小二乘估计 β̂ 的方差要小。

岭回归估计得方差和偏倚与岭回归参数 k 有关,岭回归参数 k 的值越大,βˆ ( k ) 的偏倚

越大,其方差就越小。要得到方差较小的估计结果,就不得不牺牲无偏性。为此可以用兼顾

方差和偏倚的最小均方误MSE原则 ①,去分析岭回归的效果。

3. 岭参数 k 的选择

原则上是要选择使MSE( βˆ ( k ) )达到最小的 k ,而最优 k 值依赖于未知参数 β 和 σ ,


2

因而在实际应用中必须通过样本来确定。目前还没有形成一个公认的最优方法。但常用的方

法主要有:岭迹法、方差扩大因子法、残差平方和方法。在实际应用中,可考虑使用逐步搜

索的方法,即开始给定较小的 k 值,然后逐渐增加 k 的取值进行试验,直至岭估计量 βˆ ( k ) 的


见第九章式(9.16)。
14
值趋于稳定为止。

显然,用逐步搜索的方法确定的k值,仍缺乏令人信服的理论依据,具有一定的主观性,

是一种将定性分析与定量分析相结合的方法。

与岭回归相似的方法还有Lasso回归、适应性Lasso回归;多元统计技术中的因子分析、

主成分分析及偏最小二乘回归也常用于“解决”多重共线性问题,读者可参阅相关文献。

第五节 案例分析

一、研究的目的要求
近年来,中国旅游业一直保持高速发展,旅游业作为国民经济新的增长点,在整个社

会经济发展中的作用日益显现。中国的旅游业分为国内旅游和入境旅游两大市场,入境旅游

外汇收入年均增长22.6%,与此同时国内旅游也迅速增长。改革开放30多年来,特别是进入

90年代后,中国的国内旅游收入年均增长14.4%,远高于同期GDP 9.76%的增长率。为了规

划中国未来旅游产业的发展,需要定量地分析影响中国旅游市场发展的主要因素。

二、模型设定及其估计
经分析,影响国内旅游市场收入的主要因素,除了国内旅游人数和旅游支出以外,还可

能与相关基础设施有关。为此,考虑的影响因素主要有国内旅游人数 X 2 ,城镇居民人均旅

游支出 X 3 ,农村居民人均旅游支出 X 4 ,并以铁路里程 X 5 作为相关基础设施的代表。各

影响变量与国内旅游收入之间呈现正相关。为此设定了如下形式的计量经济模型:

Yt = β1 + β 2 X 2t + β 3 X 3t + β 4 X 4t + β 5 X 5t + µ t (4.30)

其中 :Yt 为第t年全国国内旅游收入(亿元); X 2 为国内旅游人数(万人/次); X 3 为城

镇居民人均旅游支出(元); X 4 为农村居民人均旅游支出(元); X 5 为铁路里程(万公里)。

各解释变量前的回归系数预期都大于零。

为估计模型参数,收集旅游事业发展所处的1994—2016年阶段的统计数据,如表4.2所

示:

表4.2 1994年—2016年中国旅游收入及相关数据
国内旅游总花 国内游客 城镇居民人均旅 农村居民人均旅 铁 路 里 程
年份 费(亿元)Y (百万人 游花费(元)X3 游花费(元)X4 (万公里)
次)X2 X5
1994 1023.5 524 414.7 54.9 5.90
1995 1375.7 629 464.0 61.5 5.97
1996 1638.4 639 534.1 70.5 6.49

15
1997 2112.7 644 599.8 145.7 6.60
1998 2391.2 695 607.0 197.0 6.64
1999 2831.9 719 614.8 249.5 6.74
2000 3175.5 744 678.6 226.6 6.87
2001 3522.4 784 708.3 212.7 7.01
2002 3878.4 878 739.7 209.1 7.19
2003 3442.3 870 684.9 200.0 7.30
2004 4710.7 1102 731.8 210.2 7.44
2005 5285.9 1212 737.1 227.6 7.54
2006 6229.74 1394 766.4 221.9 7.71
2007 7770.62 1610 906.9 222.5 7.80
2008 8749.3 1712 849.4 275.3 8.00
2009 10183.7 1902 801.1 295.3 8.60
2010 12579.8 2103 883.0 306.0 9.10
2011 19305.4 2641 877.8 471.4 9.30
2012 22706.2 2957 914.5 491.0 9.76
2013 26276.1 3262 946.6 518.9 10.31
2014 30311.9 3611 975.4 540.2 11.18
2015 34195.1 4000 985.5 554.2 12.10
2016 39390.0 4440 1009.1 576.4 12.40
数据来源:国家统计局,《中国统计年鉴》2008-2017。

利用Eviews软件,生成 Yt 、 X 2 、 X 3 、 X 4 、 X 5 等数据,采用OLS方法估计模型参数,

得到的回归结果如图4.2所示。

图4.2 OLS回归结果

2 2
=
该 模型 R 0.9938,
= R 0.9924 , 可 决 系 数 很 高 , F 检 验 值 716.48 , 明 显 显 著 。 当

α 0.05时tα /2 (n −=
= k ) t0.025 (23 −=
5) 2.101 ,各个解释变量系数的t检验均显著,但是从经济

意义上看,X3参数估计值的符号与预期相反,表明城镇居民人均旅游花费越多,国内旅游总花

费将会越少,这显然是不合理的。这表明模型很可能存在严重的多重共线性。

为证实是否存在多重共线性,计算各解释变量相互之间的相关系数,在EVews中选择 X 2 、

X 3 、 X 4 、 X 5 数据,点“view/covariance Analysis”,在对话框中选“correlation”/ok,即得相

16
关系数矩阵(图4.3)。

图 4.3 相关系数矩阵

由相关系数矩阵可以看出,各解释变量相互之间的相关系数较高,证实确实存在一定的
多重共线性。

为了进一步了解多重共线性的性质,做辅助回归,即将每个X变量分别作为被解释变量

都对其余的X变量进行回归,计算可决系数和方差扩大因子。在Eviews中,也可以直接计算

解释变量的方差扩大因子,在“Equation”回归结果中点“View/Coefficient Diagnostics/Variance

Inflation Factors”即可,其中以“Centered VIF”即为方差扩大因子VIF,见图4.4。

图 4.4 方差扩大因子

经验表明,如果方差扩大因子 VIFj ≥ 10 时,通常说明该解释变量与其余解释变量之间

有严重的多重共线性,这里 X2、X4、X5 的方差扩大因子远大于 10,表明存在严重多重共线

性问题。

三、对多重共线性的处理
为避免删除重要解释变量引起设定误差,不随意删除解释变量。考虑将各变量进行对数
变换,再对以下模型进行估计。

ln Yt = β1 + β 2 ln X 2t + β 3 ln X 3t + β 4 ln X 4t + β 5 ln X 5t + ε t (4.31)

利用Eviews软件,将生成的 Yt 、 X 2 、 X 3 、 X 4 、 X 5 等数据取自然对数后,采用OLS

方法估计模型参数,得到的回归结果如图4.5所示。

17
图4.5 对数模型的OLS回归结果

2
该模型 R
= 0.9988,
= R 2 0.9986 ,可决系数很高,F检验值3886.263,明显显著。当

α 0.05时tα /2 (n −=
= k ) t0.025 (23 −=
5) 2.101 ,所有系数估计值的t检验都高度显著。所有

解释变量的符号都与先验预期相一致,即旅游人数、城乡居民旅游支出和铁路里程都与国内

旅游收入正相关。本案例的分析表明,在其他变量保持不变的情况下,如果国内游客人次每

增加1%,则国内旅游总花费平均会增加1.0323%;如果城镇居民旅游花费每增加1%,则国

内旅游总花费平均会增加0.3897%;如果农村居民旅游花费每增加1%,则国内旅游总花费平

均会增加0.3282%;如果铁路里程每加1%,则国内旅游总花费平均会增加0.4697%。

在这个案例中,经过数据变换后,尽管解释变量之间高度相关,但相关的统计检验指

标,如回归方程检验的F统计量、各回归系数的 t 统计量都高度显著,且所有系数都具有正

确的符号,这表明所有这些变量一起对国内旅游收入具有显著的影响。

本章小节
1. 经典线性回归模型的假定之一是各个解释变量X之间不存在多重共线性。一般说来,

多重共线性是指各个解释变量X之间有准确或近似准确的线性关系。

2. 多重共线性的后果是:如果各个解释变量X之间有完全的共线性,则它们的回归系

数是不确定的,并且它们的方差会无穷大。如果共线性是高度的但不完全的,则回归系数的

估计是可能的,但有较大的标准误差的趋势。结果回归系数不能准确地加以估计。不过,如

果目的是估计这些系数的线性组合用于预测,多重共线性不是严重问题。
2
3. 诊断共线性的经验方法主要有:(1)多重共线性的明显表现是可决系数R 异常高而

回归系数在通常的t检验中在统计上不显著。(2)在仅有两个解释变量的模型中,检查两个变

18
量之间的零阶或简单相关系数,一般说来高的相关系数通常可认为有多重共线性。(3)当模
2
型中涉及多于两个解释变量的情形时,较低的零阶相关也可能出现多重共线性。(4)如果R

高而偏相关系数低,则多重共线性是可能的,这时会存在一个或多个解释变量是多余的。如
2
果R 高而偏相关系数也高,则多重共线性难以识别。(5)在建模时,首先可以将每一个解释

2 2
变量 X i 对其余所有解释变量进行辅助回归,并计算出相应的可决系数 Ri 。较高的 Ri 可能

表明 X i 和其余的解释变量高度相关,在不会引起严重的设定偏误的前提下,可考虑把 X i 从

模型中剔除。

4. 降低多重共线性的经验方法有:(1)利用外部或先验信息;(2)横截面与时间序列数

据并用;(3)剔除高度共线性的变量;(4)数据转换;(5)获取补充数据或新数据;(6)选择有

偏估计量。经验方法的效果取决于数据的性质和共线性的严重程度。

5. 主要公式见表4.3。

表4.3 主要公式表

名称 公式

方差—膨胀因子(简称VIF) 1
VIF =
1 − r232

多重共线性下参数估计式的方差 σ2
( βˆ2 )
Var= ⋅ VIF
∑x 2
2i

ˆ σ2 1 σ2
Var ( β j ) = ⋅ = ⋅ VIF j
∑ x 2j 1 − R 2j ∑ x 2j
β 的岭回归估计 β̂ (k ) = ( X ′X + kI )−1 X ′Y

思考题
4.1 多重共线性的实质是什么?为什么会出现多重共线性?

4.2 多重共线性对回归参数的估计有何影响?

4.3 多重共线性的典型表现是什么?判断是否存在多重共线性的方法有哪些?

4.4 针对出现多重共线性的不同情形,能采取的补救措施有哪些?

4.5 在涉及相关的宏观经济总量指标如GDP、货币供应量、物价总水平、国民总收入、

就业人数等时间序列的数据中一般都会怀疑有多重共线性,为什么?

19
4.6 多重共线性的产生与样本容量的个数n、解释变量的个数 k 有无关系?

4.7 具有严重多重共线性的回归方程能否用来进行预测?

4.8 岭回归法的基本思想是什么,它对降低共线性有何作用?

4.9 以下陈述是否正确?请判断并说明理由

(1)在高度多重共线性的情形中,要评价一个或多个偏回归系数的单个显著性是不可能

的。

(2)尽管有完全的多重共线性,OLS估计量仍然是BLUE。

2
(3)如果有某一辅助回归显示出高的 R j 值,则高度共线性的存在是肯定无疑的。

(4)变量的两两高度相关并不表示高度多重共线性。

(5)如果其他条件不变,VIF越高,OLS估计量的方差越大。

(6)如果在多元回归中,根据通常的t检验,全部偏回归系数分别都是统计上不显著的,

2
你就不会得到一个高的 R 值。

(7)在Y对 X 2 和 X 3 的回归中,假如 X 3 的值很少变化,这就会使 Var ( βˆ3 ) 增大,在极

端的情形下,如果全部 X 3 值都相同, Var ( βˆ3 ) 将是无穷大。

(8)如果分析的目的仅仅是预测,则多重共线性是无害的。

练习题

4.1 假设在模型 Yi = β 1 + β 2 X 2i + β 3 X 3i + u i 中, X 2 与X 3 之间的相关系数为零,有


人建议你分别进行如下回归:

α1 α 2 X 2i + u1i
Yi =+

γ 1 γ 3 X 3i + u2i
Yi =+

(1) 是否存在 αˆ 2 = βˆ 2 且γˆ 3 = βˆ 3 ?为什么?

(2) βˆ1 会等于 α̂1 或 γˆ1 或者两者的某个线性组合吗?

( ) ( )
(3) 是否有 Var βˆ2 = Var (αˆ 2 ) 且 Var βˆ3 = Var (γˆ3 ) ?

4.2 表4.4给出了1995—2016年中国商品进口额Y、国内生产总值GDP、居民消费价格
指数CPI的数据。
表4.4 中国商品进口额、国内生产总值、居民消费价格指数

20
年 份 商品进口额 国内生产总值 居民消费价格指数
(亿元)Y (亿元)GDP (1978=100)CPI
1995 11048.1 61339.9 396.9
1996 11557.4 71813.6 429.9
1997 11806.5 79715.0 441.9
1998 11626.1 85195.5 438.4
1999 13736.4 90564.4 432.2
2000 18638.8 100280.1 434.0
2001 20159.2 110863.1 437.0
2002 24430.3 121717.4 433.5
2003 34195.6 137422.0 438.7
2004 46435.8 161840.2 455.8
2005 54273.7 187318.9 464.0
2006 63376.9 219438.5 471.0
2007 73284.6 270232.3 493.6
2008 79526.5 319515.5 522.7
2009 68618.4 349081.4 519.0
2010 94699.3 413030.3 536.1
2011 113161.4 489300.6 565.0
2012 114801.0 540367.4 579.7
2013 121037.5 595244.4 594.8
2014 120358.0 643 974.0 606.7
2015 104336.1 689 052.1 615.2
2016 104967.2 744 127.2 627.5

资料来源:《中国统计年鉴 2017》

考虑建立模型: ln Yt = β1+β 2 ln GDPt + β 3 ln CPI t + ui


(1)利用表中数据估计此模型的参数。
(2)你认为数据中有多重共线性吗?

=
(3)进行以下回归: ln Yt A1+A2 ln GDPt + v1i

=ln Yt B1+B2 ln CPI t + v2i

ln GDPt =
C1 + C2 ln CPI t + v3i
根据这些回归你能对多重共线性的性质有什么认识?

(4)假设经检验数据有多重共线性,但模型中 βˆ 2 和βˆ 3 在5%水平上显著,并且F检验也显

著,你对此模型的应用有何建议?
4.3 在本章开始的“引子”提出的“工业增加值增长会减少财政收入吗?”的例子中,
如果所采用的数据如表4.5所示,试分析:为什么会出现本章开始时所得出的异常结果?你
怎样解决所出现的问题?

表4.5 2000-2016年财政收入及其影响因素数据 ( 单位:亿元)


一般公共预算收入 国内生产总值 税收总额 工业增加值
年 份 CZSR GDP SSZE GYZJZ
2000 13395.23 100280.1 12581.51 40259.7
2001 16386.04 110863.1 15301.38 43855.6
2002 18903.64 121717.4 17636.45 47776.6

21
2003 21715.25 137422.0 20017.31 55363.8
2004 26396.47 161840.2 24165.68 65776.8
2005 31649.29 187318.9 28778.54 77960.5
2006 38760.20 219438.5 34804.35 92238.4
2007 51321.78 270232.3 45621.97 111693.9
2008 61330.35 319515.5 54223.79 131727.6
2009 68518.30 349081.4 59521.59 138095.5
2010 83101.51 413030.3 73210.79 165126.4
2011 103874.43 489300.6 89738.39 195142.8
2012 117253.00 540367.4 100614.28 208905.6
2013 129209.64 595244.4 110530.70 222337.6
2014 140370.03 643974.0 119175.31 233856.4
2015 152269.23 689052.1 124922.20 236506.3
2016 159604.97 744127.2 130360.73 247860.1
资料来源:《中国统计年鉴2017》

4.4 表4.6是中国家电零售总额及国内生产总值、人均可支配收入、家电广告投放总额、

居民消费价格指数等数据。

表4.6 1997年—2015年中国家电零售总额及相关数据
家 电 零 售 总 GDP X 2(亿 人均可支配收 家电广告投放 居民消费价格指数
年份 额 Yt (亿元) 元) 入 X 3 (元) 总额 X4 (亿 X 5 (以1996年为
元) 100)
1997 506.0 78802.9 5160.3 64.71 102.8
1998 651.7 83817.6 5425.1 79.02 102.0
1999 724.3 89366.5 5854.0 67.14 100.5
2000 831.6 99066.1 6280.0 73.51 101.0
2001 784.7 109276.2 6859.6 65.88 101.7
2002 953.0 120480.4 7702.8 78.74 100.8
2003 1127.2 136576.3 8472.2 88.00 102.1
2004 1415.7 161415.4 9421.6 76.51 106.0
2005 1636.0 185998.9 10493.0 77.4 107.9
2006 1921.7 219028.5 11759.5 88.61 109.6
2007 2370.7 270844 13785.8 94.40 114.8
2008 2706.6 321500.5 15780.8 87.92 121.6
2009 3154.4 348498.5 17174.7 98.67 120.7
2010 4056.5 411265.2 19109.4 119.43 124.7
2011 5374.9 484753.2 21809.8 140.34 131.5
2012 5935.8 539116.5 24564.7 205.09 134.9
2013 6944.5 590422.4 26955.1 229.73 138.4
2014 7603.3 644791.1 29381.0 246.83 141.2
2015 8269.5 682635.1 31790.3 277.19 143.1
数据来源:国家统计局(www.stats.gov.cn)。

Yt
(1)如果请考虑建立模型:= β1+β 2 X 2t + β3 X 3t + β 4 X 4t +β5 X 5t + ui ,利用表中数据

估计此模型的参数。
(2)根据经济学知识和实践经验,你认为参数估计结果合理吗?
(3)分别采用简单相关系数检验法和方差扩大因子法验证模型是否存在多重共线性。

22
(4)如果存在多重共线性,如何才能解决?
4.5 表4.7中给出了四川省城镇人均消费支出Y和其相关影响因素城镇居民人均可支配
收入X2、地区生产总值X3、零售商品价格指数X4以及人口自然增长率X5的数据。
表4.7 2000-2015城镇居民人均消费支出及其影响因素数据

城镇人均 城镇居民人均 地区生产总 零售商品 人口自然增长


消费支出(元) 可支配收入 值(亿元) 价格指数(%) 率(‰)
Y (元)X2 X3 X4 X5
2000 5315 6360.5 3928.2 97.7 5.1
2001 5661 5894.3 4293.49 100.8 4.37
2002 5932 6610.8 4725.01 99.4 3.89
2003 6312 7041.9 5333.09 100.1 3.12
2004 6970 7709.9 6379.63 103.7 2.78
2005 7577 8386 7385.1 100.6 2.9
2006 8305 9350.1 8690.24 101.7 2.86
2007 9559 11098.3 10562.39 105.3 2.92
2008 10608 12633.4 12601.23 105.3 2.39
2009 11701 13839.4 14151.28 100.1 2.72
2010 13457 15461.2 17185.48 103 2.31
2011 15687 17899.1 21026.68 104.6 2.98
2012 16649 20307 23872.8 101.6 2.97
2013 17899 22368 26392.07 101.7 3
2014 19318 24234 28536.66 100.6 3.2
2015 20114 26205 30053.1 100.2 3.36
(数据来源:四川统计局,国家统计局网页)
(1)利用以上数据建立回归模型,根据回归结果判断是否存在严重的多重共线性。
(2)若对所建立的模型中部分变量作对数变换(某些变量不需要进行对数变换),并对
变换后的模型进行估计,根据回归结果判断是否还存在严重的多重共线性。
(3)若是还存在严重的多重共线性,选择更适合的模型进行修正,并对修正后的结果
从经济意义上进行解读。

4.6 检验你在练习题3.7中所建立的多元线性回归模型是否存在多重共线性。如果存在

多重共线性,你能设法消除或减轻多重共线性的影响吗?

23
第五章 异方差性

引子:

更为接近真实的结论是什么?
改革开放以来,各地区的医疗机构都有了较快发展,不仅政府建立了一批医疗机构,还

建立了不少民营医疗机构。各地医疗机构的发展状况,除了其他因素外主要决定于对医疗服

务的需求量,而医疗服务需求与人口数量有关。为了给制定医疗机构的规划提供依据,分析

比较医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。根据四川省 2000

年 21 个地市州医疗机构数与人口数资料对模型估计的结果如下:

Yˆi = −563.0548 + 5.3735 X i

(291.5778) (0.644284)

t =(-1.931062) (8.340265)

R 2 = 0.785456 , R 2 = 0.774146 , F = 69.56003

式中 Y 表示卫生医疗机构数(个), X 表示人口数量(万人)。从回归模型估计的结果看,人

口数量对应参数的标准误差较小, t 统计量远大于临界值,说明人口数量对医疗机构确有显

著影响,可决系数和修正的可决系数还可以,F 检验结果也明显显著。表明该模型的估计效

果还不错,可以认为人口数量每增加 1 万人,平均说来医疗机构将增加 5.3735 个。

然而,根据四川省 2000 年不同地区的人口数量和分布的医疗机构数看,这里得出的结论

可能是不可靠的,平均说来每增加 1 万人口可能并不需要增加这样多的医疗机构,所得结论

并不符合真实情况。那末,有什么充分的理由说明这一回归结果不可靠呢?更为接近真实的

结论又是什么呢?

在现实经济活动中,最小二乘法的基本假定并非都能满足,上一章介绍的多重共线性只

是其中一个方面,本章将讨论违背基本假定的另一个方面——异方差性。虽然它们都是违背

了基本假定,但前者属于解释变量之间存在的问题,后者是随机误差项出现的问题。本章将

讨论异方差性的实质、异方差出现的原因、异方差的后果,并介绍检验和修正异方差的若干

方法。

第一节 异方差性的概念
1
一、异方差性的实质
第二章提出的基本假定中,要求对所有的 i(i=1,2,…,n)都有

Var (ui ) = σ 2 (5.1)

也就是说 u i 具有同方差性。这里的方差 σ 2 度量的是随机扰动项围绕其均值的分散程度。由

于 E (ui ) = 0 ,所以等价地说,方差 σ 2 度量的是被解释变量 Y 的观测值围绕回归线 E (Yi ) =

β1 + β 2 X 2i + L + β k X ki 的分散程度,同方差性实际指的是相对于回归线被解释变量所有观

测值的分散程度相同。

设模型为

Yi = β1 + β 2 X 2i + L + β k X ki + ui i = 1,2, L , n (5.2)

如果其它假定均不变,但模型中随机误差项 ui 的方差为

Var (ui ) = σ i2 (i = 1, 2,3,L , n). (5.3)

则称 ui 具有异方差性(Heteroscedasticity)。

由于异方差性指的是被解释变量观测值的分散程度是随解释变量的变化而变化的,如图

5.1 所示,所以进一步可以把异方差看成是由于某个解释变量的变化而引起的,则

Var (u=
i) σ=
i
2
σ 2 f (Xi ) (5.4)

密度函数

图 5.1 异方差图形

二、产生异方差的原因
由于现实经济活动的错综复杂性,一些经济现象的变动与同方差性的假定经常是相悖的。

所以在计量经济分析中,往往会出现某些因素随其观测值的变化而对被解释变量产生不同的

影响,导致随机误差项的方差相异。通常产生异方差有以下主要原因。

2
1.模型设定误差

模型的设定主要包括变量的选择和模型数学形式的确定。模型中略去了重要解释变量常

常导致异方差,实际是模型设定问题。异方差性表现在随机误差上,但它的产生却与解释变

量的变化有紧密的关系。如果计量模型本来应当为 Yi = β 1 + β 2 X 2i + β 3 X 3i + u i ,假如被略

去了 X 3i ,而采用了

Yi = β1 + β 2 X 2i + u i* (5.5)

当被略去的 X 3i 与 X 2i 有呈同方向或反方向变化的趋势时, X 3i 随 X 2i 的有规律变化会

*
体现在式(5.5)的 u i 中。如果将某些未在模型中出现的重要影响因素归入随机误差项,而

且这些影响因素的变化具有差异性,则会对被解释变量产生不同的影响,从而导致误差项的

方差随之变化,即产生异方差性。在第四章已经讨论过,可以通过剔除变量的方法去避免多

重共线性的影响,但是如果删除了重要的变量又有可能引起异方差性。这是在建模过程中应

当引起注意的问题。除此而外,模型的函数形式不正确,如把变量间本来为非线性的关系设

定为线性,也可能导致异方差。

2.测量误差的变化

样本数据的观测误差有可能随研究范围的扩大而增加,或随时间的推移逐步积累,也可

能随着观测技术的提高而逐步减小。例如生产函数模型,由于生产要素投入的增加与生产规

模相联系,在其他条件不变的情况下,测量误差可能会随生产规模的扩大而增加,随机误差

项的方差会随资本和劳动力投入的增加而变化。另一方面当用时间序列数据估计生产函数时,

由于抽样技术和数据收集处理方法的改进,观测误差有可能会随着时间的推移而降低。

3.截面数据中总体各单位的差异

通常认为,截面数据较时间序列数据更容易产生异方差。例如,运用截面数据研究消费

和收入之间的关系时,如果采取不同家庭收入组的数据,低收入组的家庭用于购买生活必需

品的比例相对较大,消费的分散程度不大,组内各家庭消费的差异也较小。高收入组的家庭

有更多自由支配的收入,家庭消费有更广泛的选择范围,消费的分散程度较大,组内各家庭

消费的差异也较大。这种不同收入组家庭的消费偏离均值程度的差异,最终反映为随机误差

项偏离其均值的程度有变化,而出现异方差。异方差性在截面数据中比在时间序列数据中可

能更常出现,这是因为同一时点不同对象的差异,一般说来会大于同一对象不同时间的差异。

不过,在时间序列数据发生较大变化的情况下,也可能出现比截面数据更严重的异方差。

3
以上只是对产生异方差的经验总结,在建立计量经济学模型的过程中,具体是什么原因

产生异方差,应对变量的经济意义和数据所表现出的特征进行认真地分析。

第二节 异方差性的后果

在计量经济分析中,如果模型里存在异方差,则对模型会产生以下后果。

一、对参数估计式统计特性的影响
1、参数的 OLS 估计仍然具有无偏性

由第二章参数估计的统计特性可知,参数 OLS 估计的无偏性仅依赖于基本假定中随机误

差项的零均值假定(即 E (ui ) = 0 ),以及解释变量的非随机性,异方差的存在并不影响参数

估计式的无偏性。

2、参数 OLS 估计式的方差不再有效

在模型参数的所有线性估计式中,OLS 估计方差最小的重要前提条件之一是随机误差项

为同方差,如果随机误差项是异方差的,将不能再保证最小二乘估计的方差最小。事实上可

以证明,能够找到比 OLS 估计的方差更小的估计方法,本章第四节将会介绍这类估计方法。

也就是说,在异方差存在时,虽然 OLS 估计仍保持线性无偏性和一致性,但已失去了有效性,

即参数的 OLS 估计量不再具有最小方差。

二、对模型假设检验的影响

在 ui 存在异方差时,会严重破坏第二章和第三章提出的 t-检验和 F-检验的有效性。以一

元回归为例,在出现异方差的情况下,参数估计的方差 Var ( βˆ2 ) ≠ σ 2 ∑x 2


i ,若还是用 OLS

方法以 Var ( βˆ2 ) = σ 2 ∑x


2
i 去估计其方差,通常得到 t 统计量不再服从 t 分布,并且使用大

样本也不能解决这个问题。类似地,F 统计量也不再服从 F 分布。因此,一般情况下,只要

存在异方差性,在古典假定下用来检验假设的统计量可能不再成立。

三、对预测的影响
尽管参数的 OLS 估计量仍然无偏,并且基于此的预测也是无偏的,但是由于参数估计量

不是有效的,从而对 Y 的预测也将不是有效的。在 ui 存在异方差时, σ i 与 X i 的变化有关,


2

参数 OLS 估计的方差 Var ( βˆk ) 不能唯一确定,Y 预测区间的建立将发生困难。而且 Var ( βˆk )

会增大,Y 预测值的精确度也将会下降。

4
异方差性的存在,会对回归模型的正确建立和统计推断带来严重后果,因此在计量经济

分析中,有必要检验模型是否存在异方差。

第三节 异方差性的检验

要检验模型中是否有异方差,需要了解随机误差项 ui 的概率分布。由于随机误差很难直

接观测,只能对随机误差的分布特征进行某种推测,因此对异方差性的检验还没有完全可靠

的准则,只能针对产生异方差不同原因的假设,提出一些检验异方差的经验办法。并且,大

多数检验异方差的方法都是基于对 OLS 估计得到的残差 ei 的分析,只有样本容量比较大时,

残差 ei 才可能是随机误差 ui 的良好估计,检验方法的运用也才有实际意义。本节只介绍一些

最常用的方法。

一、图示检验法
1、相关图形分析

方差描述的是随机变量相对其均值的离散程度,而被解释变量 Y 与随机误差项 u 有相同

的方差,所以分析 Y 与 X 的相关图形,可以初略地看到 Y 的离散程度及与 X 之间是否有相

关关系。如果随着 X 的增加,Y 的离散程度有逐渐增大(或减小)的变化趋势,则认为存在

递增型(或递减型)的异方差。通常在建立回归模型时,为了判断模型的函数形式,需要观

测 Y 与 X 的相关图形,同时也可利用相关图形大致判断模型是否存在异方差性。例如,用

1998 年四川省各地市州农村居民家庭消费支出与家庭纯收入的数据 ①,绘制出消费支出对纯

收入的散点图(图 5.2)
,其中用 Y1 表示农村家庭消费支出,X1 表示家庭纯收入。
2,200

2,000

1,800

1,600

1,400
Y1

1,200

1,000

800

600
400 800 1,200 1,600 2,000 2,400 2,800

X1

图 5.2 消费支出对纯收入的散点图


四川统计年鉴 1999,中国统计出版社,1999

5
2、残差图形分析

虽然随机误差项无法观测,但样本回归的残差一定程度上反映了随机误差的某些分布特

征,可通过残差的图形对异方差性作观察。例如,一元线性回归模型 Yi = β1 + β 2 X i + ui ,

2 2 2
在 OLS 估计基础上得到残差的平方 ei ,然后绘制出 ei 对 X i 的散点图,如果 ei 不随 X i 而变

2
化,如图 5.3a 所示,则表明 ui 不存在异方差;如果 ei 随 X i 而变化,如图 5.3b、c、d 所示,

则表明 ui 存在异方差。

ei2 ei2

0 0
a Xi b Xi

ei2 ei2

0 0
Xi Xi
c d

图 5.3 ei2 对 X i 的散点图

图形法的特点是简单易操作,不足是对异方差性的判断比较粗糙,由于引起异方差性的

原因错综复杂,仅靠图形法有时很难准确对是否存在异方差下结论,还需要采用其他统计检

验方法。

二、Goldfeld-Quandt 检验
Goldfeid-Quandt 检验方法是戈德菲尔德和夸特于 1965 年提出的,可用于检验递增性或

递减性异方差。此检验的基本思想是将样本分为两部分,然后分别对两个样本进行回归,并

计算比较两个回归的剩余平方和是否有明显差异,以此判断是否存在异方差。

1.检验的前提条件

6
(1)此检验只适用于大样本。

(2)除了同方差假定不成立外,其它假定均满足。

2.检验的具体做法

(1)将样本观测值按解释变量 X i 的大小顺序排序。

(2)将排列在中间的 C 个(约样本个数 n 的 1 5 ~ 1 4 )的观察值删除掉,再将剩余的

观测值分为两个部分,每部分观察值的个数为(n-c)/2。

(3)提出假设。即 H 0 : 两部分数据的方差相等; H 1 : 两部分数据的方差不相等。

(4)构造 F 统计量。分别对上述两个部分的观察值作回归,由此得到的两个部分的残差

平方和,若方差为随 X i 递增的异方差,以 ∑e 2
1i 表示前一部分样本回归产生的残差平方和,

以 ∑e2
2i 表示后一部分样本回归产生的残差平方和,它们的自由度均为[(n-c)/2]-k,k 为参


数的个数。在原假设成立的条件下,可导出
n−c
∑e 2
2i
2
/[− k]
∑e 2
2i n−c n−c
F* = = ~ F( − k, − k) (5.6)
n−c
∑ e1i /[ 2 − k ]
2 ∑e 2
1i 2 2

(5)判断。给定显著性水平 α ,查 F 分布表,得临界值
n−c n−c
F(α ) = F(α ) ( − k, − k)
2 2
* *
计算统计量 F ,如果 F > F(α ) ,则拒绝原假设,不拒绝备择假设,即认为模型中的随机误

*
差存在异方差。反之,如果 F < F(α ) ,则不拒绝原假设,认为模型中随机误差项不存在异方

差。

Goldfeid-Quandt 检验的功效,一是与对观测值的正确排序有关;二是与删除数据的个数 c

的大小有关。经验认为,当 n=30 时,可以取 c = 4 ~ 6 ;当 n=60 时,可以取 c = 10 ~ 14 。该

方法得到的 F 分布是近似的,而且只是对异方差是否存在进行判断,在多个解释变量的情况

下,对判断是哪一个变量以什么函数形式引起异方差还存在局限。Goldfeid-Quandt 检验也可

将样本分为多个组,从中任选两个组进行检验。

三、White 检验

White 检验的基本思想是,如果存在异方差,其方差 σ t 与解释变量有关系,分析 σ t 是


2 2

[美] 拉姆·拉玛纳山. 应用计量经济学. 机械工业出版社.2003. 240


7
否与解释变量有某些形式的联系以判断异方差性。但是 σ t 一般是未知的,可用 OLS 估计的残
2

2 2
差平方 et 作为其估计值。在大样本的情况下,作 et 对常数项、解释变量、解释变量的平方及

其交叉乘积等所构成的辅助回归,利用辅助回归相应的检验统计量,即可判断是否存在异方

差性。

为了检验多元线性回归模型的异方差性,以三个解释变量的函数为例。设模型为

β1 β 2 X 2t + β3 X 3t + β 4 X 4t + ut
Yt =+ (5.7)

并且,设异方差与 X 2t , X 3t , X 4t 的一般关系为

α1 α 2 X 2t + α 3 X 3t + α 4 X 4t + α 5 X 22t + α 6 X 32t + α 7 X 42t +


et2 =+
(5.8)
+ α 8 X 2t X 3t + α 9 X 2t X 4t + α10 X 3t X 4t + vt

其中 vt 为随机误差项。White 检验的基本步骤如下

(1)用 OLS 法估计公式(5.7),计算残差 et = Yt − Yˆt ,并求残差的平方 et 。


2

(2)用残差平方 et 作为异方差 σ t 的估计,并作 et 对 X 2t , X 3t , X 4t , X 2t , X 3t , X 4t , X 2t X 3t ,


2 2 2 2 2 2

X 2t X 4t , X 3t X 4t 的辅助回归,即

αˆ1 αˆ 2 X 2t + αˆ3 X 3t + αˆ 4 X 4t + αˆ5 X 22t + αˆ 6 X 32t + αˆ 7 X 42t +


eˆt2 =+
(5.9)
+ αˆ8 X 2t X 3t + αˆ 9 X 2t X 4t + αˆ10 X 3t X 4t

式中 eˆt 表示 et 的估计。
2 2

(3)计算统计量 nR 2 ,其中 n 为样本容量, R 为辅助回归的可决系数。


2

(4)在 H 0 : α=
2 L= α10= 0 的条件下,可证明, nR 2 渐近地服从自由度为 p 的 χ 2 分

布,p 为辅助回归式中斜率的个数。本例中,辅助回归共有 9 个解释变量,所以自由度为 9。

给定显著性水平 α ,查 χ 2 分布表,得临界值 χα (9) 。如果 nR 2 > χα (9) ,则拒绝原假设,表


2 2

明模型中随机误差存在异方差。

White 检验的特点是,不仅能够检验异方差的存在性,同时在多个解释变量的情况下,

还能判断出是哪一个变量引起的异方差。此方法不需要异方差的先验信息,但要求观测值为

大样本。解释变量过多是 White 检验的一个缺陷,对于多个解释变量的模型,运用该检验会

8
丧失较多的自由度。为了弥补这一不足,有人提出用多元线性回归函数的拟合值 Yˆ ②,作 et 对
2

Yˆ 与 Yˆ 2 的辅助回归,即 et2 =αˆ1 + αˆ 2Yˆt + αˆ3Yˆt 2 + vt ,其中 vt 为随机误差项。提出原假设

H 0 : α=
2 α=
3 0 ,运用 F 检验即可判断模型中的异方差性。这时无论原模型有多少个解释

变量,要检验的辅助回归模型只有两个约束,因此对自由度影响不大。

四、ARCH 检验
通常,人们在做计量经济分析时对截面数据产生异方差给予足够的关注,而放松了对时

间序列数据产生异方差的警惕。恩格尔(Engel)于 1982 年提出了在时间序列背景下也有可

能出现异方差性,并从理论上提出了一种观测时间序列方差变动的方法,这就是所谓的 ARCH

(AutoRegressive Conditional Heteroscedasticity)检验方法。ARCH 检验的思想是,在

时间序列数据中,可认为存在的异方差性为 ARCH(自回归条件异方差)过程,并通过检验这一

过程是否成立去判断时间序列有无异方差。

1、ARCH 过程

设 ARCH 过程为

σ t2 = α 0 + α1σ t2−1 + L + α pσ t2− p + vt (5.10)

式中 p 为 ARCH 过程的阶数,并且 α 0 > 0,α i ≥ 0, (i = 1,2,L , p ) ; vt 为随机误差。

2、ARCH 检验的基本步骤

(1)提出假设

H 0 : α1 = α 2 = L = α p = 0; H1 : α j ( j = 1,2, L , p )中至少有一个不为零。

2 2 2
(2)对原模型作 OLS 估计,求出残差 et ,并计算残差平方序列 et , et −1 , L , et − p ,以分别

作为对 σ t , σ t −1 , L , σ t − p 的估计。
2 2 2

(3)作辅助回归

eˆt2 = αˆ 0 + αˆ1et2−1 + L + αˆ p et2− p (5.11)

式中 eˆt 表示 et 的估计。
2 2

2
(4)计算式(5.11)辅助回归的可决系数 R ,可以证明,在 H 0 成立的条件下,基于大

样本,有 ( n − p ) R 2 渐近服从 χ 2 ( p ) ,p 为自由度,亦即式(5.10)中变量的滞后期数;给


(美) J.M.伍德里奇,计量经济学导轮,中国人民大学出版社,2007.271

9
2 2
定显著性水平 α ,查 χ 2 分布表得临界值 χ α ( p ) ,如果 ( n − p ) R 2 > χ α ( p ) ,则拒绝原假设,


表明模型中的随机误差项存在异方差 。

利用 EViews 作时间序列数据回归的异方差检验,可以在“Equation”回归结果中单击

“Views/ Residual Diagnostics/ Heteroskedasticity Tests…”,在弹出的 specification

对话框中的检验类型中“Test type”选择“ARCH”检验,然后在滞后阶数对话框中“Number

of lags”输入相应的数值,单击“OK”即可。EViews 给出的检验结果,其中“Obs*R-squared”

即为 ( n − p ) R 2 统计量。

ARCH 检验的特点是,要求变量的观测值为大样本,并且是时间序列数据;它只能判断模

型中是否存在异方差,而不能诊断出是哪一个变量引起的异方差。

五、Glejser 检验

Glejser 检验的基本思想是,由 OLS 法得到残差 ei ,取 ei 的绝对值 ei ,然后将 ei 对某

个解释变量 X i 回归,根据回归模型的显著性和拟合优度来判断是否存在异方差。该检验的特

点是不仅能对异方差的存在进行判断,而且还能对异方差随某个解释变量变化的函数形式进

行诊断。该检验要求变量的观测值为大样本。

Glejser 检验的具体步骤如下。

(1)根据样本数据建立回归模型,并求残差序列 ei = Yi − Yˆi 。

(2)用残差绝对值 ei 对 X i 的进行回归,由于 ei 与 X 的真实函数形式并不知道,可用

各种函数形式去试验,从中选择最佳形式。Glejser 曾提出如下一些假设的函数形式:

1 1
ei = βX i + vi ;ei = α + βX i + vi ;ei = β X i + vi ;ei = β + vi ;ei = β + vi ,
Xi Xi

其中 v 为随机误差项。

2
(3)根据选择的函数形式作 ei 对 X i 的回归,用回归所得到的 R 、t、F 等信息判断,

若参数 β 显著地不为零,即认为存在异方差性。

上述各种检验方法,很难说哪一种方法最为有效。这些检验方法的共同思想是,基于不

同的假定,分析随机误差项的方差与解释变量之间的相关性,以判断随机误差项的方差是否

随解释变量而变化。其中有的检验方法还能提供随机误差项的方差与解释变量之间关系的某


陆懋祖,高等时间序列经济计量学,上海人民出版社,1999.300

10
些信息,这些信息对补救异方差性可能是有价值的。

第四节 异方差性的补救措施

通过检验如果证实存在异方差,则需要采取措施对异方差性进行修正,基本思想是在确

认异方差形式的基础上,采用适当的估计方法,消除或减小异方差对模型的影响。

一、对模型变换
当可以确定异方差的具体形式时,将模型作适当变换有可能消除或减轻异方差的影响。

以一元线性回归模型为例

Yi = β1 + β 2 X i + ui (5.12)

经检验 ui 存在异方差,并已知 Var (ui ) = σ i = σ f ( X i ) ,其中 σ 2 为常数, f ( X i ) 为 X i 的


2 2

某种函数,且 f ( X i ) > 0 。显然,当 f ( X i ) 是常数时, ui 为同方差,当 f ( X i ) 不是常数时,

ui 为异方差。为了变换模型,用 f ( X i ) 去除式(5.12)的两端,得

Yi β1 Xi ui
= + β2 + (5.13)
f (Xi ) f (Xi ) f (Xi ) f (Xi )

Yi Xi β1 ui
Yi * = ; β1 =
* *
记 ; Xi = ; vi = ,则有
f (Xi ) f (Xi ) f (Xi ) f (Xi )

Yi* = β1* + β 2 X i* + vi (5.14)

式(5.14)的随机误差项为 vi ,其方差为

ui 1
Var(vi ) = Var( )= Var(ui ) = σ 2 (5.15)
f(X i ) f(X i )

ui
可见,经变换后的式(5.16)的随机误差项 vi = 已是同方差。
f (Xi )

根据图示法或 Glejser 检验所得到的相应信息,可以对 f ( X i ) 的函数形式作出各种假定,

常见的 f ( X i ) 形式有以下几种。

(1)设 f ( X i ) = X i ,即Var(ui ) = σ 2X i ,这时对式(5.12)两端同除 X i ,得

Yi β Xi u
= 1 + β2 + i (5.16)
Xi Xi Xi Xi

11
ui
令 vi = ,则 Var(vi ) 为同方差。因为
Xi

ui 1
Var(vi ) = Var( ) = Var(ui ) = σ 2 (5.17)
Xi Xi

2 2 2
(2)设 f ( X i ) = X i ,则 Var(ui ) = σ X i ,同理,得

Yi 1 X u
= β1 + β2 i + i (5.18)
Xi Xi Xi Xi

ui
令 vi = ,则 Var(vi ) 为同方差。因为
Xi

ui 1
Var (vi ) = Var ( ) = 2 Var (ui ) = σ 2 (5.19)
Xi Xi

(3)设 f ( X i ) = ( a0 + a1 X i ) ,则 Var (ui ) = σ (a0 + a1 X i ) 。同理有


2 2 2

Yi 1 Xi ui
= β1 + β2 + (5.20)
a0 + a1 X i a0 + a1 X i a0 + a1 X i a0 + a1 X i

ui
令 vi = ,则 Var (vi ) 为同方差。因为
a0 + a1 X i

ui 1
Var (vi ) = Var ( )= 2
Var (ui ) = σ 2 (5.21)
a0 + a1 X i (a0 + a1 X i )

在异方差的形式已知或通过检验能够确认的前提下,运用上述模型变换的方法可以较好

地修正异方差对模型的影响。但在多数情况下,异方差的形式并不知道,那么,怎么能够比

较好地得到异方差的函数形式,目前有一些方法,但内容已超出本书的范围。

另外,异方差性现象可视为模型设定偏误的一种特殊形式。因此,修正异方差性的一种

有效方法是重新设定回归模型形式,以消除异方差性。

二、加权最小二乘法

为了便于说明问题,仍以一元线性回归模型为例

Yi = β1 + β 2 X i + ui (5.22)

且存在异方差的形式为 Var (ui ) = σ i = σ f ( X i ) ,其中 σ 2 为常数, f ( X i ) 为 X i 的某种函


2 2

数。对式(5.22)按照最小二乘法的基本原则,是使残差平方和 ∑ e = ∑ (Y − βˆ
2
i i 1 − βˆ 2 X i ) 2

12
2
为最小。在同方差性假定下,普通最小二乘法是把每个残差平方 ei (i = 1,2, L , n) 都同等看待,

都赋予相同的权数 1。但是,当存在异方差性时,方差 σ i 越小,其样本值偏离均值的程度越


2

小,其观测值越应受到重视,即方差越小,在确定回归线时的作用应当越大;反之方差 σ i 越
2

大,其样本值偏离均值的程度越大,其观测值所起的作用应当越小。也就是说,在拟合存在

异方差的模型的回归线时,对不同的 σ i 应该区别对待。从样本的角度,对较小的 ei 给予较


2 2

大的权数,对较大的 ei 给予较小的权数,从而使
2
∑e 2
i 更好地反映 σ i 对残差平方和的影响。
2

通常可将权数取为 wi = 1 σ i2 (i = 1,2,L , n) ,由此,当 σ i2 越小时,wi 越大,当 σ i2 越大时,wi

就越小。将权数与残差平方相乘以后再求和,得

∑w e 2
i i = ∑ wi (Yi − βˆ1 − βˆ 2 X i ) 2 (5.23)

式(5.23)称为加权的残差平方和。根据最小二乘原理,若使得加权的残差平方和最小,即

min ∑ wi ei2 = min ∑ wi (Yi − βˆ1 − βˆ 2 X i ) 2 (5.24)

可得

βˆ1* = Y * − βˆ 2* X *

βˆ 2* = ∑ w ( X − X )(Y − Y )
i i
*
i
*
(5.25)

∑ w (X − X ) i i
* 2

其中 X =
* ∑w X i i
,Y * =
∑ w Y 。这样估计出的参数 β̂
i i *
和 β̂ 2* 称为加权最小二乘估计。这
∑w ∑w
1
i i

种求解参数估计式的方法为加权最小二乘法(Weighted Least Square,简称 WLS)。

容易证明,对原模型变换的方法与加权最小二乘法实际上是等价的。例如以式(5.22)

的一元线性模型为例,如果已知存在异方差,且 Var (ui ) = σ i = σ f ( X i ) ,变换后的模型为


2 2

Yi β1 Xi ui
= + β2 + (5.26)
f (X i ) f (X i ) f (X i ) f (X i )

由前面的讨论知,式(5.26)的随机误差项 ui f ( X i ) 已是同方差的。用 OLS 法估计式(5.26)

的参数,其剩余平方和为

Yi βˆ1 Xi 1
∑ ei2 = ∑ ( − − βˆ2 )2 = ∑ (Yi − βˆ1 − βˆ2 X i ) 2 (5.27)
f (Xi) f (Xi) f (Xi) f (Xi)

13
当对式(5.22)采用加权最小二乘法时,其权数为 wi = 1 σ i2 = 1 σ 2 f ( X i ) (i = 1,2,L , n) ,其残

差平方和为
2
e 1 1
∑ (σ )=∑ (Yi − βˆ1 − βˆ 2 X i ) 2 = ∑ (Yi − βˆ1 − βˆ 2 X i ) 2
i
(5.28)
i
2
σ i
2
σ f (X i )
2

将式(5.27)模型变换的残差平方和与式(5.28)加权最小二乘的残差平方和加以对比,可以

看出二者的剩余平方和只相差常数因子 σ 2 ,能使其中一个最小时必能使另一个最小。对模型

变换后用 OLS 估计其参数,实际与应用加权最小二乘法估计的参数是一致的。这也间接证明

了加权最小二乘法可以消除异方差。

三、模型的对数变换

在经济意义成立的情况下,如果对式(5.22)的模型作对数变换,其变量 Yi 和 X i 分别用

ln Yi 和 ln X i 代替,即

ln Yi = β1 + β 2 ln X i + ui (5.29)

对数变换后的模型通常可以降低异方差性的影响。

首先,运用对数变换能使测定变量值的尺度缩小。它可以将两个数值之间原来 10 倍的

差异缩小到只有 2 倍的差异。例如,
100 是 10 的 10 倍,但在常用对数情况下,lg100=2 是 lg10=1

的两倍;再例如,80 是 8 的 10 倍,但在自然对数情况下,ln80=4.3820 是 ln8=2.0794 的两倍

多。

其次,经过对数变换后的线性模型,其残差 e 表示相对误差(证明见附录 5.1),而相对

误差往往比绝对误差有较小的差异。

但是特别要注意的是,对变量取对数虽然能够减少异方差对模型的影响,但应注意取对

数后变量的经济意义。如果变量之间在经济意义上并非呈对数线性关系,则不能简单地对变

量取对数,这时只能用其它方法对异方差进行修正。

第五节 案例分析

一、问题的提出和模型设定
根据本章引子提出的问题,为了给制定医疗机构的规划提供依据,分析比较医疗机构与

人口数量的关系,建立卫生医疗机构数与人口数的回归模型。假定医疗机构数与人口数之间

满足线性约束,则理论模型设定为

14
Yi = β1 + β 2 X i + ui

式中 Yi 表示卫生医疗机构数, X i 表示人口数。由 2001 年《四川统计年鉴》得到如表 5.1 所

示的数据。

表 5.1 四川省 2000 年各地区医疗机构数与人口数

地区 人口数(万人) 医疗机构数 地区 人口数(万人) 医疗机构数


X (个)Y X (个)Y
成都 1013.3 6304 眉山 339.9 827
自贡 315 911 宜宾 508.5 1530
攀枝花 103 934 广安 438.6 1589
泸州 463.7 1297 达州 620.1 2403
德阳 379.3 1085 雅安 149.8 866
绵阳 518.4 1616 巴中 346.7 1223
广元 302.6 1021 资阳 488.4 1361
遂宁 371 1375 阿坝 82.9 536
内江 419.9 1212 甘孜 88.9 594
乐山 345.9 1132 凉山 402.4 1471
南充 709.2 4064

二、参数估计
进入 EViews 软件包,确定样本范围;编辑输入数据;选择估计方程菜单,得到图 5.4

的估计结果

图 5.4 回归结果

估计结果为

Yˆi =
−562.9074 + 5.3728 X i
t = (−1.9306) (8.3398)
=R 2 0.7854,
= F 69.55 25

三、检验模型的异方差

15
本例用的是四川省 2000 年各市州的医疗机构数和人口数,由于各地区人口数不同,对医

疗机构设置数量有不同的需求,这种差异使得模型很容易产生异方差,从而影响模型的估计

和运用。为此,需要对模型是否存在异方差进行检验。

(一)图形法

1.EViews 软件操作

2
(1)生成残差平方序列。在得到图 5.4 的估计结果后,立即用生成命令建立序列 ei (记

为 e2)。生成过程如下,按路径:Quick /Generate Series,进入 Generate Series by Equation

对话框,在 Generate Series by Equation 对话框中(如图 5.5)


,键入“e2=(resid)^2”,

2
则生成序列 ei 。

2
(2)绘制 et 对 X t 的散点图。选择变量名 X 与 e2(注意选择变量的顺序,先选的变量将在图

形中表示横轴,后选的变量表示纵轴),进入数据列表,再按路径 view/graph/scatter,可
得散点图,见图 5.6。

图 5.5 生成残差平方对话框 图 5.6 散点图

2.判断

2
由图 5.6 可以看出,残差平方 ei 对解释变量 X 的散点图主要分布在图形中的下三角部分,

2
大致看出残差平方 ei 随 X i 的变动呈增大的趋势,因此,模型很可能存在异方差。但是否确

实存在异方差还应通过更进一步的检验。

(二)Goldfeld-Quandt 检验

1.EViews 软件操作

(1)对变量取值排序(按递增或递减)。在 Procs 菜单里选 Sort Series 命令,出现排

序对话框,如果以递增型排序,选 Ascending,如果以递减型排序,则应选 Descending,键

入 X,点 ok。本例选递增型排序,这时变量 Y 与 X 将以 X 按递增型排序。

16
(2)构造子样本区间,建立回归模型。在本例中,样本容量 n=21,删除中间 1/4 的观

测值,即大约 5 个观测值,余下部分平分得两个样本区间:1—8 和 14—21,它们的样本个数

均是 8 个,即 n1 = n2 = 8 。

在 Sample 菜单里,将区间定义为 1—8,然后用 OLS 方法求得如图 5.7 所示结果。

图 5.7 样本区间 1—8 回归结果

在 Sample 菜单里,将区间定义为 14—21,然后用 OLS 方法求得如图 5.8 所示结果。

图 5.8 样本区间 14—21 回归结果

3)求 F 统计量值。基于图 5.7 和图 5.8 中残差平方和的数据,即 Sum squared resid

的 值 。 由 图 5.7 得到 残 差 平 方 和 为 ∑e 2
1i = 144958.9 , 由 图 5.8 得到 残 差 平 方 和 为

∑e 2
2i = 734355.8 ,根据 Goldfeld-Quanadt 检验,F 统计量为

=F

=
e2
2i 735844.7
= 5.0762 (5.30)
∑e 2
1i 144958.9

17
2.判断

在 α = 0.05 下,式(5.30)中分子、分母的自由度均为 6,查 F 分布表得临界值

F0.05 (6,6) = 4.28 ,因为 F =5.0762 > F0.05 (6,6) =4.28 ,所以拒绝原假设,表明模型确实

存在异方差。

(三)White 检验

由图 5.4 估计结果,按路径
“View/ Residual Diagnostics/ Heteroskedasticity Tests…”,

在弹出的 specification 对话框中的检验类型中“Test type”选择“White”检验。根据 White

检验中辅助函数的构造,最后几项为变量的交叉乘积项,因为本例为一元函数,故 EViews7

及以前版本应选择无交叉乘积项复选框。但是在 EViews8 中,把常数项也视为一个变量,所

以常数项和解释变量 X 的交叉项实为 X 的一次项,因此应该选中“Include White cross terms”

复选框,则辅助函数为

σ t2 = α 0 + α1 xt + α 2 xt2 + vt

经估计出现 White 检验结果,见图 5.9。

从图 5.9 可以看出,nR 2 = 18.07481 ,由 White 检验知,在 α = 0.05 下,查 χ 2 分布表,

得临界值 χ 0.05 ( 2) = 5.9915 ,同时 X 和 X 的 t 检验值也显著。比较计算的 χ 2 统计量与临


2 2

2
界值,因为 nR = 18.07481 > χ 0.05
2
(2) = 5.9915 ,所以拒绝原假设,不拒绝备择假设,表明

模型存在异方差。

18
图 5.9 White 检验结果

(四)Glejser 检验

根据 Glejser 检验原理和 Glejser 提出的若干假设函数形式,经过反复测试,并综合考

虑检验和加权修正效果,最终采用如下函数形式。

|𝑒𝑒𝑖𝑖 | = 𝛽𝛽𝑋𝑋𝑖𝑖2 + 𝜈𝜈𝑖𝑖 (5.31)

1.EViews 软件操作

首先用式(5.31)作为异方差随解释变量变化的函数形式来检验异方差,由图 5.4 估计

结果,按路径“View/ Residual Diagnostics/ Heteroskedasticity Tests…”,如图 5.10

所示,在弹出的 specification 对话框中的检验类型中“Test type”选择“Glejser”检验,

在解释变量框 “Regressors” 中写入“C X^2”,选择 OK,即可得如图 5.11 所示结果。

19
图 5.10 Glejser 检验对话框

图 5.11 函数式(5.31)的 Glejser 检验

2.判断

从图 5.11 可知,异方差检验的结果中𝑛𝑛𝑛𝑛 2 为 6.9385,查 χ 2 分布表,得临界值𝜒𝜒0.05


2 (1)
=

2 (1)
3.8416, 𝑛𝑛𝑛𝑛 2 = 6.9385 > 𝜒𝜒0.05 = 3.8416,所以拒绝原假设,这说明图 5.4 估计的模型存

在异方差,且异方差与解释变量的函数形式为|𝑒𝑒𝑖𝑖 | = 𝛽𝛽𝑋𝑋𝑖𝑖2 + 𝜈𝜈𝑖𝑖 。

四、异方差性的修正

(一)加权最小二乘法(WLS)

在运用 WLS 法估计中,可以分别选用各种权数做比较,从中选择较为理想的权数。如图

5.11 所示,残差的绝对值与解释变量 X 是二次函数关系,而且在图 5.11 的 Glejser 检验结

20
果的辅助回归中也明显看出解释变量的二次项对残差绝对值有解释能力,因此我们选择权重

w = 1/X^2。为了在 EViews 中进行加权最小二乘估计,在 Quick/Estimate equation 中输入

"Y C X^2",点 option,在对话框中 Weight 选择加权类型“Inverse variance”、加权序列“1/X^2”

点击 OK,即得到图 5.12 的加权最小二乘结果。

图 5.12 加权最小二乘法输出结果

可以看出运用加权最小二乘法消除了异方差性后,参数的 t 检验均显著,F 检验也显著。

经 White 检验发现,检验的 P 值为 0.356,说明已经无异方差。即估计结果为

𝑌𝑌�𝑖𝑖 = 384.6123 + 2.7236𝑋𝑋𝑖𝑖

t=(4.375346) (6.284353)

𝑅𝑅 2 = 0.6752, DW=2.2831, F=39.4931

这说明人口数量每增加 1 万人,平均说来将增加 2.723571 个卫生医疗机构,而不是引子

中得出的需要增加 5.3735 个医疗机构。虽然这个模型可能还存在某些其他需要进一步解决的

问题,但这一估计结果或许比引子中的结论更为接近真实情况。

本章小结

1.异方差性是指模型中随机误差项的方差不是常量,而且它的变化与解释变量的变动有

关。

2.产生异方差性的主要原因有:模型中略去的变量随解释变量的变化而呈规律性的变化、

21
变量的设定问题、截面数据的使用,利用平均数作为样本数据等。

3.存在异方差性时对模型的 OLS 估计仍然具有无偏性,大样本下一致性成立,但最小方

差性不成立,从而导致参数的显著性检验失效和预测的精度降低。

4.检验异方差性的方法有多种,常用的有图形法、Goldfeld-Quandt 检验、White 检验、

ARCH 检验以及 Glejser 检验,运用这些检验方法时要注意它们的假设条件。

5.修正异方差性的主要方法是加权最小二乘法,也可以用变量变换法和对数变换法。变

量变换法与加权最小二乘法实际是等价的。

6.主要公式见表 5.2

表 5.2 主要公式表

名称 公式

异方差性 Var (ui ) = σ i2

n−c
Goldfeld-Quandt 检验
*
∑e 2
2
2i /[
− k]
∑e 2
2i
F = =
的 F 统计量 n−c
∑ e1i /[ 2 − k ]
2 ∑e 2
1i

White 检验中的辅助函数 αˆ1 + αˆ 2 x2t + αˆ3 x3t + αˆ 4 x22t + αˆ5 x32t + αˆ 6 x2t x3t
eˆt2 =
(原模型只有两个解释变

量)

ARCH 检验中的辅助函数 eˆt2 = αˆ 0 + αˆ1et2−1 + L + αˆ p et2− p

Glejser 检验中常用的辅助函 1
e = βX + v; e = β X + v; e = β + v;
数 X
1
e =β + v; e = α + βX + v
X

一元函数下的加权最小二乘 βˆ1* = Y * − βˆ 2* X *
估计
βˆ 2* = ∑ w ( X − X )(Y − Y
i i
*
i
*
)
∑ w (X − X )i i
* 2

一元函数下对原模型的变换 设 Yi = β1 + β 2 X i + ui 并且 Var (ui ) = σ i = σ f ( X i )


2 2

Yi β1 Xi ui
则 = + β2 +
f (Xi ) f (Xi ) f (Xi ) f (Xi )

对数变换的模型 ln Yi = β1 + β 2 ln X i + ui

22
思考题
5.1 简述什么是异方差?为什么异方差的出现总是与模型中某个解释变量的变化有关?

5.2 试归纳检验异方差方法的基本思想,并指出这些方法的异同。

5.3 什么是加权最小二乘法,它的基本思想是什么?

5.4 产生异方差的原因是什么?试举例说明经济现象中的异方差性。

5.5 如果模型中存在异方差性,对模型有什么影响?这时候模型还能进行应用分析吗?

5.6 对数变化的作用是什么?进行对数变化应注意什么?对数变换后模型的经济意义有

什么变化?

5.7 怎样确定加权最小二乘法中的权数?

练习题
5.1 设消费函数为

Yi = β1 + β 2 X 2i + β 3 X 3i + ui

式中,Yi 为消费支出;X 2i 为个人可支配收入;X 3i 为个人的流动资产;ui 为随机误差项,

并且 E (ui ) = 0, Var (ui ) = σ X 2i (其中 σ 2 为常数)。试回答以下问题:


2 2

(1)选用适当的变换修正异方差,要求写出变换过程;

(2)写出修正异方差后的参数估计量的表达式。

5.2 对于第三章练习题 3.3 家庭书刊消费与家庭收入及户主受教育年数关系的分析,

进一步作以下分析:

(1)判断模型 Yi =β1 + β 2 X i + β 3Ti + ui 是否存在异方差性。

(2)如果模型存在异方差性,应怎样去估计其参数?

(3)对比分析的结果,你对第三章练习题 3.3 的结论有什么评价?


5.3 为了研究中国出口商品总额 EXPORT 对国内生产总值 GDP 的影响,搜集了 1990~2015
年相关的指标数据,如表 5.3 所示。
表 5.3 中国出口商品总额与国内生产总值 (单位:亿元)
时间 出口商品总额 国内生产总值 时间 出口商品总额 国内生产总值
EXPORT GDP EXPORT GDP
1991 3827.1 22005.6 2004 49103.3 161840.2
1992 4676.3 27194.5 2005 62648.1 187318.9
1993 5284.8 35673.2 2006 77597.2 219438.5
1994 10421.8 48637.5 2007 93627.1 270232.3

23
1995 12451.8 61339.9 2008 100394.9 319515.5
1996 12576.4 71813.6 2009 82029.7 349081.4
1997 15160.7 79715.0 2010 107022.8 413030.3
1998 15223.6 85195.5 2011 123240.6 489300.6
1999 16159.8 90564.4 2012 129359.3 540367.4
2000 20634.4 100280.1 2013 137131.4 595244.4
2001 22024.4 110863.1 2014 143883.7 643974.0
2002 26947.9 121717.4 2015 141166.8 685505.8
2003 36287.9 137422.0
资料来源:《国家统计局网站》
(1) 根据以上数据,建立适当线性回归模型。
(2) 试分别用 White 检验法与 ARCH 检验法检验模型是否存在异方差?
(3) 如果存在异方差,用适当方法加以修正。
5.4 表 5.4 的数据是 2011 年各地区建筑业总产值(X)和建筑业企业利润总额(Y)。
表 5.4 各地区建筑业总产值(X)和建筑业企业利润总额(Y) (单位:亿元)
地 区 建筑业总产值X 建筑业企业利 地 区 建筑业总产值X 建筑业企业
润总额Y 利润总额Y
北 京 6046.22 216.78 湖 北 5586.45 231.46
天 津 2986.45 79.54 湖 南 3915.02 124.77
河 北 3972.66 127.00 广 东 5774.01 251.69
山 西 2324.91 49.22 广 西 1553.07 26.24
内蒙古 1394.68 105.37 海 南 255.47 6.44
辽 宁 6217.52 224.31 重 庆 3328.83 155.34
吉 林 1626.65 89.03 四 川 5256.65 177.19
黑龙江 2029.16 58.92 贵 州 824.72 14.39
上 海 4586.2.8 166.69 云 南 1868.40 61.88
江 苏 15122.85 595.87 西 藏 124.47 5.75
浙 江 14907.42 411.57 陕 西 3216.63 104.38
安 徽 3597.26 127.12 甘 肃 925.84 29.33
福 建 3692.62 126.47 青 海 319.42 8.35
江 西 2095.47 62.37 宁 夏 427.92 11.25
山 东 6482.90 291.77 新 疆 1320.37 27.60
河 南 5279.36 200.09
数据来源:国家统计局网站
根据样本资料建立回归模型,分析建筑业企业利润总额与建筑业总产值的关系,并判断
模型是否存在异方差,如果有异方差,选用最简单的方法加以修正。

5.5 表 5.5 是 2015 年中国各地区人均可支配收入(X)与居民每百户汽车拥有量(Y)的


数据。
表 5.5 中国各地区人均可支配收入 X 与居民每百户汽车拥有量
时间 人均可支配收 居民每百户汽 时间 人均可支配收 居民每百户汽
入(元) 车拥有量(辆) 入(元) 车拥有量(辆)
X Y X Y

24
北 京 48458.0 45.0 湖 北 20025.6 12.9
天 津 31291.4 37.7 湖 南 19317.5 16.4
河 北 18118.1 30.4 广 东 27858.9 24.6
山 西 17853.7 20.7 广 西 16873.4 18.0
内蒙古 22310.1 28.5 海 南 18979.0 15.5
辽 宁 24575.6 18.1 重 庆 20110.1 15.4
吉 林 18683.7 19.3 四 川 17221.0 15.3
黑龙江 18592.7 10.7 贵 州 13696.6 15.0
上 海 49867.2 24.3 云 南 15222.6 24.2
江 苏 29538.9 31.3 西 藏 12254.3 21.5
浙 江 35537.1 39.8 陕 西 17395.0 15.8
安 徽 18362.6 14.8 甘 肃 13466.6 13.7
福 建 25404.4 22.3 青 海 15812.7 24.3
江 西 18437.1 16.7 宁 夏 17329.1 25.2
山 东 22703.2 37.8 新 疆 16859.1 19.9
河 南 17124.8 17.4
(1)试根据上述数据建立各地区人均可支配收入与各地区居民每百户汽车拥有量的线性回归
模型。
(2)选用适当方法检验模型是否存在异方差,并说明存在异方差的理由。
(3)如果存在异方差,用适当方法修正。
5.6 表 5.6 为 1978 年—2015 年四川省农村人均纯收入、人均生活费支出、商品零售价
格指数的数据。
表 5.6 四川省农村人均纯收入、人均生活费支出、商品零售价格指数
农村人均纯 农村人均生 农村人均纯 农村人均生
商品零售 商品零售
时间 收入 活消费支出 时间 收入 活消费支出
价格指数 价格指数
X/元 Y/元 X/元 Y/元
1978 127.10 120.30 100.0 1997 1680.69 1440.48 380.8
1979 155.90 142.10 102.0 1998 1789.17 1440.77 370.9
1980 187.90 159.50 108.1 1999 1843.47 1426.06 359.8
1981 221.00 184.00 110.7 2000 1903.60 1489.55 354.4
1982 256.00 208.23 112.8 2001 1986.99 1497.52 351.6
1983 258.40 231.12 114.5 2002 2107.66 1591.35 347.0
1984 286.80 251.83 117.7 2003 2229.86 1747.02 346.7
1985 315.07 276.25 128.1 2004 2580.28 2010.88 356.4
1986 337.94 310.92 135.8 2005 2802.78 2274.17 359.4
1987 369.46 348.32 145.7 2006 3002.38 2395.04 362.9
1988 448.85 426.47 172.7 2007 3546.69 2747.27 376.7
1989 494.07 473.59 203.4 2008 4121.21 3127.94 398.9
1990 557.76 509.16 207.7 2009 4462.05 4141.40 400.5
1991 590.21 552.39 213.7 2010 5139.52 3897.53 413.7
1992 634.31 569.46 225.2 2011 6128.55 4103.92 435.2
1993 698.27 647.43 254.9 2012 7001.43 5366.71 442.2
1994 946.33 904.28 310.2 2013 7895.3 6126.8 449.7

25
1995 1158.29 1061.15 356.1 2014 9348 8301 452.4
1996 1453.42 1349.88 377.8 2015 10247 9251 453.3
资料来源:中经网统计数据库
1) 如果不考虑价格变动因素,建立回归模型并检验是否存在异方差,如果存在异方差,
选用适当方法进行修正。
2)如果考虑价格变动因素,对异方差性的修正应该怎样进行?
3)对比以上两个回归模型,你有什么体会?
5.7 用本章的方法检验你在练习题 2.7 和练习题 3.7 中所建立的线性回归模型是否存在异
方差性。如果存在异方差性,你能设法消除或减轻异方差性的影响吗?

附录 5.1 对数变换后残差为相对误差的证明
设样本回归函数为

Yi = βˆ1 + βˆ2 X i + ei

其中 ei = Yi − Yˆ 为残差,取对数后的样本回归函数为

ln Y = αˆ1 + αˆ 2 ln X + e*

其中残差为 e = ln Y − ln Yˆ ,因此
*

Y Yˆ + Y − Yˆ Y − Yˆ
e* = ln Y − ln Yˆ = ln( ) = ln( ) = ln(1 + )
Yˆ Yˆ Yˆ

对式(5.39)的右端,依据泰勒展式

X2 X3 X4 Xn
ln(1 + X ) = X − + − + L + (−1) n−1 +L
2 3 4 n

由该展式可知,右段除第一项 X 外,其余各项均为 X 的高阶无穷小量,故可忽略不计,因

ln(1 + X ) ≈ X

Y − Yˆ
将式中的 X 用 ,则 e* 可近似地表示为
替换,并结合式(5.39)
ˆ
Y

Y − Yˆ
e* ≈

即表明式中的误差项为相对误差。

26
第六章 自相关

引子

农村居民更为接近实际的边际消费倾向是什么?

为了研究农村居民人均消费 Y 和农村居民人均纯收入 X 的关系,设定模型为

β1 + β 2 X t + ut
Yt =

以《中国统计年鉴 2016》中 1990-2015 年农村居民人均消费( )和农村居民人均纯收入( )

为样本数据,用普通最小二乘法估计其参数,结果为

=Yˆt -11.1195 + 0.7835 X t

(23.4635)(0.0117)
t= (0.4739) (66.9993)
R 2 = 0.9947 F=4488.91 DW=0.5088
由估计检验结果可以看出,估计的斜率系数 β̂ 2 的标准误差非常小,t 统计量较大,说明

农村居民人均纯收入 X 对农村居民人均消费 Y 的影响非常显著。同时可决系数非常高,F 统


计量高达 4488.91,也表明模型异常的显著。这里得出农村居民的边际消费倾向为 0.7835,
这是宏观经济分析的重要参数,可以用于分析农村居民消费增长的规律,还可用于预测农村
居民未来的消费支出。
可是有人质疑:这里得出的边际消费倾向为 0.7835 的结论就一定可靠吗?尽管所用样本
数据都是真实的,但是所估计的回归系数 β̂1 和 β̂ 2 的方差及标准误差之低以及 t 统计量和 F

统计量之高,让人难以置信,所得出的结果或许是不可信的。
那么,有什么充分的理由提出这样的质疑呢?是否能用这个模型去预测农村居民未来的
消费?怎样才能估计农村居民更为接近实际的边际消费倾向呢?
前面几章的讨论中,我们假定随机误差项前后期之间是不相关的。但在经济系统中,
经济变量前后期之间很可能有关联,使得随机误差项不能满足无自相关的假定,从而带来严
重后果。本章将探讨随机误差项不满足无自相关的古典假定时的参数估计问题。

第一节 什么是自相关

一、自相关的概念
自相关(auto correlation)又称序列相关(serial correlation),是指总体回归模型的随机

误差项 u i 之间存在相关关系。前面几章中强调,在回归模型的古典假定中假设随机误差项

1
是无自相关的,即 u i 在不同观测点之间是不相关的,即

Cov (=
ui , u j ) E=
(ui u j ) 0 (i ≠ j )

如果该假定不能满足,就称 u i 与 u j 存在自相关,即不同观测点上的误差项彼此相关。

自相关的程度可用自相关系数去表示。随机误差项 u t 与滞后一期的 u t −1 的自相关系数的

计算方法和第二章式(2.3)的样本相关系数相同,由于 u t 与 u t −1 的均值为 0,自相关系数 ρ 为

∑u u t t −1
ρ= t =2
(6.1)
n n

∑u
t =2
2
t ∑u
t =2
2
t −1

式(6.1)中 u t −1 是 u t 滞后一期的随机误差项,因此,将式(6.1)计算的自相关系数 ρ

称为一阶自相关系数。

ρ 的取值范围为 − 1 ≤ ρ ≤ 1 。根据自相关系数 ρ 的符号可以判断自相关的状态,如果

ρ <0,则 ut 与 ut-1 为负相关;如果 ρ >0,则 ut 与 ut-1 为正相关;如果 ρ = 0,则 ut 与 ut-1 不


相关。
二、自相关产生的原因
1) 经济系统的惯性。自相关现象大多出现在时间序列数据中,而经济系统的经济行为
都具有时间上的惯性。例如 GDP、价格、就业等经济数据,都会随经济系统的周期而波动。
又如,在经济高涨时期,较高的经济增长率会持续一段时间,而在经济衰退期,较高的失业
率也会持续一段时间,这种情况下经济数据很可能表现为自相关。
2) 经济活动的滞后效应。滞后效应是指某一变量对另一变量的影响不仅限于当期,而
是延续若干期。由此带来变量的自相关。例如,居民当期可支配收入的增加,不会使居民的
消费水平在当期就达到应有水平,而是要经过若干期才能达到。因为人的消费观念的改变存
在一定的适应期。
3) 数据处理造成的相关。因为某些原因对数据进行了修正和内插处理,在这样的数据
序列中可能产生自相关。例如,将月度数据调整为季度数据,由于采用了加合处理,修匀了
月度数据的波动,使季度数据具有平滑性,这种平滑性可能产生自相关。对缺失的历史资料,
采用特定统计方法进行内插处理,也可能使得数据前后期相关,而产生自相关。

4) 蛛网现象。蛛网现象是微观经济学中的一个概念。它表示某种商品的供给量 Yt 受前

一期价格 Pt −1 影响而表现出来的某种规律性,即呈蛛网状收敛或发散于供需的均衡点。许多

2
农产品的供给呈现为蛛网现象,供给对价格的反应要滞后一段时间,因为供给的调整需要经
过一定的时间才能实现。如果时期 t 的价格 Pt 低于上一期的价格 Pt-1,农民就会减少时期 t+1
的生产量。如此则形成蛛网现象,此时的供给模型为

Yt = β1 + β 2 Pt −1 + ut (6.2)

这时,式(6.2)中的随机误差项 u t 可能产生自相关。
5) 模型设定偏误。如果模型中省略了某些重要的解释变量或者模型函数形式不正确,
都会产生系统误差,这种误差存在于随机误差项中,从而带来了自相关。由于该现象是由于
设定失误造成的自相关,因此,也称其为虚假自相关,这在经济计量分析中经常可能发生。
例如,本来应该用两个解释变量去解释 Y,即

Yt = β1 + β 2 X 2t + β 3 X 3t + u t (6.3)

而建立模型时,模型设定为

Yt = β1 + β 2 X 2t + ut* (6.4)

*
这样,X3t 对 Yt 的影响在式(6.4)中便归入到随机误差项 ut 中,由于 X3t 在不同观测点上是

相关的,就造成了 ut 是自相关的。
模型函数形式设定偏误也会导致自相关现象。如将本来应是 U 形成本曲线的模型设定
为线性成本曲线的模型,则会导致自相关。由设定偏误产生的自相关是一种虚假自相关,可
以通过改变模型设定予以消除。
自相关关系主要存在于时间序列数据中,但是在横截面数据中也可能会出现自相关,通
常称其为空间自相关(Spatial auto correlation)。例如,一个家庭或一个地区的消费行为可能
会影响另外一些家庭或另外一些地区,就是说不同观测点的随机误差项可能是相关的。多数
经济时间序列在较长时间内都表现为上升或下降的超势,因此大多表现为正自相关。但就自
相关本身而言,可以为正相关也可以为负相关。
三、自相关的表现形式
自相关的性质可以用自相关系数 ρ 的符号判断,即 ρ <0 为负相关, ρ >0 为正相关。
当| ρ |→1 时,表示相关的程度很高。自相关是 u1,u2,…,u n 序列自身的相关,因 n 个随

机误差项的关联形式不同而可能具有不同的自相关形式。自相关大多出现在时间序列数据
中,下面以时间序列为例说明自相关的不同表现形式。
对于样本观测期为 n 的时间序列数据,可得到总体回归函数(PRF)的随机误差项为 u1,
u2,…,u n,如果自相关形式为
u t = ρ ut-1 + vt (-1< ρ <1) (6.5)

其中, ρ 为自相关系数,vt 为满足古典假定的误差项,即 E ( vt ) = 0 , Var ( vt ) = σ ,


2

3
Cov ( vt , vt + s ) = 0 ,s≠0。因为式(6.5)中 ut-1 是 ut 滞后一期的值,则式(6.5)称为一阶自

回归形式,记为 AR(1)。式(6.5)中的 ρ 也称为一阶自相关系数。

如果式(6.5)中的随机误差项 vt 是不满足古典假定的误差项,即 vt 中包含有 ut 的成份,


例如包含有 ut-2 的影响,则需将 ut-2 包含在回归模型中,即

ut = ρ1 ut-1+ ρ 2 u t-2 + vt′ (6.6)

其中,ρ1 为一阶自相关系数,ρ 2 为二阶自相关系数,vt′ 是满足古典假定的误差项。式(6.6)

称为二阶自回归形式,记为 AR(2)。一般地,如果 u1,u2,…,u t 之间的关系为

u t = ρ1u t −1 + ρ 2 u t − 2 + L + ρ m u t − m + vt (6.7)

其中,vt 为满足古典假定的误差项。则称式(6.7)为 m 阶自回归形式,记为 AR(m)。


此外,自相关的形式可能为移动平均形式,记为 MA(n),还可能为更复杂的移动平均自
回归形式,记为 ARMA (m, n),这些是时间序列分析的专题内容,本书不作讨论。
在计量经济分析中,通常采用式(6.5)的一阶自回归形式,即假定自回归形式为一阶
自回归 AR(1)。这种假定简化了自回归形式,在实际分析中常能取得较好的效果,在本章中
主要讨论假定自相关为 AR(1)的形式。

第二节 自相关的后果

当一个线性回归模型的随机误差项存在自相关时,就违背了线性回归方程的古典假定,
如果仍然用普通最小二乘法(OLS)估计参数,将会产生严重后果。自相关产生的后果与异
方差情形类似。
一、一阶自回归形式的性质
以一元线性回归模型为例,对于

Yt = β1 + β 2 X t + u t (6.8)

假定随机误差项 ut 存在一阶自相关
ut = ρ u t-1+vt (6.9)

其中,ut 为现期随机误差,ut-1 为前期随机误差。vt 是满足古典假定的误差项,即 vt 满足零

均值 E (vt) =0,同方差 Var(vt) = σ v ,无自相关 E(vt vs) = 0(t≠s)的假定。由于随机误差项


2

ut 不可观测,我们只能用样本回归模型的残差 et 去估计自相关系数。

在大样本情况下, ∑e 2
t ≈ ∑ et2−1 , ρ 的 OLS 估计式为

4
ρˆ =
∑e e t t −1

∑e e t t −1
(6.10)
∑e ∑e 2
t
2
t −1 ∑e 2
t −1

如果将随机误差项 ut 的各期滞后值 u t −1 = ρu t − 2 + vt −1 ,u t − 2 = ρu t −3 + vt − 2 ,L , 逐次代入

(6.9)式可得

u t = vt + ρvt −1 + ρ 2 vt − 2 + L = ∑ ρ r vt − r (6.11)
r =0

式(6.11)表明随机误差项 ut 可表示为独立同分布的随机误差序列 vt,vt-1,vt-2,…的加权


和,权数分别为 1, ρ , ρ 2,…,当 0< ρ <1 时,这些权数随时间推移而呈几何衰减;而
当-1< ρ <0 时,这些权数是随时间推移而交错振荡衰减的。

在随机误差项 u t 存在一阶自回归形式的自相关时,由(6.11)式可推得


E (u t ) = ∑ ρ r E (vt − r ) = 0 (6.12)
r =0


σ 2
Var
= (ut ) ∑ ρ 2 rVar=
r =0
( vt − r ) =v
1− ρ 2
σ u2 (6.13)

(6.12)和(6.13)式表明,在 u t 为一阶自回归形式的自相关时,随机误差项 u t 依然满足零

均值、同方差的假定。

由于现期的随机误差项 vt 并不影响回归模型中随机误差项 u t 的以前各期值 ut-k(k>0),

所以 vt 与 ut − k 不相关,即有 E (vt ut − k ) = 0 。因此,由(6.9)式可以证明,随机误差项 u t 与

其以前各期 ut-k 的协方差分别为

ρσ v2
Cov (ut , ut −1 ) = (6.14)
1− ρ2

ρ 2σ v2
Cov (ut , ut −2 ) = (6.15)
1− ρ2

以此类推,可得

ρ k σ v2
Cov( u t ,u t − k ) = ρ Var( u t − k
k
)= (6.16)
1− ρ 2

这些协方差分别称为随机误差项 ut 的一阶自协方差、二阶自协方差和 k 阶自协方差,这些自


协方差均不为零,这正是存在自相关的含义。
二、自相关对参数估计的影响

5
以一元线性回归模型(6.8)为例,当 ut 满足各项古典假定时,普通最小二乘估计 β̂ 2 的

方差为

σ2
Var ( βˆ2 ) = (6.17)
∑ xt 2
首先,当随机误差项 ut 存在自相关时, β̂ 2 依然是无偏的,即 E( βˆ 2 ) = β 2 ,因为在普

通最小二乘法无偏性的证明中并不需要 u t 满足无自相关的假定。

再看 OLS 估计式的方差,式(6.8)中 β̂ 2 的最小二乘估计式为

Σx t y t Σx u
βˆ 2 = 2
= β2 + t 2t (6.18)
Σx t Σx t

可以证明(见本章附录 6.1)
n −1 n −2

2
σ
t t +1 ∑x x
t t +2 ∑x x xx
=
n
u
βˆ2 )
Var (= t 1=
n
(1 + 2 ρ
2 t 1
n
n −1
n
1 n
+ 2ρ + L + 2ρ ) (6.19)
2
t
=t 1 =t 1 =t 1
∑x2
t
2
t ∑x
=t 1
2
t ∑x ∑x
当随机误差项无自相关时, ρ = 0,此时式(6.19)等价于式(6.17)。由式(6.19)可以看

出,当存在正的自相关时,当 ρ >0,即有正相关时,对所有的 j 都有 ρ j >0。另外回归模型

中的解释变量在不同时期通常也呈正相关,即对于 xt 和 xt+j 来说 ∑x x
t t+ j 是大于 0 的。因此

式(6.19)右边括号内的值通常大于 0,式(6.19)的方差将大于式(6.17)的方差。如果仍

用 OLS 法 Var ( βˆ2 ) = σ ∑x 去计算 β̂ 2 的方差,将可能会低估存在自相关时参数估计值


2 2
t

的真实方差。可以证明,当存在自相关时,普通最小二乘估计量不再是最佳线性无偏估计量,
即它在线性无偏估计量中不是方差最小的。

此外,当随机误差项 u t 不存在自相关时,已知 σˆ =
2
∑e 2
t (n − 2) 是 ut 的方差 σ 2 的无

E (σˆ ) E[
偏估计,即 =
2
∑e 2
t − 2)] σ 2 。但是,如果随机误差项 u t 存在一阶自相关,
(n=

可以证明

E (∑ et2 ) = σ 2 [(n − 2) − (2 ρ ∑ + 2ρ 2 ∑ + L + 2 ρ n−1 ∑


xt xt +1 xt xt +2 xt xn
)]
∑x 2
t ∑x 2
t ∑x 2
t

(6.20)

当 u t 及 X t 都是正自相关时,式(6.20)中园括号内的值为正值,将使 ∑e 2
t 的值降低。这说明

6
=
如果仍用 σˆ 2
∑e
2
t (n − 2) 去估计 ut 的方差 σ 2 ,则会导致低估真实的 σ 2 。显然,这将使

得参数估计值的方差被进一步低估。
三、自相关对模型检验的影响
通过前面的讨论已知,当存在自相关时,如果忽视自相关问题,依然用满足古典假定的

OLS 法去估计参数及其方差,会低估真实的 σ ,更会低估参数估计值的方差。由于对参数


2

^
显著性检验的 t 统计量为=t ( βˆ2 − β 2 ) SE ( βˆ2 ) ~ t (n − 2) ,当参数估计值的方差被低估时,
^
其标准误差 SE ( βˆ2 ) 也将被低估,从而过高估计 t 统计量的值,会夸大所估计参数的显著性,

对本来不重要的解释变量可能误认为重要而被保留。这时通常的回归系统显著性的 t 检验将
失去意义。
类似地,由于自相关的存在,参数的最小二乘估计量是无效的,使得 F 检验和 R 2 检验
也是不可靠的。
四、自相关对模型预测的影响

模型预测的精度决定于抽样误差和总体误差项的方差 σ 。抽样误差来自于对 β̂ j 的估
2

计,在自相关情形下, β̂ j 的方差的最小二乘估计变得不可靠,由此必定加大抽样误差。同

时,在自相关情形下,对 σ 的估计
= σˆ 2 2
∑e 2
i (n − k ) 也会不可靠。由此可看出,影响预

测精度的两大因素都因自相关的存在而加大不确定性,使预测的置信区间不可靠,从而降低
了预测的精度。

第三节 自相关的检验

随机误差项存在自相关给普通最小二乘法的应用带来的后果是严重的。因此,必须设
法诊断是否存在自相关。检测回归模型是否存在自相关的常用方法有以下几种。
一、图示检验法
图示法是一种直观的诊断方法,它是对给定的回归模型直接用普通最小二乘法估计其参

数,求出残差项 et ,以 et 作为随机项 ut 的估计值,再描绘 et 的散点图,根据散点图来判断

et 的相关性。残差 et 的散点图通常有两种绘制方式。

1) 绘制 et −1 和 et 的散点图。用( et −1 , et )( t = 1,2,⋅ ⋅ ⋅, n )作为散布点绘图,如果大部分

点落在第Ⅰ、Ⅲ象限,表明随机误差项 ut 存在着正自相关,如图 6.1(a)所示。如果大部分点

落在第Ⅱ、Ⅳ象限,那么随机误差项 ut 存在着负自相关,如图 6.1(b)所示。

7
et et

O
O t et −1

(a)正序列相关(正自相关)

et et

O t O et −1

(b)负序列相关(负自相关)

图 6.1 残差项的序列相关性

2) 按照时间顺序绘制回归残差项 et 的图形。如果 et ( t = 1,2,⋅ ⋅ ⋅, n )随着 t 的变化逐次有

规律地变化,呈现锯齿形或循环形状的变化,就可判断 et 存在相关,表明 ut 存在着自相关。

如果 et 随着 t 的变化逐次变化并不频繁地改变符号,而是几个正的 et 后面跟着几个负的,则

表明随机误差项 ut 存在正自相关,如图 6.1(a)所示。如果 et 随着 t 的变化逐次变化并不断地

改变符号,那么随机误差项 ut 存在负自相关;如图 6.1(b)所示。

二、DW 检验法
DW 检验是 J . Durbin(杜宾)和 G . S .Watson(沃特森)于 1951 年提出的一种检验方法。DW

检验方法是检验自相关的常用方法,许多计量经济学和统计学计算机软件都提供 DW 值。

DW 检验法的前提条件是:

1)解释变量 X 为非随机的;

2)随机误差项为一阶自回归形式,即

ut ρ ut −1 + vt
= ( vt 满足古典假定) (6.21)

3)线性模型的解释变量中不包含滞后的被解释变量,例如不应出现下列形式:

Yt = β1 + β 2 X t + β 3Yt −1 + u t

8
4)截距项不为零,即只适用于有常数项的回归模型;

5)数据序列无缺失项。

为了检验序列的相关性,构造的原假设是 H 0 : ρ = 0 。为了检验这一假设,构造 DW

统计量,首先要计算回归估计式的残差 et ,定义 DW 统计量为

∑( e t − et −1 ) 2
DW = t =2
n
(6.22)
∑e t =1
2
t

其中, et= Yt − Yˆt , t= 1, 2, ⋅⋅⋅, n 。


由式 (6.22)可得
n n n

∑ et2 + ∑ et2−1 − 2∑ et et −1
DW = t =2 t =2
n
t =2
(6.23)
∑e
t =1
2
t

n n n
如果认为 ∑ et2 ≈ ∑ et2−1 ≈ ∑ et2 ,则由 式(6.23)得
t =2 t =2 t =1

 n

 ∑ et et −1 
DW ≈ 2 1 − t = 2n  (6.24)
 2 
 ∑t =1
et 

n n n
同理,在认为 ∑ et2 ≈ ∑ et2−1 ≈ ∑ et2 时
t =2 t =2 t =1

∑e e t t −1
ρ̂ ≈ t =2
n
(6.25)
∑e t =1
2
t

因此, DW ≈ 2(1 − ρˆ ) (6.26)

所以,DW 值与 ρ̂ 的对应关系如表 6.1 所示。

表 6.1 DW 值与 ρ̂ 的值的对应关系

ρ̂ DW

9
-1 4
(-1,0) (2,4)
0 2
(0,1) (0,2)
1 0
由上述讨论可知 DW 的取值范围为0≤DW≤4。

根据样本容量 n 和解释变量的数目 k ' (不包括常数项),查 DW 分布表,可得临界值 d L 和

d U ,然后依下列准则考察计算的 DW 值,以决定模型的自相关状态(见表 6.2)。

表 6.2 DW 检验决策规则
DW 值范围 自相关状态
0≤DW≤ d L 误差项 u1 , u2 , ⋅⋅⋅, un 间存在正相关
d L <DW≤ d U 不能判定是否有自相关
d U <DW<4- d U 误差项 u1 , u2 , ⋅⋅⋅, un 间无自相关
4- d U ≤DW<4- d L 不能判定是否有自相关
4- d L ≤DW≤4 误差项 u1 , u2 , ⋅⋅⋅, un 间存在负相关
表 6.2 可以用示意图更加直观地表示出来,如图 6.2 所示。

正自相关 不能确定 无自相关 不能确定 负自相关

0 dL dU 4- d U 4- d L 4

图 6.2 DW 检验示意图
需要注意的是,DW 检验尽管有着广泛的应用,但也有明显的缺点和局限性。
1)DW 检验有两个不能确定的区域,一旦 DW 值落在这两个区域,就无法判断。这时,
只有增大样本容量或选取其他方法;
2)DW 统计量的上、下界表要求 n≥15,这是因为样本如果再小,利用残差就很难对
自相关的存在性做出比较正确的诊断;
3)DW 检验不适应随机误差项具有高阶序列相关的检验;
4)DW 检验有运用的前提条件,只有符合这些条件 DW 检验才是有效的。
三、Breusch-Godfrey 检验(LM 检验)
统计学家 Breusch 和 Godfrey 利用拉格朗日乘数(LM)原理,提出了检验自相关的方法,
也称为 BG 检验。此检验的思想,是基于所分析模型普通最小二乘估计的残差对解释变量和
一定数量滞后残差的辅助回归,如果滞后残差足以解释当前残差的变异,就拒绝误差项无自
相关的原假设。

对于线性回归模型

Yt = β1 + β 2 X 2 t + β 3 X 3t + L + β k X kt + ut (6.27)

10
假设误差项 ut : N (0, σ ) , 同时 u t 服从 p 阶自回归模式
2

u t = ρ1u t −1 + ρ 2 u t − 2 + L + ρ p u t − p + vt (6.28)

其中,vt 是满足古典假定的误差项。

BG 检验的原假设为 H 0 : ρ=
1 ρ=
2 L= ρ=
p 0 ,即不存在自相关,检验的具体步骤

如下:

1) 用 OLS 估计原模型式(6.27),并得到残差 et 。

2) 用残差 et 对解释变量 X 及滞后残差 et −i 做辅助回归,即

et = α1 + α 2 X 2 t + α 3 X 3t + L + α k X kt + ρˆ1et −1 + ρˆ 2et −2 + L + ρˆ p et − p + vt (6.29)

式(6.27)样本容量为 n,式(6.29)的有效样本为 n-p 个。为了避免由于 et 取滞后值而缺失

有效样本,不影响 LM 统计量的渐近性,并使 LM 统计量性质更好,将样本数据 X 和残差 et

的 n 个样本以前的 p 期初始值预处理为零 1,辅助回归的实际样本容量为 T=(n+p)-p=n。

2 2
3) 计算辅助回归的可决系数 R ,构建统计量 LM= TR ,其中 T 为辅助回归实际样本

容量,p 为 u t 的自回归阶数。在将缺失的样本数据 X 和残差 et 的前 p 期初始值预处理为零

后,在大样本条件下,

LM= TR ~
2
χ p2 (6.30)

即 TR 服从自由度为 p 的 χ 分布。在给定显著性水平下,若 TR > χα2 ( p ) ,则拒绝原假设,


2 2 2

此时式(6.29)中至少有一个 ρ 在统计上显著不为 0,说明存在自相关;。若 TR < χα2 ( p ) ,


2

则表明不存在自相关。
与 DW 检验不同,BG 检验有一些特点:1)BG 检验不只限于一阶自相关,还适合于高

阶自相关的检验;2)适合检验模型的解释变量中有滞后被解释变量如 Yt −1 、Yt −2 的情况;3)

BG 检验的滞后长度 p 不能先验确定。实际检验中可逐次向更高阶检验,并结合辅助回归中
滞后项参数的显著性去帮助判断自相关的阶数。

第四节 自相关的补救
1
这样处理的原因,Eviews 中给出的解释为:“Following the suggestion by Davidson and MacKinnon (1993),
EViews sets any presample values of the residuals to 0. This approach does not affect the asymptotic distribution
of the statistic, and Davidson and MacKinnon argue that doing so provides a test statistic which has better finite
sample properties than an approach which drops the initial observations.”

11
对于模型设定偏误造成的自相关,应该通过改变模型的设定去消除。对于设定正确的
模型,如果随机误差项有自相关,则需采用广义差分法予以消除。
一、广义差分法
由于随机误差项 ut 是不可观测的,通常我们假定 ut 为一阶自回归形式,即
ut = ρ ut-1 + vt
其中,| ρ |<1,vt 为满足古典假定的误差项。
当自相关系数 ρ 为已知时,可使用广义差分法解决自相关问题。以一元线性回归模型

为例

Yt = β1 + β 2 X t + u t (6.31)

将模型式(6.31)滞后一期可得

Yt −1 = β1 + β 2 X t −1 + u t −1 (6.32)

用 ρ 乘式(6.32)两边,得

ρYt −1 =
ρβ1 + ρβ 2 X t −1 + ρ ut −1 (6.33)

用式(6.31)减去式(6.33)得

Yt − ρYt −1 = β1 (1 − ρ ) + β 2 ( X t − ρX t −1 ) + u t − ρu t −1 (6.34)

,式(6.34)中的 ut − ρ ut −1 =
由式(6.21) vt 是满足古典假定的误差项。因此,模型(6.34)

满足古典假定,随机误差项 ut − ρ ut −1 =
vt 无自相关。

令 Yt = Yt − ρYt −1 , X t = X t − ρX t −1 , β 1 = β1 (1 − ρ ) , β 2* = β 2 则式(6.34) 可表
* * *

示为

Yt * = β1* + β 2* X t* + vt (6.35)

对模型式(6.35)使用普通最小二乘估计,可得到参数的最佳线性无偏估计量。因为式
(6.34)中被解释变量与解释变量均为现期值减去前期值的一部分,所以称为广义差分方程。
如果误差项的自相关形式是 AR(p)
,即 p 阶自相关,则需要使用 p 阶广义差分。
在进行广义差分时,解释变量 X 与被解释变量 Y 均以差分形式出现,因而样本容量由 n
减少为 n − 1 ,即丢失了第一个观测值。如果样本容量较大,减少一个观测值对估计结果影
响不大。但是,如果样本容量较小,则会对估计精度产生较大影响。此时,可采用普莱斯—

温斯滕(Prais-Winsten)变换,将第一个观测值分别变换为 Y1 1 − ρ 2 和X 1 1 − ρ 2 ,补充到

差分序列 Yt * , X t* 中,再使用普通最小二乘法估计参数。

12
二、自相关系数 ρ 的确定

在实际应用中,自相关系数 ρ 往往是未知的,必须通过一定的方法去估计 ρ 。最简单


的方法是依据 DW 统计量去估计 ρ 。由(6.26)式 DW 与 ρ 的关系可知
DW
ρˆ = 1 − (6.36)
2
(6.36)式得到的只是一个粗略的结果,这样得到的 ρ̂ 只是对 ρ 精度不高的估计,
但是,

根本原因在于对有自相关的回归模型使用了普通最小二乘法。为了得到 ρ 的更精确的估计

值,可采用科克伦—奥克特迭代法或德宾两步法。
1.科克伦—奥克特(Cochrane—Orcutt)迭代法
科克伦—奥克特迭代法的基本思想是通过逐次迭代去寻求更为满意的 ρ 的估计值,然

后再采用广义差分法。具体来说,该方法是利用残差 et 去估计未知的 ρ 。

对于一元线性回归模型 Yt = β1 + β 2 X t + u t , 假定 ut 为一阶自回归形式,即

ut = ρ u t-1+vt (6.37)
科克伦—奥克特迭代法估计 ρ 的步骤如下:

第一步,使用 OLS 法估计模型 Yt = β1 + β 2 X t + u t ,并计算残差 et(1)

et(1) = Yt − Yˆt = Yt − ( βˆ 1 + βˆ 2 X t )
(1)
第二步,利用残差 et 作如下的回归

et(1) = ρ̂ (1) et(−11) + vt (6.38)

第三步,用 OLS 法估计式(6.38)中的 ρ̂


(1)
,对模型式(6.30)进行广义差分,即

Yt − ρˆ (1)Yt −1 = β1 (1 − ρˆ (1) ) + β 2 ( X t − ρˆ (1) X t −1 ) + u t − ρˆ (1) u t −1 (6.39)

令 Yt = Yt − ρˆ Yt −1 , X t = X t − ρˆ X t −1 , β1* = β1 (1 − ρˆ (1) ) , β 2* = β 2 ,对式(6.39)


* (1) * (1)

使用 OLS 法,可得样本回归函数为

Yˆt * = βˆ1* + βˆ 2* X t* + et( 2 ) (6.40)

第四步,由前一步估计的结果有 βˆ1 = βˆ1 /(1 − ρˆ ) 和 βˆ2 = βˆ2 ,将 βˆ1 , βˆ 2 代入原回归方


* (1) *

( 3)
程式(6.30),求得新的残差 et

et(3) = Yt − βˆ1 − βˆ2 X t (6.41)

13
( 3)
第五步,利用残差 et 作回归

et(3) = ρ ( 2 )et(−31) + vt (6.42)

用 OLS 法估计的 ρ̂ 是对 ρ 的第二轮估计值。


( 2)

当不能确认 ρ̂ 是否是 ρ 的最佳估计值时,继续迭代估计 ρ 的第三轮估计值 ρ̂


( 2) ( 3)
。直

到估计的 ρˆ 与 ρˆ
(k ) ( k −1)
相差很小时,收敛并满足精度要求,或回归所得 DW 统计量说明已不

存在自相关时为止。通常,经过迭代很快就能得到有较高精度的 ρ̂ ,用作广义差分对自相

关的修正效果也较好。
2.德宾两步法
将广义差分方程式(6.33)表示为

Yt = β1 (1 − ρ ) + β 2 X t − ρβ 2 X t −1 + ρYt −1 + vt (6.43)

采用如下的两个步骤消除自相关。
第一步,将式(6.43)作为一个多元回归模型,使用普通最小二乘法估计其参数。把

Yt-1 的回归系数 ρ̂ 看作 ρ 的一个估计值,它是 ρ 的一个有偏、一致估计。

第二步,利用估计的 ρ̂ 进行广义差分。求得序列 Yt = Yt − ρˆYt −1 和 X t = X t − ρˆX t −1 ,


* *

然后使用 OLS 法对广义差分方程估计参数,求得最佳线性无偏估计量。

第五节 案例分析

一、研究目的
改革开放以来,中国农村居民的收入和消费支出都在快速增长。2015 年农村居民人均
可支配收入 11422 元,农村居民人均消费 9223 元,中国乡村人口占总人口的 43.90%,农村
居民收入和消费的状况是令人关注的经济问题。为了研究和预测农村居民消费水平的发展趋
势,同时也为了分析本章引子中提出的“农村居民更为接近实际的边际消费倾向是什么”的
问题,需要对中国农村居民收入—消费模型作更深入分析。
二、模型设定
影响农村居民消费行为可能会有众多因素,但其中最主要的还是农村居民的收入水平,
由于受各种条件的限制,通常首先考虑引入农村居民收入作为解释变量,即消费模型可设定
为:

Yt = β1 + β 2 X t + ut

14
式中,Yt 为农村居民人均消费支出,X t 为农村居民人均纯收入或可支配收入 2,ut 为随机误
差项。表 6.3 是从《中国统计年鉴 2016》收集的中国农村居民 1990~2015 年的收入与消费
数据。
表 6.3 1990—2015 年农村居民人均收入和消费 单位:元
年份 全年农村居民人 全年农村居民 消费价格 农村居民人均实 农村居民人均实
均纯收入或可支 人均消费性支 指数 际纯收入或可支 际消费性支出
配收入 (现价) 出(现价) (1990 年 配收入(1990 年 (1990 年可比
为 100) 可比价)X 价)Y
1990 686.31 584.63 100.0 686.31 584.63
1991 708.55 619.79 102.3 692.61 605.85
1992 783.99 659.01 107.1 732.11 615.40
1993 921.62 769.65 121.7 757.01 632.19
1994 1220.98 1016.81 150.2 812.84 676.92
1995 1577.74 1310.36 176.5 893.91 742.42
1996 1926.07 1572.08 190.4 1011.43 825.54
1997 2090.13 1617.15 195.2 1070.68 828.39
1998 2161.98 1590.33 193.3 1118.59 822.83
1999 2210.34 1577.42 190.4 1161.08 828.61
2000 2253.40 1670.10 190.2 1184.83 878.13
2001 2366.40 1741.10 191.7 1234.42 908.23
2002 2475.60 1834.30 190.9 1296.71 960.80
2003 2622.20 1943.30 193.9 1352.05 1002.00
2004 2936.40 2184.70 201.5 1457.17 1084.14
2005 3254.90 2555.40 205.1 1586.61 1245.63
2006 3587.00 2829.00 208.2 1722.55 1358.55
2007 4140.36 3223.90 218.2 1897.23 1477.29
2008 4760.60 3660.70 231.1 2060.22 1584.22
2009 5153.20 3993.50 229.4 2246.02 1740.57
2010 5919.00 4381.80 237.0 2497.39 1848.80
2011 6977.30 5221.10 249.8 2792.61 2089.71
2012 7916.58 5908.02 256.1 3091.27 2306.97
2013 9429.60 7485.20 263.3 3581.78 2843.21
2014 10488.90 8382.60 268.0 3913.71 3127.79
2015 11421.70 9222.60 271.5 4207.07 3397.05
为消除价格变动因素对农村居民收入和消费支出的影响,这里我们使用经消费价格指数

进行调整后的 1990 年可比价格计算的人均纯收入和人均消费支出数据进行回归。根据表 6.3

中调整后的 1990 年可比价格计的农村居民人均纯收入或可支配收入(X)和农村居民人均消

2 2012 年及以前年份,中国的住户调查一直分城乡分别开展。城镇调查城镇居民可支配收入,农村调查农
村居民纯收入。从 2012 年四季度起,国家统计局对分别进行的城乡住户调查实施了一体化改革。所以,
2013 年前为“农村人均纯收入”数据,2013 年后为“农村人均可支配收入”数据。

15
费支出(Y)的数据,采用普通最小二乘法估计消费模型,回归结果

Yˆt =
−11.1195 + 0.7835 X t

(23.4635) (0.0117)

t= (-0.4739) (66.9993)
R 2 =0.9947 R 2 =0.9945 F=4488.911 DW=0.5088
图(6.3)回归结果的可决系数为0.9947,F统计量为4488.91,回归系数的t检验很显著。

但是,DW=0.5088,对于样本量为26,一个解释变量的模型,在5%的显著水平下查DW统计表

可知,dL=1.302,dU=1.461,模型中 DW =0.5088 < d L ,显然此消费模型中存在自相关。这从

残差图也可看出,点击EViews回归方程输出窗口的“Resids”按钮,可得到残差图6.3,图

中残差的变动呈现明显的系统模式,连续为正和连续为负,表明残差项存在一阶正自相关。

图 6.3 残差图
还可再用BG检验做自相关检验。在EViews中,在式(6.44)回归输出结果中点击

“View/Residual Diagnostics /Series Correlation LM Test”,在“lags to includes”

中选取滞后阶数,如“2”,回车即得BG检验结果(图6.4)

图 6.4 BG 检验结果

16
2
图 6.4 显示 LM=TR =26×0.545376=14.17977,其 p 值为 0.0008,也表明存在自相关。

在存在明显自相关的情况下,违反了线性回归的古典假定,可见,此模型中的 t 统计量和 F

统计量的结论并不可靠,所估计的边际消费倾向不一定符合实际,需要采取补救措施。

三、自相关问题的处理

为解决自相关问题,可从多种方法确定自相关系数,采用广义差分法。

(1)由 DW 统计量计算 ρ̂

从式 6.44 得到 DW=0.5088,可计算 ρ̂

DW 0.5088
ρˆ ≈ 1 − = 1− = 0.7456
2 2
广义差分回归

Yt − 0.7456Yt −1 =β(
1 1 − 0.7456)+ β(
2 X t − 0.7456 X t −1)

在 Eviews 命令栏中直接输入“ls Y-0.7456*Y(-1) c X-0.7456*X(-1)”/回车,即得广

义差分回归的输出结果

Yt − 0.7456Yt −1 =-23.77857+0.823(
0 X t − 0.7456 X t −1)

(15.0805) (0.0231)

t= (-1.5768) (35.6204)

R 2 =0.9822 R 2 =0.9814 F=1268.81 DW=1.7065

由于使用了广义差分,样本容量减少了1个,为25个。查5%显著水平的DW统计表可知,

dL=1.288,dU=1.454,模型中DW=1.7065,dU<DW<4-dU,说明在5%显著性水平下,此广义差分模
2
型中已经无自相关。可决系数R 、t、F统计量也均以达到合理水平。

可计算出
-23.7786
β̂1 ≈ =-93.4693
1-0.7456

所以,由 DW 统计量计算 ρ̂ 回归结果为

Yˆt =
−93.4693 + 0.8230 X t

(2)用残差序列估计 ρ̂

17
由农村居民人均消费支出和农村居民人均纯收入或可支配收入的回归,已得到回归残差

序列“resid”, 为估计自相关系数 ρ,生成变量“e=resid”,在 EViews 命令栏中输入

“ls e e(-1)”,可得回归方程

eˆt = 0.7641et −1 (6.45)

由式(6.45)可知 ρˆ =0.7641 ,对原模型进行广义差分回归

Yt − 0.7641Yt −1 =β(
1 1 − 0.7641)+ β(
2 X t − 0.7641X t −1) (6.46)

在 Eviews 命令栏中直接输入“ls Y-0.7641*Y(-1) c X-0.7641*X(-1)”/回车,即得回归的


结果。
Yt − 0.7641Yt −1 =-23.8958+0.8260
(X t − 0.7641X t −1)

(14.9548) (0.0242)

t= (-1.5979)(34.1546)

R 2 =0.9807 R 2 =0.9798 F=1166.538 DW=1.7429


由于使用了广义差分数据,样本容量减少了1个,为25个。查5%显著水平的DW统计表可

知,dL=1.288,dU=1.454,模型中DW=1.7429,dU<DW<4-dU,说明在5%显著性水平下,此广义差
2
分模型中已经无自相关。可决系数R 、t、F统计量也均以达到合理水平。

由差分方程式(6.46)有
-23.8958
β̂1 = =-101.2963
1-0.7641
所以,用残差序列估计 ρ̂ 得到的农村居民消费模型为

Yˆt =
−101.2963 + 0.8260 X t

(3)德宾两步法估计 ρ̂

b1 ρYt −1 + b2 X t + b3 X t −1 + ε t ,得到
第一步,作回归 Yt =+

Yˆt =-12.4901 + 0.8838Yt −1 + 1.0058X t -0.9260X t −1

第二步,由 Yt −1 参数的估计值 ρˆ ≈ 0.8838 ,作广义差分回归结果为

Yt − 0.8838Yt −1 =-24.2374+0.8579
(X t − 0.8838 X t −1)

(14.0459) (0.0354)

t= (-1.7256)(24.2277)

18
R 2 =0.9623 R 2 =0.9607 F=586.981 DW=1.9312

由广义差分回归结果中 DW=1.9312 可以判断,dL = 1.288,dU=1.454, dU <DW<4-dU,


说明在 5%显著性水平下此广义差分后模型中已无自相关。
同理可计算出
-24.23744
β̂1 = =-208.5838
1-0.8838
所以,由德宾两步法得到农村居民消费模型为

Yˆt =
−208.5838 + 0.8579 X t

(4)科克伦—奥克特迭代法
若使用科克伦—奥克特(Cochrane—Orcutt)迭代法作广义差分回归,可在 EViews 的
命令栏输入“LS Y C X AR (1)”/回车,即自动迭代得科克伦—奥克特迭代法估计结果(图 6.5)。

图 6.5 科克伦-奥克特法估计结果
由图 6.5 中 DW=1.9668 可以判断,dL = 1.288, dU = 1.454, dU <DW<4-dU,说明在 5%
显著性水平下此广义差分模型中已无自相关。由科克伦-奥克特法得到农村居民消费模型为

Yˆt =
−312.2273 + 0.8771X t

(586.5228) (0.0901)
t =(-0.5323) (9.7332)

R 2 =0.9978 R 2 =0.9976 F=5016.198 DW=1.9668

对比四种处理自相关方法的结果,虽然几种方法都能消除自相关,但是由DW统计量和残

差估计的 ρ̂ 只是精度不高的估计,而本案例中样本数有限,对自相关系数 ρ̂ 估计的精度也

受限。相对来说,本案例中采用德宾两步法和科克伦—奥克特迭代法处理自相关的效果可能

19
更好。所以,可以认为1990—2015年中国农村居民更为接近实际的边际消费倾向应在0.87

左右,即消除价格变动因素后,以1990年可比价格计算的农民人均纯收入每增加1元,平均

来说人均消费支出将增加0.87元左右。

本章小结
1.当总体回归模型的随机误差项在不同观测点上彼此相关时就产生了自相关问题。
2.时间序列的惯性、经济活动的滞后效应、模型设定错误、数据的处理等多种原因都
可能导致出现自相关。
3.在出现自相关时,普通最小二乘估计量依然是无偏、一致的,但不再是有效的。如
果仍用 OLS 法计算参数估计值的方差,将可能会低估存在自相关时参数估计值的真实方差。

而且会因低估真实的 σ ,导致参数估计值的方差被进一步低估。由于真实 σ 的低估和参数


2 2

估计值方差的低估,通常的 t 检验和 F 检验都不能有效地使用,也使预测的置信区间不可靠,


降低了预测的精度。

4.随机误差项的自相关形式决定于其关联形式,可以为 m 阶自回归形式 m = 1,2L m) ,

即 AR (m) 。为了研究问题的方便和考虑实际问题的代表意义,通常将自相关设定为一阶自

相关即 AR(1)模式。用一阶自相关系数 ρ 表示自相关的程度与方向。

5.由于 ut 不可观测,通常使用 ut 的估计量 et 判断 ut 的特性。绘制 et −1 , et 的散点图或

按照时间顺序绘制回归残差项 et 的图形,可以判断自相关的存在。判断自相关的存在最常

用的方法是依据 et 计算的 DW 统计量,但要注意 DW 检验法的前提条件和局限性。


6.如果自相关系数 ρ 是已知的,我们可以使用广义差分法消除序列相关。
7.如果自相关系数 ρ 是未知的,我们可采用科克伦—奥克特迭代法或德宾两步法求得
ρ 的估计值,然后用广义差分法消除序列相关。
8.主要公式见表 6.4。
表 6.4 主要公式表
名称 公式
n n n
自相关系数 ρ = ∑ ut ut −1 (
t =2
∑u
t =2
2
t ∑u
t =2
2
t −1 )

一阶自回归形式 AR(1) u t = ρ ut-1 + vt

m 阶自回归形式 AR(m) u t = ρ1u t −1 + ρ 2 u t − 2 + L + ρ m u t − m + vt

20
n −1 n−2
自相关时参数估计式的方差
Var ( βˆ2 ) = σ
2 ∑x x t t +1 ∑x x t t +2
x1 xn
n
u
(1 + 2 ρ t =1
n
+ 2ρ 2 t =1
n
+ L +2 ρ n −1 n
)
∑x 2
t ∑x 2
t ∑x 2
t ∑ xt2
t =1
t =1 t =1 t =1

DW 统计量 n
DW = ∑ (et − et −1 ) 2
n

t =2
∑e
t =1
2
t

DW ≈ 2(1 − ρˆ )
DW 值与 ρ̂ 的关系

广义差分 Yt − ρYt −1 = β1 (1 − ρ ) + β 2 ( X t − ρX t −1 ) + u t − ρu t −1

思考题
6.1 判断以下陈述的真伪,并给出合理的解释。
1.当回归模型随机误差项有自相关时,普通最小二乘估计量是有偏误的和非有效的。
2.DW 检验假定随机误差项 ui 的方差是同方差。
3.当自相关为非 AR(1)自相关时,应使用 Breusch-Godfrey 检验。
4.当回归模型随机误差项有自相关时,普通最小二乘估计的预测值的方差和标准误
差不再是有效的。

6.2 忽视自相关问题,依然用满足古典假定的 OLS 法去估计参数及其方差,会导致哪

些后果?

6.3 如何使用 DW 统计量来进行自相关检验?该检验方法有哪些前提条件和局限性?


6.4 DW 检验和 BG 检验的思想分别是什么?BG 检验和 DW 检验分别有哪些优劣?
6.5 对于有四个解释变量的回归模型

Yt = β 0 + β1 X 1t + β 2 X 2t + β 3 X 3t + β 4 X 4t + u t

如果样本量 n=50, 当 DW 统计量分别为如下数值时,判断模型中的自相关状况。


1. DW=1.05 2. DW=1.40 3. DW=2.50 4.DW=3.97

6.6 什么是回归模型中的虚假自相关?如何判别真正的自相关和虚假的自相关?

6.7 如何确定自相关系数?若随机误差项存在一阶自相关,可选用哪些方法确定自相关

系数?若存在任意阶自相关又可选用什么方法?

6.8 在回归模型 Yt = β1 + β 2 X t + u t 中,如果 u t 无自相关,却错误地判定模型中有一

阶自相关,即 u t = ρu t −1 + vt ,并使用了广义差分模型

Yt − Yt −1 = β1 ( 1 − ρ ) + β 2 ( X t − ρX t −1 ) + vt ,将会产生什么问题?

练习题

21
6.1 表 6.5 是中国 1985-2016 年货物进出口贸易总额( )与国内生产总值( )的数据。

表 6.5 中国进出口贸易总额和国内生产总值 单位:亿元


年份 货物进出口贸 国内生产总值 年份 货物进出口贸 国内生产总值
易总额(Y) (X) 易总额(Y) (X)
1985 2066.71 9098.9 2001 42183.62 110863.1
1986 2580.4 10376.2 2002 51378.15 121717.4
1987 3084.2 12174.6 2003 70483.45 137422.0
1988 3821.8 15180.4 2004 95539.09 161840.2
1989 4155.9 17179.7 2005 116921.77 187318.9
1990 5560.12 18872.9 2006 140974.74 219438.5
1991 7225.75 22005.6 2007 166924.07 270232.3
1992 9119.62 27194.5 2008 179921.47 319515.5
1993 11271.02 35673.2 2009 150648.06 349081.4
1994 20381.9 48637.5 2010 201722.34 413030.3
1995 23499.94 61339.9 2011 236401.95 489300.6
1996 24133.86 71813.6 2012 244160.21 540367.4
1997 26967.24 79715.0 2013 258168.89 595244.4
1998 26849.68 85195.5 2014 264241.77 643974.0
1999 29896.23 90564.4 2015 245502.93 689052.1
2000 39273.25 100280.1 2016 243386.46 744127.2
资料来源:《中国统计年鉴 2017》

(1)建立货物进出口贸易总额的对数 对国内生产总值的对数 的回归方程;

(2)检测模型的自相关性;
(3)采用广义差分法处理模型中的自相关问题。
6.2 表 6.6 是中国 1985-2016 年国家财政一般公共预算收入、各项税收、经济活动人
口(劳动力)以及国民总收入的数据。
表 6.6 中国财政收入等数据
一般公共预算收入 各项税收合计 经济活动人口 国民总收入
年份
(亿元)Y (亿元)X2 (万人)X3 (亿元)X4
1985 2004.82 2040.79 50112 9123.60
1986 2122.01 2090.73 51546 10375.40
1987 2199.35 2140.36 53060 12166.60
1988 2357.24 2390.47 54630 15174.40
1989 2664.90 2727.40 55707 17188.40
1990 2937.10 2821.86 65323 18923.30
1991 3149.48 2990.17 66091 22050.30
1992 3483.37 3296.91 66782 27208.20
1993 4348.95 4255.30 67468 35599.20
1994 5218.10 5126.88 68135 48548.20
1995 6242.20 6038.04 68855 60356.60

22
1996 7407.99 6909.82 69765 70779.60
1997 8651.14 8234.04 70800 78802.90
1998 9875.95 9262.80 72087 83817.60
1999 11444.08 10682.58 72791 89366.50
2000 13395.23 12581.51 73992 99066.10
2001 16386.04 15301.38 73,884 109276.20
2002 18903.64 17636.45 74492 120480.40
2003 21715.25 20017.31 74911 136576.30
2004 26396.47 24165.68 75290 161415.40
2005 31649.29 28778.54 76120 185998.90
2006 38760.20 34804.35 76315 219028.50
2007 51321.78 45621.97 76531 270844.00
2008 61330.35 54223.79 77046 321500.50
2009 68518.30 59521.59 77510 348498.50
2010 83101.51 73210.79 78388 411265.20
2011 103874.43 89738.39 78579 484753.20
2012 117253.52 100614.28 78894 539116.5
2013 129209.64 110530.70 79300 590422.4
2014 140370.03 119175.31 79690 644791.1
2015 152269.23 124922.20 80091 686449.6
2016 159604.97 130360.73 80694 741140.4
资料来源:《中国统计年鉴 2017》

(1)建立国家财政一般公共预算收入与各项税收、经济活动人口及国民总收入的回归方程。

(2)检测模型是否存在自相关性,并修正模型。

6.3 一般来讲,实际收入对于货币需求具有正向的影响,而利率则会抑制货币需求。若

以货币供应量中的准货币M1表示货币余额,以国内生产总值(GDP)表示实际收入,以一年

期存款的基准利率(R)表示持有货币的成本,并取得了1990—2015年中国的准货币、国内

生产总值、消费者价格指数、一年期存款基准利率的数据,见表6.7。

表6.7 中国1990—2015年准货币等数据
年份 准货币 M1 国内生产总值 消费者价格指数 一年期存款基
(亿元) GDP(亿元) CPI 准利率 R
1990 8342.70 18667.82 100.00 9.48
1991 10716.60 21781.50 102.30 7.92
1992 13670.70 26923.48 107.09 7.56
1993 18599.40 35333.92 121.74 9.54
1994 26382.80 48197.86 150.21 10.98
1995 36763.40 60793.73 176.50 10.98
1996 47580.10 71176.59 190.43 9.07
1997 56169.00 78973.03 195.22 7.02

23
1998 65544.90 84402.28 193.28 5.00
1999 74060.60 89677.05 190.37 2.89
2000 81463.20 99214.55 190.19 2.25
2001 98430.30 109655.17 191.70 2.25
2002 114125.20 120332.69 190.91 2.00
2003 137104.30 135822.76 193.94 1.98
2004 158137.20 159878.34 201.51 2.05
2005 191476.91 183867.88 205.15 2.25
2006 219568.46 210870.99 208.24 2.36
2007 250882.13 270232.30 218.23 3.47
2008 308949.47 319515.50 231.07 3.06
2009 388778.71 349081.40 229.44 2.25
2010 459230.25 413030.30 237.01 2.63
2011 561743.20 489300.60 249.85 3.25
2012 665484.57 540367.40 256.09 3.13
2013 769233.93 595244.40 263.27 3.00
2014 880318.40 643974.00 268.00 2.75
2015 991300.00 689052.10 271.49 2.00
资料来源:《中国统计年鉴2016》。

(1)建立准货币M1对国内生产总值及一年期存款基准利率的货币需求回归方程。

(2)检测并处理模型可能的自相关性;

6.4 影响居民存款余额的因素很多,考虑到研究目的,这里仅引入国内生产总值指数作

为解释变量将模型设定为:

β1 + β 2 X t + ut
Yt =

式中,Yt 为年末居民存款余额;Xt 为国内生产总值指数;ut 为随机误差项。表 6.8 是中国 1990~

2014 年的年末居民存款余额与国内生产总值指数数据。

表 6.8 1990—2014 年中国居民存款余额与国内生产总值指数数据


年份 年末存款余额 国内生产总值指 年份 年末存款余额 国内生产总值指
亿元,Y 数(以 1990 年为 亿元,Y 数(以 1990 年为
100)X 100)X

1990 7119.60 100.00 2003 103617.65 350.83


1991 9244.90 109.29 2004 119555.39 386.31
1992 11757.30 124.83 2005 141050.99 430.33
1993 15203.50 142.14 2006 161587.30 485.07
1994 21518.80 160.70 2007 172534.19 554.10
1995 29662.30 178.29 2008 217885.35 607.59
1996 38520.80 195.99 2009 260771.66 664.70
1997 46279.80 214.08 2010 303302.49 735.40
1998 53407.47 230.86 2011 343635.89 805.53

24
1999 59621.83 248.56 2012 399551.00 868.82
2000 64332.38 269.67 2013 447601.57 936.22
2001 73762.43 292.16 2014 485261.30 1004.54
2002 86910.65 318.84
资料来源:《中国统计年鉴 2015》

(1)建立居民存款对国内生产总值指数的回归方程。

(2)检测模型的自相关性;

(3)采用广义差分法处理模型中的自相关问题。

6.5 为了分析股票市场繁荣程度与宏观经济运行情况之间的联系,探讨股票价格指数与

国内生产总值的关系。表 6.9 为美国 1981~2006 年股票价格指数( Y )和国内生产总值 GDP

( X )的数据。

表 6.9 美国 1981~2006 年间股票价格指数和 GDP 的数据


年份 股票价格指数 国内生产总值 年份 股票价格指数 国内生产总值
Y X Y X
(10 亿美元) (10 亿美元)
1981 782.62 3128.4 1994 2687.02 7072.2
1982 728.84 3255.0 1995 3078.56 7397.7
1983 979.52 3536.7 1996 3787.20 7816.9
1984 977.33 3933.2 1997 4827.35 8304.3
1985 1142.97 4220.3 1998 5818.26 8747.0
1986 1438.02 4462.8 1999 6546.81 9268.4
1987 1709.79 4739.5 2000 6805.89 9817.0
1988 1585.14 5103.8 2001 6397.85 10128.0
1989 1903.36 5484.4 2002 5578.89 10469.6
1990 1939.47 5803.1 2003 5447.46 10960.8
1991 2181.72 5995.9 2004 6612.62 11685.9
1992 2421.51 6337.7 2005 7349.00 12433.9
1993 2638.96 6657.4 2006 8357.99 13194.7

β1 + β 2 X t + ut
(1)估计股票价格指数与国内生产总值的回归模型: Yt =

(2)检验(1)中模型是否存在自相关,若存在,用广义差分法消除自相关。
6.6 表 6.10 给出了某地区 1980-2000 年的地区生产总值(Y)与固定资产投资额(X)的数
据。
表 6.10 地区生产总值与固定资产投资额 单位:亿元
地区生产 固定资产 地区生产 固定资产
年份 年份
总值(Y) 投资额(X) 总值(Y) 投资额(X)
1980 1402 216 1990 3124 544
1981 1624 254 1991 3158 523
1982 1382 187 1992 3578 548
1983 1285 151 1993 4067 668

25
1984 1665 246 1994 4483 699
1985 2080 368 1995 4897 745
1986 2375 417 1996 5120 667
1987 2517 412 1997 5506 845
1988 2741 438 1998 6088 951
1989 2730 436 1999 7042 1185
2000 8756 1180

(1)使用对数线性模型 LnYt = β1 + β 2 LnX t + u t 进行回归,并检验回归模型的自


相关性;
(2)采用广义差分法处理模型中的自相关问题。
* *
(3) 令 X t = X t / X t −1(固定资产投资指数),Yt = Yt / Yt −1(地区生产总值发展指数),

使用模型 LnYt =
*
β1 + β 2 LnX t* + vt ,该模型中是否有自相关?

6.7 有经济学家研究葡萄酒价格与葡萄生长期间降雨量、气温、酿制年份的关系。其中

log price 为波尔多葡萄酒的价格与 1961 年葡萄酒价格之比的自然对数;hrain 为收获季节

的降雨量;wrain 为收获前一年冬季的降雨量;deg rees 为种植季节的平均温度;time _ sv

为酿制年份到 1989 年的年数。表 6.11 为研究的部分数据。

表 6.11 葡萄生长及葡萄酒价格数据
logprice wrain hrain degrees Tine_sv logprice wrain hrain degrees Tine_sv
-1.00 600 160 17.12 31 -0.75 819 86 16.53 17
-0.45 690 80 16.73 30 -1.65 714 118 16.23 16
-0.61 430 180 15.38 29 -2.25 610 292 16.20 15
-0.81 502 130 17.15 28 -2.15 575 244 16.55 14
-1.12 440 140 15.65 27 -0.91 622 89 16.67 13
-1.51 420 110 16.13 26 -1.30 551 112 16.77 12
-1.72 582 187 16.42 25 -2.29 536 158 14.98 11
-0.42 485 187 17.48 24 -1.86 376 123 17.07 10
-1.97 763 290 16.42 23 -2.20 574 184 16.30 9
0.00 830 38 17.33 22 -1.20 572 171 16.95 8
-1.11 697 52 16.30 21 -1.37 418 247 17.65 7
-1.78 608 155 15.72 20 -2.24 821 87 15.58 6
-1.18 402 96 17.27 19 -1.31 763 51 15.82 5
-2.24 602 267 15.37 18 -1.54 717 122 16.17 4

(1)将葡萄酒价格的对数对 hrain 、 wrain 、 deg rees 、 time _ sv 作带常数项的回

归,说明结果意义。

(2)检验模型是否具有序列相关

(3)用适当的方法消除序列相关之后,有关系数的结论有明显的变化吗?

(4)你认为哪个估计的效果更好些?简要解释原因。

26
6.8 用 DW 检验或 BG 检验方法检验你在练习题 2.9 和练习题 3.7 中所建立的模型是否存
在自相关。如果存在自相关,你能设法消除或减轻自相关的影响吗?

附录 6.1: 存在自相关时参数估计值方差的证明

Var ( βˆ 2 ) = E ( βˆ 2 − β 2 ) 2

= E(
∑xu ) t t 2

∑x 2
t

1 2
= ( ) E ( x1u1 + x2u2 + L + xn un ) 2
∑ xt
2

1 2
= ( ) E [( x12u12 + x22u22 + L + xn2un2 )
∑ t
x 2

+ 2( x1 x 2 u1 u 2 + x1 x3 u1u 3 + L + x n −1 x n u n −1u n )]

1 2 2
= ( ) {[ x1 E (u12 ) + x22 E (u22 ) + L + xn2 E (un2 ) ]
∑ xt
2

+ 2 [ x1 x2 E (u1u2 ) + x1 x3 E (u1u3 ) + L + xn −1 xn E (un −1un ) ]}

σ u2 2
= + ( x1 x2 ρσ u2 + x1 x3ρ 2σ u2 + L + xn −1 xn ρσ u2 )
∑x 2
t ( ∑ xt )
2 2

n −1 n −2
 
σu 2  ∑ x x
t t +1 ∑ xt xt + 2
n −1 x1 xn

= =
n 1 + 2 ρ t 1=
n
+ 2 ρ 2 t 1
n
+ L + 2 ρ n 
2 
∑ x ∑ x 2
∑ x 2
∑ xt2 
=t 1 =
t


t
t 1 =t 1
t
=t 1


27
第七章分布滞后模型与自回归模型

引子:

货币政策效应的时滞
货币供给的变化对经济的影响很大,因此货币政策总是备受关注。当出现通货膨胀时,

总是要求货币当局控制货币供给量;当经济有衰退迹象时,又要求货币当局采用积极的货币

政策来刺激经济复苏。可是人们发现,货币政策的传导会有个过程,当年的货币政策的效应

通常难以立即显现出来,好像对当年 GDP 没有多少直接影响,货币供应量的增减也不会立即

导致物价的变动。也就是说,货币政策的影响效应存在着时间上的滞后。在货币政策的传导

过程中,货币扩张首先促使利率降低或者一般价格水平的上升,这本身就需要一段时间,而

这些因素对以 GDP 为代表的经济增长的影响,更是需要一段时间才能显示出来。只有经过一

段时间以后,支出对利率的反应增强,投资、进出口和消费才会不断上升,货币政策才最终

促使 GDP 增加。通常,货币扩张对 GDP 影响的最高点可能是在政策实施以后的 1 : 2 年间达

到,货币当局在制定货币政策时,必须考虑未来一两年可能出现的经济情况。

在现实经济活动中,滞后现象是普遍存在的,这就要求我们在做经济分析时应该考虑时

滞的影响。怎样才能把这类时间上滞后的经济关系纳入计量经济模型呢?

前面各章所讨论的回归模型属于静态模型,即认为被解释变量的变化仅仅依赖于解释

变量的当期影响,没有考虑变量之间的前后联系。事实上,在现实经济活动中,由于经济活

动主体的决策与行动都需要一个过程,加之人们生活习惯的延续、制度或技术条件的限制以

及预期效应等因素的影响,经济变量的变化往往存在时滞现象。因此,为了探索受时滞因素

影响的经济变量的变化规律,需要在回归模型中引入滞后变量进行分析。本章主要介绍经济

分析中较为常用的分布滞后模型与自回归模型,讨论它们的产生背景、特点及估计。

第一节滞后效应与滞后变量模型
一、经济活动中的滞后现象

一般来说,解释变量对被解释变量的影响不可能在短时间内完成,在这一过程中通常存

在时间滞后,也就是说,解释变量需要通过一段时间才能完全作用于被解释变量。此外,由

于经济活动的惯性,一个经济指标以前的变化态势往往会延续到本期,从而形成被解释变量

1
的当期变化同自身过去取值水平相关的情形。这种被解释变量受自身或其它经济变量过去值

影响的现象称为滞后效应。

下面我们看两个涉及滞后效应的例子。

【例 7.1】消费滞后

消费者的消费水平,不仅依赖于当年的收入,还同以前的收入水平有关。一般来说,

消费者不会把当年的收入全部花光。假定消费者将每一年收入的 40%用于当年花费,30%用

于第二年花费,20%用于第三年花费,其余的作为长期储蓄。这样,该消费者的消费函数就

可以表示成

Yt = α + 0.4 X t + 0.3 X t −1 + 0.2 X t − 2 + u t

其中, Yt 、 X t 分别为第 t 年的消费和收入, α 为常数。

【例 7.2】通货膨胀滞后

通货膨胀与货币供应量的变化有着较为密切的联系。物价上涨最直接的原因是相对于

流通中商品和服务的价值量来说货币供应过多,货币的超量供应通常是通货膨胀产生的必要

条件。但是,货币供应量的变化对通货膨胀的影响并不是即期的,总存在一定时滞。美国一

学者在研究通胀滞后效应时,就采用了如下模型

Pt = α + β 0 M t + β1 M t −1 + β 2 M t − 2 + L + β s M t − s + u t

其中, Pt 、 M t 分别为第 t 季度的物价指数和广义货币的增长率,s 是滞后(时滞)期。通

过对实际数据的分析发现,西方发达国家的通货膨胀时滞期 s 大约为 2~3 个季度。

二、滞后效应产生的原因

为什么经济变量会存在滞后现象呢?原因众多,但主要有以下几方面:

1、心理预期因素

经济社会是一个复杂的有机体系,经济活动离不开人的参与,在这个系统中,人的心

理因素对经济变量的变化有很大影响。由于人们的心理定势及社会习惯的作用,适应新经济

条件和经济环境需要一个过程,从而表现为决策滞后。而且,经济主体的大多数行动,都会

受到预期心理的影响。以消费为例,人们对某种商品的消费量不仅受商品当前价格影响,而

且还受预期价格影响,当人们预期价格上涨时,就会加快当期的购买,而当人们预期价格要

下降时,则会持币观望,减少当期的购买。由于对将来的预期要依据过去的经验,因此在一

定条件下,这种“预期”因素的影响可转化为滞后效应。

2
2、 技术因素

在国民经济运行中,从生产到流通再到使用,每一个环节都需要一段时间,从而形成

时滞。例如,农产品产量对价格信息的反应总是滞后的,其原因就在于农产品的生产需要一

个较长的时间过程;又如,在工业生产中,当年的产出量会在某种程度上依赖于过去若干期

内投资形成的固定资产规模;再如,货币投放量的增减对物价水平会产生影响,但这种影响

并不会全部在当期内反映,总会滞后一段时期。这些滞后效应都是因为经济活动的技术因素

所致。

3、 制度因素

契约、管理制度等因素也会形成一定程度的滞后。例如,企业要改变它的产品结构或

产量,会受到过去签订的供货合同的制约;拥有一定数量定期存款的消费者,要调整自己的

消费水平,会受到银行契约制度的限制;此外,管理层次过多、管理的低效率也会造成滞后

效应。这些情况说明,当一种变量发生变化时,另一变量由于制度方面的原因,需经过一定

时期才能作出相应的变动,从而形成滞后现象。

三、滞后变量模型

所谓滞后变量,是指过去时期的、对当前被解释变量产生影响的变量。滞后变量可分为

滞后解释变量与滞后被解释变量两类。把滞后变量引入回归模型,这种回归模型称为滞后变

量模型。在经济分析中,运用滞后变量模型可以使不同时期的经济现象彼此联系起来,同时

也将经济活动的静态分析转化为动态分析,使模型更加符合实际经济的运行状况。

滞后变量模型的一般形式为

Yt = α + β 0 X t + β 1 X t −1 + β 2 X t − 2 + L + β s X t − s
+ γ 1Yt −1 + γ 2Yt − 2 + L + γ q Yt − q + u t
(7.1)

其中 s、q 分别为滞后解释变量和滞后被解释变量的滞后期长度。若滞后期长度为有限,称

模型为有限滞后变量模型;若滞后期长度为无限,称模型为无限滞后变量模型。

1、 分布滞后模型

如果滞后变量模型中没有滞后被解释变量,被解释变量只受解释变量的影响,且这种影

响分布在解释变量不同时期的滞后值上,即

Yt = α + β 0 X t + β 1 X t −1 + β 2 X t − 2 + L + β s X t − s + u t (7.2)

具有这种滞后分布结构的模型称为分布滞后模型,其中,s 为滞后长度。根据滞后长度 s 取

值的有限和无限,我们将模型分别称为有限分布滞后模型和无限分布滞后模型。前面两个例

3
子中所设定的回归模型就属于有限分布滞后模型。

在分布滞后模型中,各系数体现了解释变量的各个滞后值对被解释变量的不同影响程

度,即通常所说的乘数效应:

β 0 称为短期乘数或即期乘数,表示本期 X 变动一个单位对 Y 值的影响大小;

β i 称为延迟乘数或动态乘数( i = 1,2,L , s ),表示过去各时期 X 变动一个单位对 Y 值

的影响大小;

∑β
i =0
i 称为长期乘数或总分布乘数,表示 X 变动一个单位时,包括滞后效应而形成

的对 Y 总的影响。

2、 自回归模型

如果滞后变量模型的解释变量仅包括自变量 X 的当期值和被解释变量的若干期滞后值,

模型的形式为

Yt = α + β 0 X t + γ 1Yt −1 + γ 2Yt − 2 + L + γ q Yt − q + u t (7.3)

式中,q 称为自回归模型的阶数。称这类模型为自回归模型。

第二节分布滞后模型的估计
一、分布滞后模型估计的困难

如前所述,分布滞后模型可分为有限分布滞后模型与无限分布滞后模型两类。对于无限

分布滞后模型,由于滞后项无限多而样本观测总是有限的,因此不能直接对其进行估计。对

于有限分布滞后模型,如果随机扰动项满足古典假定,可以考虑用最小二乘法对模型进行估

计。阿尔特(Alt)和丁伯根(Tinbergen)曾建议使用最小二乘法递推地估计模型,其基本

思路是,首先做被解释变量 Yt 关于解释变量 Xt 的回归,然后做 Yt 关于 Xt 和 Xt-1 的回归,

再做 Yt 关于 Xt、Xt-1、和 Xt-2 的回归,依次添加解释变量 Xt 的滞后项,直到滞后变量的回归

系数开始变成统计上不显著或至少有一个变量的系数改变符号时结束。例如,为了获得然油

消耗量 Y 与订货量 X 之间的关系,阿尔特曾利用十年的季度数据递推估计回归方程,得到

以下结果:

Yˆt = 8.37 + 0.171X t

Yˆt = 8.27 + 0.111X t + 0.064 X t −1

4
Yˆt = 8.27 + 0.109 X t + 0.071X t −1 − 0.055 X t − 2

Yˆt = 8.32 + 0.108 X t + 0.063 X t −1 + 0.022 X t − 2 − 0.020 X t −3

根据回归结果,由于 Xt-2 的符号不稳定,并且 Xt-2、Xt-3 的符号为负,其经济意义难

于解释,所以阿尔特最后选择第二个回归模型作为最佳模型。

上述估计法表面上看似乎可行,但事实上还存在一些缺陷:

(1)自由度问题。假设有限分布滞后模型的滞后长度为 s,如果样本观测值个数 n 较小,

随着滞后长度 s 的增大,有效样本容量 n-s 变小,会出现自由度不足的问题。由于自由度的

过分损失,致使估计方差增大,统计显著性检验失效。

2、多重共线性问题。由于经济活动的前后继起性,经济变量的滞后值之间通常存在较

强的联系,因此,分布滞后模型中滞后解释变量观测值之间往往会存在严重的多重共线性问

题。如果直接使用最小二乘法进行估计,则至少有些参数的估计会有较大偏差,可能导致一

些重要的滞后变量被剔除。

3、滞后长度难于确定。在实际经济分析中用分布滞后模型来处理滞后现象时,模型中

滞后长度的确定较为困难,往往没有充分的先验信息可供使用。

增加滞后期实际上是增加了解释变量个数。对于滞后长度难度难于确定这一问题,除了

可以用模型变量设定误差检验以外,如果缺乏先验信息,通常还可以借助 AIC、施瓦茨 SIC

等模型选择准则来确定 1,可选择能使 AIC 或 SIC 最小的滞后长度。

赤池 AIC 信息准则(Akaike Information Criterion)是用于衡量回归模型优良性的一种标

准。一般情况下,AIC 定义为:

AIC = e 2k n ∑e 2
t
或 ln AIC
=
2k
+ ln(
∑ et2
) (7.4)
n n n

式中, ln AIC 是 AIC 的自然对数,RSS= ∑e 2


i 为模型的残差平方和, k 是模型中的参数个

数,n 是样本容量。

如第三章讨论的,随着滞后阶数的增加,模型中解释变量个数越多,RSS= ∑e2
i 越小,

而 k 会越大,这里的 2k / n 对增加解释变量个数施加了一定的惩罚,称为惩罚因子。因此,

在不同阶数的回归模型中,AIC 较小者意味着滞后阶数较为合适。

施瓦茨 SIC 信息准则(Schwarz Criterion)是衡量回归模型优良性的另一准则,定义为:

1古扎拉蒂:《计量经济学基础》.第五版.上册,491 页,中国人民大学出版社,2011 年。

5
SIC = n k n ∑e 2
t 或 ln=
SIC
k
ln n + ln(
∑ et )
2
(7.5)
n n n

式中,RSS= ∑ ei2 、 k 、 n 的意义同 AIC 一样。这里的 ( k n ) ln n 也是惩罚因子,但因为一般,

Ln(n) > 2 ,SIC 的惩罚项大于 AIC。

针对分布滞后模型直接估计存在一些缺陷,人们进行了广泛的研究,提出了一系列修正

估计方法。对于有限分布滞后模型,其基本思想是对滞后模型中系数施加某种约束,设法有

目的地减少需要直接估计的模型参数的个数,以缓解多重共线性,保证自由度。对于无限分

布滞后模型,主要是通过适当的模型变换,使其转化为只需估计有限个参数的自回归模型。

有限分布滞后模型的常用估计方法主要有经验加权法、阿尔蒙法等。

二、经验加权估计法

所谓经验加权估计法,是根据实际经济问题的特点及经验判断,形成相应的约束,对解

释变量的系数赋予一定的权数,利用这些权数构成各滞后变量的线性组合,以形成新的变量,

再应用最小二乘法进行估计。权数分布的确定取决于模型滞后结构的不同类型,常见的滞后

结构类型有:

(1)递减滞后结构。这类滞后结构假定权数是递减的,认为滞后解释变量对被解释变

量的影响随着时间的推移越来越小,即遵循“远小近大”的原则(如图 7.1(a))。这种滞后结

构在现实经济活动中较为常见,比较典型的例子是消费函数,显然,现期收入对消费的影响

较大,越滞后,影响越小。

(2)不变滞后结构。这类滞后结构假定权数不变,即认为滞后解释变量对被解释变量

的影响不随时间而变化(如图 7.1(b))。

(3) Λ 型滞后结构。即两头小中间大,权数先递增后递减呈 Λ 型(如图 7.1(c))


。这

类滞后结构适合于前后期滞后解释变量对被解释变量的影响不大,而中期滞后解释变量对被

解释变量的影响较大的分布滞后模型。如投资对产出的影响,就是以周期期中的投资对本期

产出贡献最大,因此可选择 Λ 型滞后结构。

β β β

0 t 0 t 0 t
(a) (b) (c)

图 7.1 常见的滞后结构类型

6
例如,假设某经济变量服从一个滞后 3 期的分布滞后模型

Yt = α + β 0 X t + β 1 X t −1 + β 2 X t − 2 + β 3 X t −3 + u t

如果根据经验判断滞后解释变量对被解释变量的影响递减,权数取某种形式,如
1 1 1 1
, , , ,则有
2 4 6 8
1  1  1  1 
α + β 0  X t  + β 0  X t −1  + β 0  X t − 2  + β 0  X t −3  + ut
Yt =
2  4  6  8 

1 1 1 1 
α + β 0  X t + X t −1 + X t − 2 + X t −3  + ut
=
2 4 6 8 

令新的线性组合变量为
1 1 1 1
Zt = X t + X t −1 + X t − 2 + X t −3
2 4 6 8
原模型就变为经验加权模型

α β 0 Z t + ut
Yt =+

若随机扰动项与解释变量不相关,从而与滞后解释变量的线性组合变量也不相关,因此可直

接应用最小二乘法对该模型进行估计。

经验加权法具有简单易行、少损失自由度、避免多重共线性干扰及参数估计具有一致性

等特点。缺点是设置权数的主观随意性较大,要求分析者对实际问题的特征有比较透彻的了

解。通常的做法是,依据先验信息,多选几组权数分别估计多个模型,然后根据可决系数、

F 检验值、t 检验值、估计标准差以及 DW 值,从中选出最佳估计方程。

【例 7.3】已知 1955~1974 年美国制造业库存量 Y 和销售额 X 的统计资料,如表 7.1 所

示。设定有限分布滞后模型为:

Yt = α + β 0 X t + β 1 X t −1 + β 2 X t − 2 + β 3 X t −3 + u t

运用经验加权法,选择下列三组权数(1)1,1/2,1/4,1/8;
(2)1/4,1/2,2/3,1/4;

(3)1/4,1/4,1/4,1/4;分别估计上述模型,并从中选择最佳的方程。

表 7.1 1955 : 1974 年美国制造业库存量 Y 和销售额 X 的统计资料 (单位:亿美元)

年份 Y X 年份 Y X
1955 450.69 264.80 1965 682.21 410.03
1956 506.42 277.40 1966 779.65 448.69
1957 518.70 287.36 1967 846.55 464.49
1958 500.70 272.80 1968 908.75 502.82
1959 527.07 302.19 1969 970.74 535.55
1960 538.14 307.96 1970 1016.45 528.59

7
1961 549.39 308.96 1971 1024.45 559.17
1962 582.13 331.13 1972 1077.19 620.17
1963 600.43 350.32 1973 1208.70 713.98
1964 633.83 373.35 1974 1471.35 820.78
数据来源: D. N.古扎拉蒂.计量经济学(第三版).中国人民大学出版社, 2000,第 611 页

记新的线性组合变量分别为:
1 1 1
Z1 = X t + X t −1 + X t − 2 + X t −3
2 4 8
1 1 2 1
Z 2 = X t + X t −1 + X t − 2 + X t −3
4 2 3 4
1 1 1 1
Z 3 = X t + X t −1 + X t − 2 + X t −3
4 4 4 4
在 EViews 中,输入 X 和 Y 的数据,根据 X 的数据,由上述公式生成线性组合变量 Z1、Z2、

Z3 的数据。然后分别估计如下经验加权模型

α β Z kt + ut
Yt =+ (k =
1, 2,3)

回归分析结果整理如下

模型 7.1

Yˆt = −66.60404 + 1.071502 Z 1t


(−3.6633) (50.9191)
R 2 = 0.994248 DW = 1.440858
F = 2592

模型 7.2

Yˆt = −133.1988 + 1.3667 Z 2t


(−5.029) (37.35852)
R 2 = 0.989367 DW = 1.042935
F = 1396
模型 7.3

=Yˆt -121.7808 + 2.23803Z 3t


(-4.8121) (38.66553)
=R 2 0.990066
= DW 1.15878
F = 1496

从上述回归分析结果可以看出,在取 α = 0.05 时,模型 7.1 的扰动项无一阶自相关,模型

7.2、模型 7.3 扰动项存在一阶正自相关。再综合判断可决系数、F 检验值、t 检验值,可以

认为:最佳的方程是模型 7.1,即权数为(1,1/2,1/4,1/8)的分布滞后模型。

三、阿尔蒙法

8
为了消除多重共线性的影响,阿尔蒙(Almon,1965)提出利用多项式来逼近滞后参数

的变化结构,从而减少待估参数的数目。其基本原理是,在有限分布滞后模型滞后长度 s 已

知的情况下,滞后项系数可以看成是相应滞后期 i 的函数。在以滞后期 i 为横轴、滞后系数

取值为纵轴的坐标系中,如果这些滞后系数落在一条光滑曲线上,或近似落在一条光滑曲线

上,则可以由一个关于 i 的次数较低的 m 次多项式很好地逼近,即

βi = α 0 + α1i + α 2i 2 + L + α mi m (i = 0,1, 2,L , s ; m < s ) (7.6)

式(7.6)称为阿尔蒙多项式变换(图 7.2)。

βi βi

* *
* *
* *
* * * *
* *
* * *

0 i 0 i

图 7.2 阿尔蒙多项式滞后结构

将阿尔蒙多项式变换具体列出来就是

β 0 = α 0 + α1 0 + α 2 0 2 + L + α m 0 m (i = 0)

β1 = α 0 + α11 + α 212 + L + α m1m (i = 1)

β 2 = α 0 + α1 2 + α 2 2 2 + L + α m 2 m (i = 2)

M
β s = α 0 + α1 s + α 2 s 2 + L + α m s m (i = s )

代入式(7.2)并整理各项,模型变为如下形式
Yt =α + α 0 ( X t + X t −1 + X t − 2 + L + X t − s )
+ α1 ( X t −1 + 2 X t − 2 + 3 X t −3 L + sX t − s )
+ α 2 ( X t −1 + 22 X t − 2 + 32 X t −3 L + s 2 X t − s )
M
+ α m ( X t −1 + 2 X t − 2 + 3m X t −3 L + s m X t − s ) + ut
m

Yt = α + α 0 Z 0t + α 1 Z 1t + α 2 Z 2t + L + α m Z mt + u t (7.7)

9
其中

Z 0t = X t + X t −1 + X t − 2 + L + X t − s
Z1t =X t −1 + 2 X t − 2 + 3 X t −3 L + sX t − s
Z 2t =X t −1 + 22 X t − 2 + 32 X t −3 L + s 2 X t − s
M
Z mt =X t −1 + 2 X t − 2 + 3m X t −3 L + s m X t − s
m

为滞后变量的线性组合变量。

对于模型式(7.7),在 u t 满足古典假定的条件下,可用最小二乘法进行估计。将估计的

参数 αˆ 0 , αˆ1 , αˆ 2 ,L , αˆ m 代入式(7.6),就可求出原分布滞后模型参数的估计值。

在实际应用中,阿尔蒙多项式的次数 m 通常取得较低,一般取 2 或 3,很少超过 4。如

果 m 取得过大则达不到通过阿尔蒙多项式变换减少变量个数的目的。

从上面的分析可以看出,通过阿尔蒙多项式变换,新模型中的变量个数少于原分布滞后

模型中的变量个数,从而自由度得到保证,并在一定程度上缓解了多重共线性问题。

第三节自回归模型的构建

在处理实际经济问题中,有时需要使用自回归模型进行分析。引入自回归模型主要有

两条途径,一是对无限分布滞后模型的滞后结构作出某种假定,通过变换而形成;另一条途

径是在模型中考虑了预期因素,然后基于经济原理对“期望模型”作出某种假定而导出。

一、库伊克模型

许多经济变量的滞后效应都在相当长的时期内存在。例如,消费水平受收入的影响,可

以追溯到较远的过去时期的收入水平;经济政策对经济效益的影响有一个逐步扩散的过程,

目前的经济效益除了受不久前经济政策的影响外,还要受很久以前经济政策的影响,尽管这

种影响可能很微弱。对于这种滞后现象,如果采用截尾的办法忽略某滞后期以前滞后解释变

量对被解释变量的影响,建立有限分布滞后模型来进行分析,则存在滞后长度难于确定的问

题。为了回避这一难点,可使用无限分布滞后模型来处理。

但是,正如前面所述,无限分布滞后模型中滞后项无限多,而样本观测总是有限的,因

此不可能对其直接进行估计。显然,要使模型估计能够顺利进行,必须施加一些约束或假定

条件,将模型的结构作某种转化。库伊克(Koyck)变换就是其中较具代表性的方法。

库伊克认为,对于如下无限分布滞后模型:

10
Yt = α + β 0 X t + β 1 X t −1 + β 2 X t − 2 + L + u t (7.8)

可以假定滞后解释变量 X t −i 对被解释变量 Y 的影响随着滞后期 i ( i = 0,1, 2,K ) 的增加而


按几何级数衰减,即滞后系数的衰减服从某种公比小于 1 的几何级数:

β i = β 0 λi , 0 < λ <1 , i = 0,1,2, L (7.9)

式中, β 0 为常数,公比 λ 为待估参数。λ 值的大小决定了滞后衰减的速度,λ 值越接近零,

,通常称 λ 为分布滞后衰减率,称 1 − λ 为调整速度。


衰减速度越快(图 7.3)

βi

λ =1 2
0 λ = 1 i4

图 7.3 按几何级数衰减的滞后结构(库伊克模型)

将式(7.9)代入式(7.8)
,得

Yt = α + β 0 X t + β 0 λX t −1 + β 0 λ2 X t − 2 + L + u t
= α + β 0 ( X t + λX t −1 + λ2 X t − 2 + L ) + u t (7.10)

= α + β 0 ∑ λi X t − i + u t
i =0

将式(7.10)滞后一期,有

Yt −1 = α + β 0 ∑ λi X t −1−i + u t −1
i =0
(7.11)

= α + β 0 ∑ λ X t −i + u t −1
i −1

i =1

对式(7.11)两边同乘 λ 并与式(7.10)相减,得
∞ ∞
Yt − λYt −1 = (α + β 0 ∑ λi X t −i + u t ) − (λα + β 0 ∑ λi X t −i + λu t −1 )
i =0 i =1 (7.12)
= α (1 − λ ) + β 0 X t + (u t − λu t −1 )

Yt = α (1 − λ ) + β 0 X t + λYt −1 + (u t − λu t −1 ) (7.13)

这就是库伊克模型。上述变换过程也叫库伊克变换。

11
令 α = α (1 − λ ) , β 0* = β 0 , β1* = λ , u t* = u t − λu t −1
*

则库伊克模型式(7.12)变为

Yt = α * + β 0* X t + β 1*Yt −1 + u t* (7.14)

这是一个一阶自回归模型。

由此可见,利用库伊克变换,可以将一个无限分布滞后模型变成只有一个本期解释变量

X t 和滞后一期被解释变量 Yt −1 的自回归模型。该模型以一个滞后被解释变量 Yt −1 代替了大量

的滞后解释变量 X t −i (i = 1,2.L ) ,使模型结构得到极大简化,而且最大限度地保证了自由

度,解决了滞后长度难以确定的问题;同时,滞后一期的被解释变量 Yt −1 与 X t 的线性相关

程度将低于 X 的各滞后值之间的相关程度,从而在很大程度上缓解了多重共线性。

当然,尽管库伊克变换具有上述优点,但也存在一些缺陷:

(1)它假定无限滞后分布呈几何滞后结构,即滞后影响按某固定比例递减,解释变量

当期值对被解释变量影响最大,滞后一期次之,照此类推。这种假定对某些经济变量可能不

适用,例如固定资产投资对总产出影响的滞后结构就不是这种类型。

(2)库伊克模型的随机扰动项形如

u t* = u t − λu t −1 (7.15)

*
说明新模型的随机扰动项 u t 存在一阶自相关,且与解释变量 Yt −1 相关。

(3)将随机变量 Yt −1 作为解释变量引入了模型,不一定符合基本假定。

(4)库伊克变换是纯粹的数学运算结果,缺乏经济理论依据。

这些缺陷,特别是第二个缺陷,将给模型的参数估计带来一定困难。

二、自适应预期模型

在经济活动中,经济活动主体经常根据他们对某些经济变量未来走势的“预期”来改变

自己的行为决策。例如,一家公司的价值在过去稳步增长,投资者就可能会预期这种情况会

持续下去,并依据这种预期作出投资决策。又如,企业会根据对产品未来价格走势的预期,

决定现期的生产量以及是否对新设备进行投资。同样,为了确定种植哪种农作物最有利可图,

农民往往要对各种农作物的未来价格进行预测。消费者在决定是否购买房屋、汽车或家用电

器时,也需对这些消费品的未来价格进行预测。再如,当期居民消费水平的高低,在一定程

度上取决于对未来收入水平的预计,即取决于预期的收入水平。

12
这些例子表明,某些经济变量的变化会或多或少地受到另一些经济变量预期值的影响。

为了处理这种经济现象,我们可以将解释变量预期值引入模型建立“期望模型”。例如,包

含一个预期解释变量的“期望模型”可以表现为如下形式:

Yt = α + βX t* + u t (7.16)

*
式中, Yt 为被解释变量, X t 为解释变量预期值, u t 为随机扰动项。

在回归分析中,如何获取解释变量预期值,是上述模型的难点。预期是对未来的判断,

在大多数情况下,预期值是不可观测的。因此,实际应用中需要对预期的形成机理作出某种

假定,自适应预期假定就是其中之一,这种假定比较切合实际,具有一定代表性。

自适应预期假定认为,经济活动主体对某经济变量的预期,是通过一种简单的学习过程

而行成的,其机理是,经济活动主体会根据自己过去在作预期时所犯错误的程度,来修正他

们以后每一时期的预期,即按照过去预测偏差的某一比例对当前期望进行修正,使其适应新

的经济环境。用数学式子表示就是

X t* = X t*−1 + γ ( X t − X t*−1 ) (7.17)

式中,参数 γ 为调节系数,也称为适应系数。也就是说,本期预期值 X t 等于前一期预期值


*

X t*−1 加上一个修正量,该修正量 γ ( X t − X t*−1 ) 是前一期预期误差 ( X t − X t*−1 ) 的一部分。这

一调整过程叫做自适应过程。

将式(7.17)改写为

X t* = γX t + (1 − γ ) X t*−1 (7.18)

表明本期预期值是前一期预期值和本期实际值的加权平均,权数分别为 1 − γ 和 γ 。在一般

情况下, 0 ≤ γ ≤ 1 ,如果 γ 等于 0,说明本期实际值被忽略,预期没有进行修正;如果 γ 等

于 1,则以本期实际值作为预期值,本期预期与前一期预期无关。

通常,将解释变量预期值满足自适应调整过程的期望模型,称为自适应预期模型

(adaptive expectation model)


。根据自适应预期假定,自适应预期模型可转化为自回归形式。

将式(7.18)代入式(7.16)得

Yt = α + β [γX t + (1 − γ ) X t*−1 ] + u t (7.19)

同时,将式(7.16)滞后一期,并乘以 1 − γ ,得

(1 − γ )Yt −1 = α (1 − γ ) + β (1 − γ ) X t*−1 + (1 − γ )ut −1 (7.20)

13
式(7.19)减去式(7.20)
,整理得

Yt = γα + γβX t + (1 − γ )Yt −1 + [u t − (1 − γ )u t −1 ] (7.21)

α * = γα , β 0* = γβ , β1* = 1 − γ , ut* = ut − (1 − γ )ut −1 (7.22)

则式(7.21)变为

Yt = α * + β 0* X t + β 1*Yt −1 + u t* (7.23)

这是一个一阶自回归模型。如果能得到该模型参数 α , β 0 , β 1 的估计值,代入式(7.22)即
* * *

可求得自适应预期模型式(7.16)的参数估计值。

三、局部调整模型

在经济活动中,会遇到为了适应解释变量的变化,被解释变量有一个预期的最佳值与之

对应的现象。例如,企业为了确保生产或供应,必须保持一定的原材料储备,对应于一定的

产量或销售量,存在着预期最佳库存量;为了确保一国经济健康发展,中央银行必须保持一

定的货币供应,对应于一定的经济总量水平,应该有一个预期的最佳货币供应量。也就是说,

解释变量的现值影响着被解释变量的预期值,即存在如下关系

Yt * = α + βX t + u t (7.24)

*
式中, Yt 为被解释变量的预期最佳值, X t 为解释变量的现值。

由于技术、制度、市场以及管理等各方面的限制,被解释变量的预期水平在单一周期

内一般不会完全实现,而只能得到部分的调整。局部调整假设认为,被解释变量的实际变化

仅仅是预期变化的一部分,即

Yt − Yt −1 = δ (Yt * − Yt −1 ) (7.25)

式中,δ 为调整系数,它代表调整速度。δ 越接近 1,表明调整到预期最佳水平的速度越快。

若 δ = 1 ,则 Yt = Yt ,表明实际变动等于预期变动,调整在当期完全实现。若 δ = 0 ,则
*

Yt = Yt −1 ,表明本期值与上期值一样,完全没有调整。一般情况下, 0 < δ < 1 。

满足局部调整假设的式(7.24),称为局部调整模型(partial adjustment model)。局部

调整假设式(7.25)也可写成

Yt = δYt * + (1 − δ )Yt −1 (7.26)

14
即被解释变量实际值是本期预期最佳值与前一期实际值的加权和,权数分别为 δ 和 1 − δ 。

把式(7.24)代入式(7.26),可得局部调整模型的转化形式

Yt = δ (α + βX t + u t ) + (1 − δ )Yt −1
(7.27)
= δα + δβX t + (1 − δ )Yt −1 + δu t

α * = δα , β 0* = δβ , β1* = 1 − δ , ut* = δut (7.28)

则式(7.27)变为

Yt = α * + β 0* X t + β 1*Yt −1 + u t* (7.29)

这说明局部调整模型本质上是一个自回归模型。若能得到该模型的参数估计,代入式(7.28)

就可求出原模型的参数估计。

从上述分析可以看出,库伊克模型、自适应预期模型与局部调整模型的最终形式,都

是一阶自回归形式,这样,对这三类模型的估计就转化为对相应一阶自回归模型的估计。它

们的区别有两个方面:一是导出模型的经济背景与思想不同,库伊克模型是在无限分布滞后

模型的基础上根据库伊克几何分布滞后假定导出的,自适应预期模型是由解释变量的自适应

过程而得到的;局部调整模型则是对被解释变量的局部调整而得到的。二是,在这三个模型

对应的自回归形式中,由于模型的形成机理不同而导致随机误差项的结构有所不同,这一区

别将对模型的估计带来一定影响。

此外,有时需要将局部调整模型与自适应期望模型结合起来对某一经济问题进行研究,

即建立局部调整—自适应期望综合模型。考虑如下模型:

Yt * = α + βX t* + u t (7.30)

*
该模型反映了被解释变量的预期水平同解释变量预期值的关联性。对 Yt 作局部调整假设,

*
对 X t 作自适应假设,则局部调整—自适应期望综合模型可转化为如下形式的自回归模型

(读者不妨自己推导):

Yt = α * + β 0* X t + β 1*Yt −1 + β 2*Yt − 2 + u t* (7.31)

第四节 自回归模型的估计

15
一、自回归模型估计的困难

第三节所讨论的库伊克模型、自适应预期模型与局部调整模型,在模型结构上有共性,

即最终都可表示为一阶自回归形式

Yt = α * + β 0* X t + β 1*Yt −1 + u t* (7.32)

因此,对这三个模型的估计就转化为对一阶自回归模型的估计。但是,上述一阶自回归模型

的解释变量中含有滞后被解释变量 Yt −1 , Yt −1 是随机变量,它可能与随机扰动项相关;而且

随机扰动项还可能自相关,也就是说,模型可能违背古典假定,从而给模型的估计带来一定

困难。为了说明这一点,我们考察三个模型对应的一阶自回归模型中,随机扰动项的特征。

库伊克模型

u t* = u t − λu t −1

自适应预期模型

u t* = u t − (1 − γ )u t −1

局部调整模型

u t* = δu t

假定原模型中随机扰动项 u t 满足古典假定,即

E (u t ) = 0

Var (ut ) = σ 2

Cov(ui ,=
u j ) 0 (i ≠ j )

(1)对于库伊克模型,有

Cov(ut* , ut*−1 ) = E[ut − λut −1 − E ( ut − λut −1 )][ut −1 − λut − 2 − E ( ut −1 − λut − 2 )]


= E (ut ut −1 ) − λ Eut2−1 − λ E (ut ut − 2 ) + λ 2 E (ut −1ut − 2 )
−λ Eut2−1 =
= −λσ 2 ≠ 0
Cov
= (Yt −1 , ut* ) Cov(Yt −1 , ut − λut −1 )
= Cov(Yt −1 , ut ) − λCov(Yt −1 , ut −1 )
−λCov(Yt −1 , ut −1 ) ≠ 0
=

16
(2)同理可证,对于自适应预期模型也有

Cov(ut* , ut*−1 ) ≠ 0

Cov(Yt −1 , ut* ) ≠ 0

(1) 对于局部调整模型,有

E[δ ut − E (δ ut )][δ ut −1 − E (δ ut −1 )] =
Cov(ut* , ut*−1 ) = δ 2 E (ut ut −1 ) =
0

Cov(Yt −1 , ut* ) Cov


= = (Yt −1 , δ ut ) δ=
Cov(Yt −1 , ut ) 0

由此可见,对自回归模型的估计存在两个主要问题:一是出现了随机解释变量 Yt −1 ,

而 Yt −1 可能与随机扰动项相关;二是随机扰动项可能自相关,库伊克模型和自适应预期模型

的随机扰动项都会导致自相关,只有局部调整模型的随机扰动无自相关。如果用最小二乘法

直接估计自回归模型,则估计可能是有偏的,而且不是一致估计。因此,估计自回归模型需

要解决两个问题:一是设法消除 Yt −1 与随机扰动项的相关性;二是检验随机扰动项是否存在

自相关。

为了缓解解释变量 Yt −1 与随机扰动项存在相关带来的估计偏倚,可采用工具变量法;诊

断一阶自回归模型扰动项是否存在自相关,可用德宾 h 检验法。而对于扰动项自相关的处理,

问题比较复杂,涉及到动态回归模型的深入内容,在此从略。

二、工具变量法

所谓工具变量法,就是在进行参数估计的过程中选择适当的工具变量,代替回归模型中

同随机扰动项存在相关性的解释变量。工具变量的选择应满足以下条件:①与所代替的解释

变量高度相关;②与随机扰动项不相关;③与其它解释变量不相关,以免出现多重共线性。

可以证明,利用工具变量法所得到的参数估计是一致估计。

在实际应用中,工具变量有多种选择方式,例如,可选用 Yˆt −1 作工具变量,去代替滞后

被解释变量 Yt −1 进行估计,这样,一阶自回归模型就变为以下形式

Yt = α * + β 0* X t + β 1*Yˆt −1 + u t* (7.33)

式中, Yˆt −1 是 Yˆt 的滞后值, Yˆt 是 Y 对 X 的滞后值的回归,即由如下回归方程得到

Yˆt = cˆ0 + cˆ1 X t −1 + cˆ2 X t − 2 + L + cˆ s X t − s (7.34)

17
滞后期 s 适当选取,一般取 2 或 3。由于 X t 与 u t 不相关, Yˆt 作为对 X 滞后值的回归,也与
*

u t* 不相关,进而 Yˆt −1 也与 u t* 不相关,因此,对模型式(7.33)应用最小二乘法,可以得到

参数的一致估计。

三、德宾 h 检验

关于随机扰动项是否存在自相关的诊断,前面我们曾介绍过 DW 检验法,但这一检验

法不适合于方程含有滞后被解释变量的场合(见 DW 检验的假设条件)
。在自回归模型中,

滞后被解释变量是随机变量,已有研究表明,如果用 DW 检验法,则 d 统计量值总是趋近

于 2。也就是说,在一阶自回归中,当随机扰动项存在自相关时,DW 检验却倾向于得出非

自相关的结论。对于自回归模型中自相关的检验,可以使用第六章介绍的能检验模型解释变

量中有滞后被解释变量情况的 Breusch-Godfrey 检验(拉格朗日乘数检验)方法。除此之外,

德宾还提出了检验一阶自相关的 h 统计量检验法。

h 统计量定义为

n d n
h = ρˆ = (1 − ) (7.35)
1 − nVar ( βˆ )
*
1
2 1 − nVar ( βˆ1* )

式中, ρ̂ 为随机扰动项一阶自相关系数 ρ 的估计量,d 为 d 统计量,n 为有效样本容量,

Var(β̂ 1*)为滞后被解释变量 Yt −1 的回归系数的估计方差。

德宾证明了在 ρ = 0 的假定下,h 统计量的极限分布为标准正态分布。因此,在大样本

情况下,可以用 h 统计量值判断随机扰动项是否存在一阶自相关。具体作法如下

(1)对一阶自回归方程

Yt = α * + β 0* X t + β 1*Yt −1 + u t*

直接进行最小二乘估计,得到 Var(β̂ 1 )及 d 统计量值。


*

(2)将 Var(β̂ 1 )、d 及有效样本容量 n 代入(7.35)式计算 h 统计量值。


*

(3)给定显著性水平 α ,查标准正态分布表得临界值 hα 。若 h > hα /2 ,则拒绝原假设

ρ = 0 ,说明自回归模型存在一阶自相关;若 h < hα /2 ,则接受原假设 ρ = 0 ,说明自回归

模型不存在一阶自相关。

例如,假设对下列模型进行估计

18
Yt = α * + β 0* X t + β 1*Yt −1 + u t*

得到 d = 1.9,Var(βˆ1 )= 0.005 ,如果有效样本容量 n=100,则


*

d n
h = (1 − )
2 1 − nVar ( βˆ1* )
1 100
= (1 − × 1.9)
2 1 − 100 × 0.005
= 0.7071
取显著性水平 α =0.05 , 查 标 准 正 态 分 布 表 得 临 界 值 hα = 1.96 , 由 于
2

h = 0.7071 < hα = 1.96 ,因此接受原假设 ρ = 0 ,说明自回归模型不存在一阶自相关。


2

值得注意的是,该检验法可适用任意阶的自回归模型,对应的 h 统计量的式(7.32)

仍然成立,即只用到 Yt −1 回归系数的估计方差。此外,该检验法是针对大样本的,用于小样

本效果较差。当 nVar ( βˆ1 ) > 1 时不能直接使用此方法。


*

第五节 案例分析

【例 7.4】为了研究 1955—1974 年期间美国制造业库存量 Y 和销售额 X 的关系,我们

在【例 7.3】中采用了经验加权法估计分布滞后模型。尽管经验加权法具有一些优点,但是

设置权数的主观随意性较大,要求分析者对实际问题的特征有比较透彻的了解。本案例对表

7.1 数据用阿尔蒙法估计如下有限分布滞后模型:

Yt = α + β 0 X t + β 1 X t −1 + β 2 X t − 2 + β 3 X t −3 + u t

将系数 β i (i=0,1,2,3)用二次多项式近似,即

β0 = α0

β1 = α 0 + α1 + α 2

β 2 = α 0 + 2α 1 + 4α 2

β 3 = α 0 + 3α 1 + 9α 2

则原模型可变为

Yt = α + α 0 Z 0t + α 1 Z 1t + α 2 Z 2t + u t

19
其中

Z 0t = X t + X t −1 + X t − 2 + X t −3
Z 1t = X t −1 + 2 X t − 2 + 3 X t −3
Z 2t = X t −1 + 4 X t − 2 + 9 X t −3

在 EViews 工作文件中输入 X 和 Y 的数据,在工作文件窗口中点击“Genr”工具栏,出现对

话框,输入生成变量 Z0t 的公式:Z0=X+X(-1)+X(-2)+X(-3),回车可得到 Z0t 的数据并存放于

Z2t 的数据,并存放于变量 Z1、Z2 中。进入 Equation Specification


变量 Z0 中;类似地,可生成 Z1t、

对话栏,键入回归方程形式:

Y C Z0 Z1 Z2

点击“OK”,显示回归结果(图 7.4)。

图 7.4 回归结果

图 7.4 中 Z 0、Z1、Z 2 对应的系数分别为 α 0、α 1、α 2 的估计值 αˆ 0、αˆ 1、αˆ 2 。将它们代

入分布滞后系数的阿尔蒙多项式中,可计算出 βˆ0、βˆ1、βˆ2、βˆ3 的估计值为:

βˆ0 = αˆ 0 = 0.661248
βˆ1 = αˆ 0 + αˆ1 + αˆ 2 = 0.661248 + 0.902049 + (−0.432155) = 1.131142
βˆ 2 = αˆ 0 + 2αˆ1 + 4αˆ 2 = 0.661248 + 2 × 0.902049 + 4 × (−0.432155) = 0.736725
βˆ3 = αˆ 0 + 3αˆ1 + 9αˆ 2 = 0.661248 + 3 × 0.902049 + 9 × (−0.432155) = -0.522
从而,分布滞后模型的最终估计式为:
^
−71.40754 + 0.661248 X t + 1.131142 X t −1
Yt =
+ 0.736725 X t − 2 − 0.522000 X t −3

在实际应用中,EViews 提供了多项式分布滞后指令“PDL”用于估计分布滞后模型。

下面结合本例给出操作过程:

20
在 EViews 中输入 X 和 Y 的数据,进入 Equation Specification 对话栏,键入方程形式

Y C PDL(X, 3, 2)

式中,PDL 指令表示进行多项式分布滞后(Polynomial Distributed Lags)模型的估计,括号

中的 3 表示 X 的分布滞后长度,2 表示多项式的阶数。点击“OK”,将显示回归分析结果(图

7.5)。

图 7.5 使用 PDL 函数的回归结果

需要指出的是,用“PDL”估计分布滞后模型时,Eviews 所采用的滞后系数多项式变

换不是形如式(7.4)的阿尔蒙多项式,而是阿尔蒙多项式的派生形式。因此,输出结果中

PDL01、PDL02、PDL03 对应的估计系数不是阿尔蒙多项式系数 α 0、α 1、α 2 的估计。但同

前面分步计算的结果相比,最终的分布滞后估计系数式 βˆ0、βˆ1、βˆ2、βˆ3 是相同的。

【例 7.5】货币主义学派认为,产生通货膨胀的必要条件是货币的超量供应。物价变动

与货币供应量的变化有着较为密切的联系,但是二者之间的关系不是瞬时的,货币供应量的

变化对物价的影响存在一定时滞。有研究表明,西方国家的通货膨胀时滞大约为 2—3 个季

度。

在中国,大家普遍认同货币供给的变化对物价具有滞后影响,但滞后期究竟有多长,还

存在不同的认识。下面采集 1996 年 1 月-2008 年 11 月广义货币供应量和物价指数的月度

数据(表 7.2)对这一问题进行研究。

21
表 7.2 广义货币供应量及物价指数月度数据
时间 广义货 广义货币增 居民消费 时间 广义货币 广义货币增 居民消费
M2(千亿 长量 X 价格同比 M2(千亿 长量 X 价格同比
元) (千亿元) 指数 Y 元) (千亿元) 指数 Y
1996-01 58.401 109 2002-07 170.8511 1.2499 99.1
1996-02 63.778 5.377 109.3 2002-08 173.2509 2.3998 99.3
1996-03 64.511 0.733 109.8 2002-09 176.9824 3.7315 99.3
1996-04 65.723 1.212 109.7 2002-10 177.2942 0.3118 99.2
1996-05 66.88 1.157 108.9 2002-11 179.7363 2.4421 99.3
1996-06 68.132 1.252 108.6 2002-12 185.0073 5.271 99.6
1996-07 69.346 1.214 108.3 2003-01 190.4883 5.481 100.4
1996-08 72.309 2.963 108.1 2003-02 190.1084 -0.3799 100.2
1996-09 69.643 -2.666 107.4 2003-03 194.4873 4.3789 100.9
1996-10 73.1522 3.5092 107 2003-04 196.1301 1.6428 101
1996-11 74.142 0.9898 106.9 2003-05 199.5052 3.3751 100.7
1996-12 76.0949 1.9529 107 2003-06 204.9314 5.4262 100.3
1997-01 78.648 2.5531 105.9 2003-07 206.1931 1.2617 100.5
1997-02 78.998 0.35 105.6 2003-08 210.5919 4.3988 100.9
1997-03 79.889 0.891 104 2003-09 213.5671 2.9752 101.1
1997-04 80.818 0.929 103.2 2003-10 214.4694 0.9023 101.8
1997-05 81.151 0.333 102.8 2003-11 216.3517 1.8823 103
1997-06 82.789 1.638 102.8 2003-12 221.2228 4.8711 103.2
1997-07 83.46 0.671 102.7 2004-01 225.1019 3.8791 103.2
1997-08 84.746 1.286 101.9 2004-02 227.0507 1.9488 102.1
1997-09 85.892 1.146 101.8 2004-03 231.6546 4.6039 103
1997-10 86.644 0.752 101.5 2004-04 233.6279 1.9733 103.8
1997-11 87.59 0.946 101.1 2004-05 234.8424 1.2145 104.4
1997-12 90.9953 3.4053 100.4 2004-06 238.4275 3.5851 105
1998-01 92.2114 1.2161 100.3 2004-07 238.127 -0.3005 105.3
1998-02 92.024 -0.1874 99.9 2004-08 239.7292 1.6022 105.3
1998-03 92.015 -0.009 100.7 2004-09 243.7569 4.0277 105.2
1998-04 92.662 0.647 99.7 2004-10 243.7403 -0.0166 104.3
1998-05 93.936 1.274 99 2004-11 247.1356 3.3953 102.8
1998-06 94.658 0.722 98.7 2004-12 254.107 6.9714 102.4
1998-07 96.314 1.656 98.6 2005-01 257.7085 3.6015 101.9
1998-08 97.299 0.985 98.6 2005-02 259.3573 1.6488 103.9
1998-09 99.795 2.496 98.5 2005-03 264.5889 5.2316 102.7
1998-10 100.8752 1.0802 98.9 2005-04 266.9927 2.4038 101.8
1998-11 102.229 1.3538 98.8 2005-05 269.2405 2.2478 101.8
1998-12 104.4985 2.2695 99 2005-06 275.7855 6.545 101.6
1999-01 105.5 1.0015 98.8 2005-07 276.9663 1.1808 101.8
1999-02 107.778 2.278 98.7 2005-08 281.2882 4.3219 101.3
1999-03 108.438 0.66 98.2 2005-09 287.4383 6.1501 100.9
1999-04 109.218 0.78 97.8 2005-10 287.5916 0.1533 101.2
1999-05 110.061 0.843 97.8 2005-11 292.3504 4.7588 101.3
1999-06 111.363 1.302 97.9 2005-12 298.7557 6.4053 101.6
1999-07 111.414 0.051 98.6 2006-01 303.5717 4.816 101.9
1999-08 112.827 1.413 98.7 2006-02 304.5163 0.9446 100.9
1999-09 115.079 2.252 99.2 2006-03 310.4907 5.9744 100.8
1999-10 115.39 0.311 99.4 2006-04 313.7023 3.2116 101.2
1999-11 116.559 1.169 99.1 2006-05 316.7098 3.0075 101.4
1999-12 119.898 3.339 99 2006-06 322.7564 6.0466 101.5
2000-01 121.22 1.322 99.8 2006-07 324.0108 1.2544 101
2000-02 121.5834 0.3634 100.7 2006-08 327.8867 3.8759 101.3
2000-03 122.5807 0.9973 99.8 2006-09 331.8654 3.9787 101.5
2000-04 124.1219 1.5412 99.7 2006-10 332.7472 0.8818 101.4
2000-05 124.0533 -0.0686 100.1 2006-11 337.5042 4.757 101.9
2000-06 126.6053 2.552 100.5 2006-12 345.6036 8.0994 102.8
2000-07 126.3239 -0.2814 100.5 2007-01 351.4988 5.8952 102.2

22
2000-08 127.79 1.4661 100.3 2007-02 358.6593 7.1605 102.7
2000-09 130.4738 2.6838 100 2007-03 364.0937 5.4344 103.3
2000-10 129.522 -0.9518 100 2007-04 367.4256 3.33187 103
2000-11 130.9941 1.4721 101.3 2007-05 369.7182 2.29258 103.4
2000-12 134.6103 3.6162 101.5 2007-06 377.8322 8.114 104.4
2001-01 137.5436 2.9333 101.2 2007-07 383.8849 6.05273 105.6
2001-02 136.2102 -1.3334 100 2007-08 387.205 3.32016 106.5
2001-03 138.7445 2.5343 100.8 2007-09 393.0989 5.89387 106.2
2001-04 139.9499 1.2054 101.6 2007-10 394.2042 1.10526 106.5
2001-05 139.0158 -0.9341 101.7 2007-11 399.7579 5.55374 106.9
2001-06 147.8097 8.7939 101.4 2007-12 403.4013 3.64339 106.5
2001-07 149.2287 1.419 101.5 2008-01 417.8462 14.44487 107.1
2001-08 149.9418 0.7131 101 2008-02 421.0378 3.19167 108.7
2001-09 151.8226 1.8808 99.9 2008-03 423.0545 2.01669 108.3
2001-10 151.4973 -0.3253 100.2 2008-04 429.2409 6.18638 108.5
2001-11 154.0883 2.591 99.7 2008-05 436.2216 6.98069 107.7
2001-12 158.3019 4.2136 99.7 2008-06 443.141 6.91942 107.1
2002-01 159.6393 1.3374 99 2008-07 446.3622 3.22115 106.3
2002-02 160.9356 1.2963 100 2008-08 448.8467 2.48451 104.9
2002-03 164.0646 3.129 99.2 2008-09 452.8987 4.05203 104.6
2002-04 164.5706 0.506 98.7 2008-10 453.1333 0.23461 104
2002-05 166.061 1.4904 98.9 2008-11 458.6447 5.51134 102.4
2002-06 169.6012 3.5402 99.2

数据来源:中国经济统计数据库,http://db.cei.gov.cn/。

为了考察货币供应量的变化对物价的影响,用广义货币 M2 的月增长量 X 作为解释变

量,以居民消费价格月度同比指数 Y 为被解释变量进行研究。首先估计如下回归模型

α + β 0 X t + ut
Yt =

回归结果如图 7.6 所示。

图 7.6 即期回归分析结果

从回归结果来看,X 的 t 统计量值显著,表明当期货币供应量的变化对当期物价水平的

影响在统计意义上有一定影响,但没有显现出这种影响的滞后性。为了分析货币供应量变化

影响物价的滞后性,做滞后 6 个月的分布滞后模型的估计,在 EViews 工作文档的方程设定

窗口中,输入

23
Y C X X(-1) X(-2) X(-3) X(-4) X(-5) X(-6)

回归结果见图 7.7。

图 7.7 滞后 6 期回归分析结果

从回归结果来看,X 的各滞后期的系数有增加,表明当期货币供应量的变化对物价水平

的影响要经过一段时间才能逐步显现。但各滞后期系数的 t 统计量值还不显著,因此还不能

据此判断滞后期究竟有多长。为此,做滞后 12 个月的分布滞后模型的估计,回归结果见图

7.8。

图 7.8 滞后 12 期回归分析结果

24
图 7.8 显示,从 X 到 X(-10)回归系数都不显著异于零,而 X(-11)的回归系数 t 统计量值

为 2.50,在 5%显著性水平下拒绝系数为零的原假设。这一结果表明,当期货币供应量变化

对物价水平的影响在经过 11 个月后明显地显现出来。为了考察货币供应量变化对物价水平

影响的持续期,做滞后 18 个月的分布滞后模型的估计,结果见图 7.9。

图 7.9 滞后 18 期回归分析结果

结果表明,从滞后 12 个月开始 t 统计量值显著,一直到滞后 16 个月为止,从滞后第 17

个月开始 t 值变得不显著;再从回归系数来看,从滞后 12 个月开始,货币供应量变化对物

价水平的影响明显增加,在滞后 14 个月时达到最大,然后逐步下降。

通过上述一系列分析,我们可以做出这样的判断:在中国,货币供应量变化对物价水平

的影响具有明显的滞后性,滞后期大约为四个季度,而且滞后影响具有持续性,持续的长度

大约为半年,其影响力度先递增然后递减,滞后结构为 Λ 型。当然,从上述回归结果也可

2
以看出,回归方程的 R 不高,DW 值也偏低,表明除了货币供应量外,还有其他因素影响

物价变化。如果分析的重点只是货币供应量变化对物价影响的滞后性,上述结果已能说明一

定问题。

本章小结
1.由于心理、技术以及制度等原因,经济变量之间的影响往往具有滞后效应,滞后变量

25
模型在经济分析中具有重要作用。分布滞后模型和自回归模型是两种常见的滞后变量模型。

2.分布滞后模型不能直接运用 OLS 方法进行估计,原因在于自由度损失、多重共线性

和滞后长度难于确定;克服这些困难的方法是采用变通估计方法,变通的估计方法有经验加

权法、阿尔蒙法及库依克法。

3.自回归模型的产生背景主要在于两个方面:一是无限分布滞后模型不能直接估计,为

了估计模型而对滞后结构作出某种假定(如库依克假定),然后通过变换形成自回归模型;

二是在模型中引入了预期因素,由于变量的预期值无法观测,因此对“期望模型”中预期的

形成作出某种假定,最后变换成自回归模型,例如自适应预期模型、局部调整模型。

4.库依克模型、自适应预期模型与局部调整模型的最终形式为自回归结构。在这三个模

型中,只有局部调整模型满足扰动项无自相关、与解释变量 X t 及Yt −1 不相关的古典假定,从

而可使用最小二乘法直接进行估计;而库伊克模型与自适应预期模型不满足古典假定,如果

用最小二乘法直接进行估计,则估计是有偏的,且不是一致估计。

5.为了缓解扰动项与解释变量 Yt −1 存在相关带来估计偏倚,可采用工具变量法;诊断一

阶自回归模型扰动项是否存在自相关可采用 BG 检验或德宾 h 检验法。

6.主要公式表见表 7.3。

表 7.3 主要公式表
Yt = α + β 0 X t + β 1 X t −1 + β 2 X t − 2 + L + β s X t − s
一般形式
+ γ 1Yt −1 + γ 2Yt − 2 + L + γ q Yt − q + u t
滞后变
分布滞后模型 Yt = α + β 0 X t + β 1 X t −1 + β 2 X t − 2 + L + β s X t − s + u t
量模型

自回归模型 Yt = α + β 0 X t + γ 1Yt −1 + γ 2 Yt − 2 + L + γ q Yt − q + u t

分布滞 基本模型 Yt = α + β 0 X t + β 1 X t −1 + β 2 X t − 2 + L + β s X t − s + u t

后模型
的阿尔 阿尔蒙变换 β i = α 0 + α 1i + α 2 i 2 + L + α m i m i = 0,1,2, L , s ; m < s

蒙估计
Yt = α + α 0 Z 0t + α 1 Z 1t + α 2 Z 2t + L + α m Z mt + u t
法 新模型
Z it = X t −1 + 2 i X t − 2 + 3i X t −3 L + s i X t − s

库伊克 基本模型 Yt = α + β 0 X t + β 1 X t −1 + β 2 X t − 2 + L + u t

26
模型
库伊克假定 β i = β 0 λi , 0 < λ < 1 , i = 0,1,2, L

Yt = α * + β 0* X t + β 1*Yt −1 + u t*
新模型
α * = (1 − λ )α , β 0* = β 0 , β1* = λ , u t* = u t − λu t −1

基本模型 Yt = α + βX t* + u t

自适应
预期模
自适应预期假定 X t* = X t*−1 + γ ( X t − X t*−1 )


Yt = α * + β 0* X t + β 1*Yt −1 + u t*
新模型
α * = γα , β 0* = γβ , β1* = 1 − γ , u t* = u t − (1 − γ )u t −1

基本模型 Yt * = α + βX t + u t

局部调 局部调整假定 Yt − Yt −1 = δ (Yt * − Yt −1 )


整模型
Yt = α * + β 0* X t + β 1*Yt −1 + u t*
新模型
α * = δα , β 0* = δβ , β1* = 1 − δ , u t* = δu t
自回归
模型自 德宾 h 检验 n d n
h = ρˆ = (1 − )
相关检 (h 统计量) 1 − nVar ( βˆ )
*
1
2 1 − nVar ( βˆ1* )

思考题
7.1 什么是滞后现象?产生滞后现象的原因主要有哪些?

7.2 分布滞后模型估计的主要困难是什么?实际应用中是如何解决这个困难的?

7.3 经验加权、阿尔蒙法与库伊克变换解决共线性问题的思路本质上是一样的,它们应

用了什么思路解决共线性问题?

7.4 如果分布滞后模型的系数有正有负,则没法应用库伊克变换,这种说法是否正确?

7.5 库伊克模型、自适应预期模型与局部调整模型有哪些共性和不同之处?模型估计会

存在哪些困难?如何解决?

7.6 叙述用阿尔蒙多项式法估计外生变量有限分布之后模型的方法步骤,对多项式的次

数 m 有哪些限制,为什么?

27
7.7 考虑如下模型:

Yt = α + β 1 X 1t + β 2 X 2t + β 3Yt −1 + u t

假定 Yt −1和u t 相关。为了消除相关,采用如下工具变量法:先求 Yt 对 X 1t 和 X 2t 的回归,得

到 Yt 的估计值 Yˆt ,然后做以下回归:

Yt = α + β 1 X 1t + β 2 X 2t + β 3Yˆt −1 + u t

其中 Yˆt −1 是第一步粗估计值 Yˆt 的滞后值。分析说明该方法为什么可以消除原模型中 Yt −1和ut

之间的相关性。

7.8 检验自回归模型随机扰动项是否存在自相关,为什么不能使用 DW 检验方法?

7.9 简述库伊克变换和阿尔蒙变换的区别。

7.10 说明使用德宾 h 检验法检验相关性的要点,并指出该方法使用的限制条件。

练习题

7.1 表 7.4 中给出了 1981-2015 年中国城镇居民人均年消费支出(PCE)和城镇居民人均

可支配收入(PDI)数据。

表 7.4 1981-2015 年中国城镇居民消费支出(PCE)和可支配收入(PDI)数据 (单位:元)


年度 城镇居民人均 城镇居民人均可 年度 城镇居民人均 城镇居民人均可支
消费支出 PCE 支配收入 PDI 消费支出 PCE 配收入 PDI
1981 456.80 500.40 1999 4615.91 5854.02
1982 471.00 535.30 2000 4998.00 6280.00
1983 505.90 564.60 2001 5309.01 6859.60
1984 559.40 652.10 2002 6029.88 7702.80
1985 673.20 739.10 2003 6510.94 8472.20
1986 799.00 900.90 2004 7182.10 9421.60
1987 884.40 1002.10 2005 7942.88 10493.00
1988 1104.00 1180.20 2006 8696.55 11759.50
1989 1211.00 1373.93 2007 9997.47 13785.80
1990 1278.90 1510.20 2008 11242.85 15780.76
1991 1453.80 1700.60 2009 12264.55 17174.65
1992 1671.70 2026.60 2010 13471.45 19109.44
1993 2110.80 2577.40 2011 15160.89 21809.78
1994 2851.30 3496.20 2012 16674.32 24564.72
1995 3537.57 4283.00 2013 18022.64 26955.10
1996 3919.47 4838.90 2014 19968.08 29381.00
1997 4185.64 5160.30 2015 21392.36 31790.31
1998 4331.61 5425.10
估计下列模型:

28
PCEt = A1 + A2 PDI t + µ t
PCEt = B1 + B2 PDI t + B3 PCEt −1 + υ t

(1) 解释这两个回归模型的结果。

(2) 短期和长期边际消费倾向(MPC)是多少?分析该地区消费同收入的关系。

(3) 建立适当的分布滞后模型,用库伊克变换转换为库伊克模型后进行估计,并对估计

结果进行分析判断。

7.2 表 7.5 中给出了中国 1980-2016 年固定资产投资 Y 与社会消费品零售总额 X 的资

料。取阿尔蒙多项式的次数 m=2,运用阿尔蒙多项式变换法估计以下分布滞后模型:

α + β 0 X t + β1 X t −1 + β 2 X t − 2 + β3 X t −3 + β 4 X t − 4 + ut
Yt =

表 7.5 中国 1980-2016 年固定资产投资 Y 与社会零售总额 X 数据 (单位:亿元)

年份 固定资产投资 社会消费品零售总 年份 固定资产投资 社会消费品零售总


Y 额X Y 额X
1980 910.9 2140.0 1999 29854.7 35647.9
1981 961.0 2350.0 2000 32917.7 39105.7
1982 1230.4 2570.0 2001 37213.5 43055.4
1983 1430.1 2849.4 2002 43499.9 48135.9
1984 1832.9 3376.4 2003 55566.6 52516.3
1985 2543.2 4305.0 2004 70477.4 59501.0
1986 3120.6 4950.0 2005 88773.6 67176.6
1987 3791.7 5820.0 2006 109998.2 76410.0
1988 4753.8 7440.0 2007 137323.9 89210.0
1989 4410.4 8101.4 2008 172828.4 114830.1
1990 4517.0 8300.1 2009 224598.8 132678.4
1991 5594.5 9415.6 2010 251683.8 156998.4
1992 8080.1 10993.7 2011 311485.1 183918.6
1993 13072.3 14270.4 2012 374694.7 210307.0
1994 17042.1 18622.9 2013 446294.1 237809.9
1995 20019.3 23613.8 2014 512020.7 271896.1
1996 22913.5 28360.2 2015 561999.8 300930.8
1997 24941.1 31252.9 2016 606465.7 332316.3
1998 28406.2 33378.1
7.3 利用表 7.5 的数据,运用局部调整假定或自适应预期假定估计以下模型参数,并解释

模型的经济意义,探测模型扰动项的一阶自相关性:

1)设定模型

Yt * = α + βX t + u t

*
其中 Yt 为预期最佳值。

2)设定模型

Yt * = αX tβ e ut

29
*
其中 Yt 为预期最佳值。

3)设定模型

Yt = α + βX t* + u t

*
其中 X t 为预期最佳值。

7.4 表 7.6 给出中国各年末货币流通量 Y,社会商品零售额 X1、城乡居民储蓄余额 X 2

的数据。

表 7.6 中国年末货币流通量、社会商品零售额、城乡居民储蓄余额数据 (单位:亿元)

年份 年末货币流通量 Y 社会消费品零售总额 X1 城乡居民储蓄年底余额 X2


1989 2344.0 8101.4 5184.50
1990 2644.4 8300.1 7119.60
1991 3177.8 9415.6 9244.90
1992 4336.0 10993.7 11757.30
1993 5864.7 14270.4 15203.50
1994 7288.6 18622.9 21518.80
1995 7885.3 23613.8 29662.30
1996 8802.0 28360.2 38520.80
1997 10177.6 31252.9 46279.80
1998 11204.2 33378.1 53407.47
1999 13455.5 35647.9 59621.83
2000 14652.7 39105.7 64332.38
2001 15688.8 43055.4 73762.43
2002 17278.0 48135.9 86910.65
2003 19746.0 52516.3 103617.65
2004 21468.3 59501.0 119555.39
2005 24031.7 67176.6 141050.99
2006 27072.6 76410.0 161587.30
2007 30334.3 89210.0 172534.19
2008 34219.0 114830.1 217885.35
2009 38246.0 132678.4 260771.66
2010 44628.2 156998.4 303302.49
2011 50748.5 183918.6 343635.89
2012 54659.8 210306.9 399551.00
2013 58574.4 237809.9 447601.57
2014 60259.5 271896.1 485261.34

α + β1 X 1t + β 2 X 2t + µt
利用表中数据设定模型: Yt =
*

Yt* = α X 1βt 1 X 2βt 2 eut

*
其中,Yt 为长期(或所需求的)货币流通量。试根据局部调整假设,作模型变换,估计并检验

参数,对参数经济意义做出解释。

7.5 根据四川省 1978—2014 年的消费总额 Y(亿元)和收入总额 X(亿元)的年度资


料,估计出库伊克模型如下:

30
Yˆt =
−6.91 + 0.28 X t + 0.82Yt −1
t = (−1.69) (5.89) (12.68)
=R 2 0.97
= DW 1.45
试回答下列问题:

1)分布滞后系数的衰减率是多少?

2)模型中是否存在多重共线性问题?请说明判断的理由。

3)收入对消费的即期和长期影响乘数是多少?

4)某同学查表发现,在显著性水平 α = 0.05 下,DW 检验临界值为 dl = 1.36 ,

d h = 1.59 。请问该同学试图得出什么结论?你认为该同学的做法是否存在问题?请帮该同

学完成后续工作。

7.6 利用某地区 1980—2014 年固定资产投资(Y)与地区生产总值 GDP(X)的数据资

料(单位:亿元),使用 OLS 法估计出如下模型:

Yˆt =
−16.1208 + 0.6265 X t + 0.2613Yt −1
=t (−3.21) (6.52) (2.41)
=R 2 0.9855
= DW 1.5321
(1)上述模型是否存在自相关性问题?

(2)如果将上述模型看成是局部调整模型的估计结果,试计算调节系数 δ 。

7.7 联系自己所学的专业选择一个实际问题,设定一个分布滞后模型或自回归模型,并

自己去收集样本数据,用本章的方法估计和检验这个模型,你如何评价自己所做的这项研究?

31
第八章 虚拟变量回归

引子

定性因素对房地产价格有显著影响吗?
不断走高的房地产价格已经成为人们关注的重点。很多研究认为,影响商品房价格的因

素有多个方面,例如:

1.成本费用因素:包括土地取得和开发的成本、建筑物建造成本、其他费用;

2.房地产供求因素:包括住房需求量、房地产开发量等;

3.经济因素:包括宏观经济状况、物价状况、居民收入状况等;

4.人口因素:包括人口密度、家庭结构等;

5.社会因素:包括政治安定社会治安状况、城市化发展水平、消费心理等;

6.行政因素:包括土地制度和住房制度、房地产价格政策、税收政策、城市发展规划、

投资优惠政策等;

7.区域因素:包括所处地段的市政基础设施、交通状况、公共配套设施、学校、医院、

商业网点、环境状况等;

8.个别因素:包括土地个别因素和建筑物造型、风格、色调、朝向、结构、材料、功能

设计、施工质量、物业管理水平等;

9.房地产投机因素:投机者在房地产市场中的投机活动;

10.自然因素:包括自然环境、地质、地形、地势及气候等。

在影响房地产价格的众多因素中,成本因素、房地产供求因素、经济因素、人口因素等

是比较容易量化的定量因素;而社会因素、行政因素、区位因素、个别因素、投机因素、自

然因素等是不易量化的定性因素。显然,在研究房地产价格影响机理时,需要分析那些不易

量化的定性因素对房地产价格是否真的有显著影响。

能否把定性的因素也引入计量经济模型中呢? 怎样才能在模型中有效地表示这些定性

因素的作用呢?


资料来源:徐静; 武乐杰, 房地产价格影响因素的解释结构模型分析, 金融经济, 2009,(10)

1
第一节 虚拟变量

一、虚拟变量的基本概念
在前面各章的分析中,被解释变量主要是受可以直接度量的定量因素的影响,如收入、
产出、商品需求量、价格、成本、资金、人数等。但现实经济生活中,影响被解释变量变动
的因素,除了可以直接观测数据的定量变量外,可能还包括一些本质上为定性因素的影响,
例如性别、种族、职业、季节、文化程度、战争、自然灾害、政府经济政策的变动等。在实
际的经济分析中,这些定性因素有时具有不可忽视的重要作用。例如,研究居民收入水平时,
职业、性别、文化程度、就业的地域等因素,通常是值得考虑的影响因素。因此,在计量经
济学的建模中有时需要将定量因素和定性因素同时纳入模型之内。

定量因素是指那些可直接测度的数值型因素,如国内生产总值 GDP、广义货币供应量

M2 等。定性因素,或称为属性因素,如男性或女性、城市居民或非城市居民、气候条件正

常或异常、政府经济政策不变与改革等。这类定性因素有共同的特征,即它们表示的都是某

种属性,是说明某种属性或状态存在与否的非数值型因素,属性因素的类型或水平往往是

“非此即彼”的,而且不能直接用可观测的数据精确测度与描述。

为了在模型中反映定性因素,可以引入虚拟变量作为表现定性因素的变量。虚拟变量(或

称为属性变量、双值变量、类型变量、定性变量、二元型变量等),是人工构造的作为属性

因素代表的变量,通常用字母 D(或 dummy 的缩写 DUM)表示。一般情形下,虚拟变量

的取值为 0 和 1。当虚拟变量取值为 0,即 D=0 时,表示某种属性或状态的类型或水平不出

现或不存在;当虚拟变量取值为 1,即 D=1 时,表示某种属性或状态的类型或水平出现或存

在。例如,构造政府经济政策的虚拟变量,当某经济政策不变时,虚拟变量取值为 0,当某

经济政策改变时,虚拟变量取值为 1。这种做法实际上是一种变换或映射,将不能精确计量

的定性因素的水平或状态变换为用 0 和 1 来描述。

二、虚拟变量的作用
在计量经济模型中,虚拟变量可以发挥多方面的作用:①可以作为属性因素的代表,如

性别、所有制等;②可以作为某些非精确计量的数量因素的代表,如受教育程度、管理者素

质等;③可以作为某些偶然因素或政策因素的代表,如战争、灾害、改革前后等;④可以作

为时间序列分析中季节(月份)的代表;⑤可以实现分段回归,研究斜率、截距的变动,或

比较两个回归模型的结构差异,等等。

在计量经济学中,把包含有虚拟变量的模型称为虚拟变量模型。常用的虚拟变量模型有

2
三种类型:①解释变量中只包含虚拟变量,作用是在假定其他因素都不变时,只研究定性变

量是否使被解释变量表现出显著性差异;②解释变量中既含定量变量,又含虚拟变量,研究

定量变量和虚拟变量同时对被解释变量的影响;③被解释变量本身为虚拟变量的模型,是被

解释变量本身取值为 0 或 1 的模型,
适于对某社会经济现象进行“是”与“否”的判断研究。

三、虚拟变量的设置规则

在计量经济模型中引入虚拟变量,可以使我们同时兼顾定量因素和定性因素的影响和作

用,但是,由于定性因素通常具有多种类型或水平,在设置虚拟变量时应遵循一定的规则。

1、虚拟变量的取值原则

虚拟变量 D 取值为 0,还是取值为 1,应从分析问题的目的出发予以界定,要注意区分

所代表的是基础类型还是比较类型。虚拟变量取“0”,通常代表作为比较基础的类型;虚拟

变量取“1”
,通常代表与基础类型相比较的类型。

例如,为比较政府经济政策变动对居民收入 X 与消费支出 Y 关系的影响,此时是在政

府经济政策不变的基础上进行比较,模型和虚拟变量可以设定为:

Yt =α 0 + α1Dt + β X t + ut (8.1)

0, 基础类型(政府经济政策不变)
其中: Dt = 
1, 比较类型 : (政府经济政策变动)

当 Dt = 0 时,Yt =α 0 + β X t + ut ,这里的 α 0 为基础类型(政府经济政策不变)时模型的截

距。当 Dt = 1 时,Yt = α 0 + α1 + β X t + ut ,这里的 (α 0 + α1 ) 为比较类型(政府经济政策变

化)时模型的截距, α1 为与基础类型相比较的差异截距系数。

2、避免落入“虚拟变量陷阱”

若 1 个定性因素有 m 个相互排斥的类型(或属性、水平)时,按照模型设定中有无截

(1)在有截距项的模型中,只能引入 m-1
距项,虚拟变量个数的设置规则分为两种情况:

个虚拟变量,否则会陷入所谓的“虚拟变量陷阱”,产生完全的多重共线性;(2)在无截距

项的模型中,可以引入 m 个虚拟变量,而不会导致完全的多重共线性。

例如,城镇居民和农村居民住房消费支出的模型可设定为:

Ci =α1 + α 2 Di + β Yi + ui (8.2)

其中, Ci 为居民的住房消费支出,Yi 为居民的可支配收入。 Di 为虚拟变量,即当 Di = 1 时

3
为城镇居民;当 Di = 0 时为其他(农村居民)。

这里区分城镇居民和农村居民的定性变量的类型有 m=2 个,按虚拟变量的设置规则,

在有截距项的模型中,应引入 m-1=2-1=1 个虚拟变量。

但是,如果引入了 m=2 个虚假变量,例如

Ci =α 0 + α1D1i + α 2 D2i + β Yi + ui (8.3)

1 城镇居民 1 农村居民
其中: D1i =  D2i = 
0 其他 0 其他

这时,若 D1i =1 同时有 D2i =0;若 D1i =0 同时有 D2i =1。对于任何被调查的居民家庭都有

D1i + D2i =1,即 D1i + D2i 等于截距项 α 0 所对应的总是取值为 1 的变量,这时 D1 、 D2 和截

距项对应的变量存在完全的多重共线性,无法利用 OLS 估计其参数,从而陷入了“虚拟变

量陷阱”。

如果所设定的模型中没有截距项,例如

Ci = α1D1i + α 2 D2i + β Yi + ui (8.4)

当 D1 = 1 , D2 = 0 时, Ci =α1 + β Yi + ui ;

当 D1 = 0 , D2 = 1 时, Ci =α 2 + β Yi + ui 。

注意,(8.4)式中 α1 , α 2 等参数的意义不再是与基础类型比较的差异截距系数,而分别是

相对应类型的截距。

这时,所设定的模型中没有截距项,虽然有 D2i + D3i =1,但是因模型中没有截距项(或

视为截距项所对应的变量总是为 0),所以不会出现 D2 、 D3 和截距项对应变量完全的多重

共线性。

“虚拟变量陷阱”的实质,是模型中虚拟变量的设置是否会导致完全多重共线性的问题。

由此可见,对虚拟变量的运用要谨慎,虚拟变量的使用得当常能发挥积极的作用,但在模型

中引入虚拟变量的数量要适当,引入的虚拟变量的数量过度,则可能带来负面的影响。

第二节 虚拟解释变量的回归

4
在计量经济模型中,引入虚拟解释变量的途径有两种基本方式:一是加法方式;二是乘

法方式。应当注意的是,不同的途径引入虚拟变量有不同的作用,以加法方式引入虚拟变量

可以改变原有模型的截距;以乘法方式引入虚拟变量可以改变原有模型的斜率。

一、用虚拟变量表示不同截矩的回归——加法方式
以加法方式引入虚拟解释变量的模型,如(8.5)式那样,

Yt =α1 + α 2 X t + α 3 D + ut (8.5)

(8.5)式所设定的计量经济模型中,在原有定量解释变量模型设定基础上以相加方式引入虚拟

解释变量。以加法形式引入虚拟解释变量,从计量经济模型的意义看,其作用是改变了设定

模型的截距水平。

以加法方式引入虚拟变量时,可分为四种情形:①解释变量只有一个分为两种相互排斥

类型的定性变量而无定量变量;②解释变量包含一个定量变量和一个分为两种类型的定性变

量;③解释变量包含一个定量变量和一个两种以上类型的定性变量;④解释变量包含一个定

量变量和一个以上定性变量。

1、解释变量只有一个分为两种相互排斥类型的定性变量而无定量变量的回归

这种情况的模型又被称为方差分析模型,例如(8.6)式

Yi = α + βDi + ui (8.6)

其中,Yi 为居民的年可支配收入, Di 为虚拟解释变量, Di =1 代表城镇居民; Di =0 代表非

城镇居民。

(8.6)式的意义是,假设其他因素(包括文化程度、职业、性别等)保持不变的条件

下,研究城镇居民和非城镇居民的收入是否存在差别。当 ui 满足古典假设时,由式(8.6)

有:

非城镇居民的年平均收入: E (Yi | Di = 0) = α

城镇居民的年平均收入: E (Yi | Di = 1) = α + β

可见,截距项 α 给出了非城镇居民的年平均可支配收入水平,而另一系数 β 则表明城镇居

民年平均可支配水平不同于非城镇居民年平均可支配收入的差异部分。
(8.6)式中虚拟解释

变量的作用是改变设定模型的截距水平, β 代表截距差异的大小。

为了检验城镇居民和非城镇居民的年均可支配收入是否有显著差别,可构造假设 H0:

5
β = 0 ,即城镇与非城镇居民年均可支配收入无差别。对(8.6)式回归,依据 β 估计值的 t

检验是否显著,可做出接受或不能接受 H0 假设的判断。

2、解释变量包含一个定量变量和一个分为两种类型定性变量的回归

Yi =α1 + α 2 Di + β X i + µi (8.7)

1 城镇居民
其中: Y 为消费支出,X 为收入, Di = 
0 农村居民

模型(8.7)式由一个定量解释变量 X 和一个分为两种类型的虚拟解释变量组成,其意

义在于描述收入和城乡差别对居民消费支出的影响。注意这里一个定性变量具有两种类型,

只使用了一个虚拟变量。当(8.7)式中的 ui 服从古典假定时,基础类型(农村居民消费支出)

和比较类型(城镇居民消费支出)分别为

农村居民消费支出: E (Yi | X i , D= ) α1 + β X i
i 0=

城镇居民消费支出: E (Yi | X i , Di =1) =


(α1 + α 2)+ β X i

其中 α 2 为差异截距系数。

式(8.7)可表示为图 8.1,表明非城镇居民与城镇居民两种类型收入函数的斜率相同(均

为 β ),而截距水平不同,非城镇居民收入函数的截距为 α1 ,而城镇居民收入函数的截距则

为 α1 + α 2 。这说明,城镇居民和非城镇居民在消费支出水平上,存在着大小为 α 2 的差异,

而由收入因素而产生的平均消费支出水平的变化却是相同的。

α2

α1

0
X

图 8.1 城镇农村居民消费支出水平的差异

在 H 0:α 2 = 0 的假设下,对参数 α 2 的 t 检验,可以进行消费支出是否存在城乡差异的

6
检验。

3、解释变量包含一个定量变量和一个两种以上类型的定性变量的回归

考虑以下模型:

Yi = α1 + α 2 D2i + α 3 D3i + βX i + ui (8.8)

其中: Yi 为年医疗保健费用支出, X i 为居民的年可支配收入,

1 只是高中教育
D2 = 
0 其他

1 大专及大专以上
D3 = 
0 其他
显然,模型(8.8)式是描述居民的年医疗保健费用支出与居民可支配收入(定量变量)

和受教育程度(定性变量)间的因果关系。这里,定性因素(受教育的程度)划分为三种类

型:高中以下、高中、大专及大专以上。注意这里的定性变量有 3 种类型,依据虚拟变量设

置规则引入了 m-1=3-1=2 个虚拟变量,而且当一个定性变量有多种类型时,虚拟变量可

同时取值为 0,但不能同时取值为 1,因为同一定性变量的各种类型间“非此即彼”。

当式(8.8)服从古典假定时,有:

1) 基础类型

高中以下教育: E (Yi | X i , D2 = 0, D3 = 0) = α1 + βX 1

2) 比较类型

(1) 高中教育

E (Yi | X i , D2 = 1, D3 = 0) = (α1 + α 2 ) + βX i

(2) 大专及大专以上

E (Yi | X i , D2 = 0, D3 = 1) = (α1 + α 3 ) + βX i

这表明,三种不同教育程度居民的医疗保健费用年均支出的起点水平(截距)不同,截

距差异系数为 α 2 和 α 3 。对式(8.8)进行回归,检验 H 0 : α 2 = 0 和 H 0 : α 3 = 0 的 t 检验可

以发现与比较基准组(高中以下教育水平)相比,另两种类型截距的差异在统计上是否存在

显著差异。关于 α 2 = α 3 = 0 的联合假设检验,也可由方差分析或 F 检验完成。

4、解释变量包含一个定量变量和一个以上定性变量的回归

以加法形式引入虚拟解释变量的作法,很容易扩展到处理一个以上定性变量的情形。例

7
如依据某地区家庭调查资料所建立的卷烟需求模型:

Qi = α1 + α 2 D2i + α 3 D3i + βYi + ui (8.9)

其中, Qi 为卷烟需求量, Yi 为居民可支配收入, D2i 和 D3i 分别为虚拟解释变量,

1 城镇居民 , 1 男性
D2i =  D3i = 
0 其他 0 女性

一般认为,城镇居民的卷烟消费量高于非城镇居民,同时男性居民的吸烟量大于女性居

民。为了分析城乡差别和性别差别对卷烟需求的影响,模型(8.9)以加法形式引入了两个

虚拟解释变量。注意,这里有两个定性变量选用了两个虚拟变量去表示,这并不会出现“虚

拟变量陷阱”,对比前面一个定性变量有三种类型时也用了两个虚拟变量,二者性质是不同

的。而且注意这里的 D2i 和 D3i 是代表不同定性变量的虚拟变量,可以同时为 0,也可同时

为 1,因为不同定性变量间并没有“非此即彼”的关系。

当式(8.9)满足古典假设时,有以下类型:

1) 基础类型

农村女性居民

E (Qi | Yi , D2 = 0, D3 = 0) = α1 + βYi

2) 比较类型

(1) 农村男性居民

E (Qi | Yi , D2 = 0, D3 = 1) = (α1 + α 3 ) + βYi

(2) 城镇女性居民

E (Qi | Yi , D2 = 1, D3 = 0) = (α1 + α 2 ) + βYi

(3) 城镇男性居民

E (Qi | Yi , D2 = 1, D3 = 1) = (α1 + α 2 + α 3 ) + βYi

显然,模型(8.9)是以农村女性居民为基础类型,并假设各种类型居民的卷烟需求函

数只是有不同的截距,相对于收入的斜率系数 β 相同。用 t 检验分别检验 α 2 和 α 3 的统计显

著性,可验证两个定性变量对截距是否有显著影响。

上述讨论的结果,可以推广到解释变量有多个定量变量和多个定性变量的情形。在推广

过程中需要注意引入虚拟变量的个数应遵从前述的设置规则。例如,在考虑季节因素对冷饮

销售量影响时,有春、夏、秋、冬四个类型的季节,依据设置规则,可引入 m-1=4-1=3
8
个虚拟解释变量。

二、用虚拟变量表示不同斜率的回归——乘法方式
以乘法形式引入虚拟解释变量,是在所设定的计量经济模型中,将虚拟解释变量与其他

解释变量相乘作为解释变量,以表示模型中斜率系数的差异。以乘法形式引入虚拟解释变量

的主要作用在于:①关于两个回归模型的比较;②因素间的交互影响分析;③提高模型对现

实经济现象的描述精度。

1、回归模型的比较——结构变化检验

以加法方式引入虚拟解释变量,属性因素仅影响不同类型模型的平均水平,而不会影响

不同类型模型的相对变化。但是在现实经济生活中,属性因素也可能影响模型的斜率系数发

生变化。例如,随着可支配收入水平的提高,城乡居民的消费结构将出现较大的差异,这种

差异会表现在定性因素对斜率的影响上。又如,研究我国改革开放前后储蓄——收入总量间

关系是否发生了变化时,也存在着经济结构变化而导致模型斜率发生变化的问题。这类问题

可归结于两个回归模型的比较。例如,在研究改革开放前后储蓄——收入总量关系时,所设

定的模型如下.

1) 改革开放前

λ1 + λ2 X t + u1t
Yt = t=1950,1951,……,1977 (8.10)

2)改革开放后

γ 1 γ 2 X t + u2 t
Yt =+ t=1978,1979,……,2009 (8.11)

其中:Y 为储蓄总额(亿元),X 为收入总额(亿元), u1t 、 u 2t 为随机扰动项。如果我们分

别对式(8.10)和式(8.11)在不同的时间区间内回归,则可能得到以下四种结果:

(1) λ1 = γ 1 , λ2 = γ 2 ,表明这两个回归模型是相同的,或称为重合回归;

(2) λ1 ≠ γ 1 , λ 2 = γ 2 ,表明这两个回归模型仅在位置水平上(即截距水平上)存在差

异,或称为平行回归;

(3) λ1 = γ 1 , λ2 ≠ γ 2 ,表明这两个回归模型具有相同的位置水平(或起点相同)而变

化速率不等,或称为共点回归;

(4) λ1 ≠ γ 1 , λ2 ≠ γ 2 ,表明这两个回归模型完全不相同,或称为不同的回归。

以上四种情形可用图示法描述(见图 8.2):

9
储蓄 储蓄
γ2
γ 2 = λ2 1
λ2
1 1
γ1

γ 1 = λ1 λ1

收入 收入
(a)重合回归
(b)平行回归
γ2
储蓄 γ2 储蓄
1
1
λ2
1 λ2
1
γ 1 = λ1 γ 1

λ1
收入
收入
(c)共点回归
(d)不同的回归
图 8.2 储蓄—收入回归模型

现在的问题是,当我们运用样本数据对式(8.10)和式(8.11)进行回归后,如何界定

所得结果在统计意义上属于哪一种类型呢?这时可采用以乘法形式引入虚拟变量的方法。例

如,对于改革开放前后储蓄—收入模型,可设定为:

Yt = α1 + α 2 Dt + β1 X t + β 2 ( Dt X t ) + ut (8.12)

其中,Y 为储蓄;X 为收入;D 为虚拟变量,


0 改革开放以前
Dt = 
1 改革开放以后

显然在式(8. 12)中,以乘法形式引入了虚拟变量所形成的解释变量为 Dt X t ,以加法

形式引入虚拟变量所形成的解释变量是 Dt 。

事实上,当式(8.12)满足古典假设时,改革开放前和改革开放后的平均储蓄函数分别

为:

1)改革开放前

E{Yt | X t , Dt = 0, } = α 1 + β1 X t

2) 改革开放后
10
E{Yt | X t , Dt = 1, } = (α 1 + α 2 ) + ( β1 + β 2 ) X t

与 (8.10) 式及 (8.11) 式相比,有: λ1 = α1 、 λ2 = β1 ; γ 1 = α1 + α 2 、 γ 2 = β1 + β 2 。

在 (8.12) 式中, α 2 称为截距差异系数, β 2 称为斜率差异系数,分别代表改革开放前后储

蓄函数截距与斜率所存在的差异。当利用改革开放前后的数据估计(8.12)式时,等价于分别

对 (8.10) 式和 (8.11) 式两个储蓄函数进行估计。

假如对 (8.12) 式用 OLS 法估计得

Yˆt = −1.7502 + 1.4839 Dt + 0.1504 X t − 0.1034 Dt X t

(0.3319) (0.4704) (0.0163) (0.0332)

t=(-5.2733) (3.1545) (9.2270) (-3.1144)

结果表明,截距和斜率差异系数 α 2 、 β 2 在统计意义下均为显著的,说明改革开放前后的储

蓄—收入行为的确不相同。即

1)改革开放前

Yˆt = −1.7502 + 0.1504 X t

2)改革开放后

Yˆt = (−1.7502 + 1.4839) + (0.1504 − 0.1034) X t

= −0.2663 + 0.0470 X t

以乘法形式引入虚拟变量作回归模型的比较和结构变化检验有一些优点:①用一个回

归替代了多个回归,简化了分析过程;②可以方便地对模型结构的差异作各种假设检验;③

合并了的回归增加了自由度,提高了参数估计的精确性。但是,也应注意合并后模型的 ui 应

服从基本假定,特别是所比较的方程的方差应相同,否则会出现异方差。

2、交互效应分析

当分析解释变量的影响时,大多数情形只是分析了解释变量自身变动对被解释变量的影

响作用,而没有深入分析解释变量间的相互作用对被解释变量的影响。前面讨论的分析两个

定性变量对被解释变量影响的虚拟变量模型中,暗含着一个假定:两个定性变量是分别独立

地影响被解释变量的。但是在实际经济活动中,两个定性变量对被解释变量的影响可能存在

一定的交互作用,即一个解释变量的边际效应有时可能要依赖于另一个解释变量。为描述这

11
种交互作用,可以把两个虚拟变量的乘积以加法形式引入模型。

考虑下列模型:

Yi = α1 + α 2 D2i + α 3 D3i + βX i + ui (8.13)

其中:Yi 为农副品生产总收益,X 为农副产品生产投入,D2i 为代表油菜生产的虚拟变量, D3i

为代表养蜂生产的虚拟变量。这里

1 发展油菜生产 1 发展养蜂生产
D2i =  D3 = 
0 其他 0 其他

显然(8.13)式描述了是否发展油菜生产与是否发展养蜂生产的差异对农副产品总收益

的影响。虚拟解释变量 D2i 和 D3i 是以加法形式引入的,那么暗含着假设:油菜生产和养蜂

生产是分别独立地影响农副品生产总收益。但是,在发展油菜生产的同时也发展养蜂生产,

所取得的农副产品生产总收益,可能会高于分别只发展油菜生产或只发展养蜂生产的情况。

即在是否发展油菜生产与养蜂生产的虚拟变量 D2i 和 D3i 间,很可能存在着一定的交互作用,

且这种交互影响对被解释变量农副产品生产收益会有影响。

为了描述交互作用对被解释变量的效应,在(8.13)式中以加法形式引入两个虚拟解释

变量的乘积,即

Yi = α1 + α 2 D2i + α 3 D3i + α 4 ( D2i D3i ) + βX i + ui (8.14)

(8.14)式中各变量的含义与(8.13)式相同。

(1) 基础类型:不发展油菜生产,也不发展养蜂生产时农副产品生产总收益的平均

支出:

E (Yi | D2 = 0, D3 = 0, X i ) = α1 + βX i

(2)比较类型:同时发展油菜生产和养蜂生产时,农副产品生产总收益的平均支出

E (Yi | D2 = 1, D3 = 1, X i ) = (α 1 + α 2 + α 3 + α 4 ) + βX i

其中,α 2 为是否发展油菜生产对农副产品生产总收益的截距差异系数;α 3 为是否发展养蜂

生产对农副产品生产总收益的截距差异系数; α 4 为同时发展油菜生产和养蜂生产时对农副

产品生产总收益的交互效应系数。 α 2 ~ α 4 代表截距水平的差异。

关于交互效应是否存在,可借助于交互效应虚拟解释变量系数的显著性检验来加以判

12
断。如果 t 检验表明交互效应虚拟变量 D2i、D3i 在统计意义上是显著时,说明交互效应对 Yi

存在显著影响。

3、分段线性回归

有的社会经济现象的变动,会在解释变量达到某个临界值时发生突变,为了区分不同阶

段的截距和斜率可利用虚拟变量进行分段回归。

例如,某公司为了激励公司销售人员,按其销售额的一定比例计提奖励,但是销售额在

* *
某一目标水平 X 以下和以上时计提奖励的方法不同。当销售额高于 X 时,计提奖励额与

* *
销售额的比例要高于销售额低于 X 时的比例,也就是高于 X 时,奖励额与销售额的线性

关系更为陡峭(图 8.3)
。为了确切地描述奖励额度(Y)与销售额(X)间的关系,需要分

两段进行回归。这种分段回归可以用虚拟变量来实现。

X
0 X∗
图 8.3 奖励额与销售额的关系

设虚拟变量 D 为:

1 X ≥ X*
D=
0 X < X*

则奖励额度( Yt )和销售额( X t )间的关系式可以统一地表示为:

Yt = α 0 + β1 X t + β 2 ( X t − X * ) Dt + ut (8.15)

*
其中,Yt 为奖励额,X t 为销售额,X 为已知的销售目标临界水平。利用统计资料估计(8.15)

式的参数,就可以得到不同斜率和截距的回归方程:

*
(1) 销售额低于 X 时

E (Yt | X t , D = 0, ) = α 0 + β1 X t

*
(2) 销售额不低于 X

13
E (Yt | X t , D = 1, ) = (α 0 + β1 X * ) + ( β1 + β 2 )( X t − X * )

整理,得

E (Yt X t , D = 1) = (α 0 − β 2 X * ) + ( β1 + β 2 ) X t

显然, β1 是图 8.3 中第Ⅰ段回归直线的斜率,而 βˆ1 + βˆ 2 则是第Ⅱ段回归直线的斜率。只要

检验 β 2 的统计显著性,就可以判断在所设定的临界水平 X 处是否存在着“突变”。
*

应当注意,在分段回归中,第一、二段回归不仅截距不同,而且斜率也不同。在分为两

段回归时,使用了一个虚拟变量,容易推广,分为 K 段回归时,可用 K-1 个虚拟变量。

*第三节 虚拟被解释变量 ①

在计量经济学模型中,虚拟变量除了可以作为解释变量外,还可以作为被解释变量。本

节仅讨论当虚拟变量作为被解释变量时,其作用是对某一经济现象或活动进行“是”与“否”

的判断或决策。例如,研究是否购买商品住房、是否参加人寿或财产保险、是否能按期偿还

贷款、新产品在市场上是否畅销、对某一改革措施所持的态度等。这些问题的特征是被研究

的对象(即被解释变量)在受到多种因素影响时,其取值只有两种状态:
“是”与“否”。这

在计量经济学中被称为“二项选择”现象,这种现象常在市场研究或社会问题研究中遇到。

如何处理二项选择模型的估计、推断问题,是本节要解决的问题。

一、线性概率模型(LPM)
1、什么是线性概率模型

假设住户是否购买商品房的决定主要依赖于其收入水平。那么考虑下列模型:

Yi = β1 + β 2 X i + ut (8.16)

其中, X i 为住户的收入;Y 为一虚拟变量,表示住户购买商品住房的情况:

1 已购买商品住房
Y =
0 未购买商品住房

现在的问题是:我们前面讨论的回归分析主要是研究 E (Yi | X i=
) β1 + β 2 X i 的问题,

即研究条件均值的轨迹的问题,而在上述模型中,被解释变量是某种属性发生与否的状况,

怎样把某种属性发生与否的问题同条件均值的轨迹研究联系起来?当然,在计量经济学中,


本节内容本科教学中供选择使用。

14
研究被解释变量某种属性发生与否,通常是研究这种属性发生与否的概率。也就是说,上述

问题可表述为:怎样把被解释变量某种属性发生与否的概率问题同条件均值的轨迹研究联系

起来?另外,若概率问题与条件均值轨迹能够联系起来的话,那么,我们所讨论的线性回归

分析会出现什么问题?

分析 (8.32) 式,其中,当 u i 服从 E( u i | X i )=0,有:

E (Yi | X i ) = β1 + β 2 X i (8.17)

另外, Yi 是取值为 0 和 1 的随机变量,那么 Yi 有下列分布( pi 为 Yi =1 的概率):

Yi 0 1

概率 1- pi pi

根据数学期望的定义

E (Yi ) = 0 × (1 − pi ) + 1 × pi = pi (8.18)

也就是说, E (Yi ) 等于 Yi 取值为 1 时的概率,即:

(Yi ) Pr ob
E= = (Yi 1|=
X i ) pi (8.19)

注意事件 Y=1 发生是在给定收入 X 的条件下发生的,因此 E (Yi ) = E (Yi | X i ) 于是,比较 (8.17)

式和 (8.18) 式,则有:

E (Yi | X i ) = β1 + β 2 X i = pi (8.20)

表明购买商品用房的概率是收入的线性函数。像(8.16)式那样,以虚拟变量作为被解释变量

的模型的条件期望实际上等于随机变量 Yi 取值为 1 的条件概率。即当住户的收入水平为 X

时,其购买商品住房的概率可表示成 X 的线性函数,故 (8.16) 式也被称为线性概率模型

(LPM)。显然,只要得到 (8.16) 式中 β1 和 β 2 的估计量后,就可以估计出不同收入水平住

户购买商品住房的概率。

由于购买商品住房的概率 pi 必须在 0 和 1 之间,故在估计式(8.16)时必须满足约束条件:

0 ≤ E (Yi = 1 | X i ) ≤ 1 (8.21)

2、线性概率模型的估计

从形式上看, (8.16) 式与普通的线性计量经济模型相似,是否能够运用 OLS 法直接对

15
其进行估计呢?答案是否定的。因为直接采用 OLS 法对(8.16)式那样的模型进行估计,

将会遇到一些特殊的问题,使得估计结果失去了合理的经济解释,因而需要寻求相应的处理

方法。

(1)随机扰动项 u i 的非正态性。在线性概率模型中,关于 ui 的正态性假设不再成立,

因为(8.16)式的随机误差项为

ui = Yi − β1 − β 2 X i (8.22)

1 − β1 − β 2 X i , 当 Yi=1 时
ui = 
 − β1 − β 2 X i , 当 Yi=0 时

显然,这里的 ui 不遵从正态分布。

线性概率模型中的随机扰动项 ui 不遵从正态分布,对参数的估计并不产生影响,OLS

法本身并不要求随机扰动项 ui 具备正态性,此时参数的 OLS 估计仍是最佳无偏估计量。但

对参数的假设检验和区间估计要求随机扰动项 ui 遵从正态分布。不过,随着样本容量的无

限增大,根据中心极限定理,OLS 估计量的概率分布将会趋近于正态分布。因此,大样本

条件下线性概率模型的统计推断,也可以按正态性假设条件下 OLS 的统计推断方式进行。

这就是说,直接运用 OLS 法对线性概率模型进行估计,对参数的估计不会产生太大影响。

(2)随机扰动项 ui 的异方差性。根据 Yi 的概率分布有:Yi =1 时,ui = 1 − ( β1 + β 2 X i ) 的

概率为 pi ; Yi =0 时, ui = − ( β1 + β 2 X i ) 的概率为 1- pi ,即

ui − (β1 + β 2 X )i 1 − (β1 + β 2 X )i

概率 1 − pi pi

根据方差的定义,得

Var (ui ) = E (ui − E (ui )) 2 = E (ui2 )

= (− β 1 − β 2 X i ) 2 (1 − pi ) + (1 − β 1 − β 2 X i ) 2 pi

= (− β1 − β 2 X i ) 2 (1 − β1 − β 2 X i ) + (1 − β1 − β 2 X i ) 2 ( β1 + β 2 X i )

= ( β1 + β 2 X i )(1 − β1 − β 2 X i )

= pi (1 − pi ) (8.23)

16
这里利用了 pi = β1 + β 2 X i 。(8.23)式表示,当 ui 满足 E (u i | X i ) =0 和 E (u i u j | X i ) =0 (i≠

j)时, ui 的方差是 Yi 条件期望的函数,即 Var (ui ) = f ( E (Yi | X i )) ,这表明 ui 是异方差的。

这时利用 OLS 法所得的 LPM 的估计量不再具有最小方差的特性,且各参数估计量的标准差

也不可信。也就是说,LPM 参数的 OLS 估计量虽仍为线性无偏估计量,但不是最佳估计量。

为了消除异方差性的影响,可利用第五章中有关修正异方差的方法,例如,可用加权最

小二乘法(WLS)修正异方差。

根据前面的讨论,已知 LPM 中 ui 的方差是 Yi 条件期望的函数,故选择权重的一种方法

是:

wi = E (Yi | X i )[1 − E (Yi | X i )] = pi (1 − pi ) (8.24)

其中, wi 为权重。

对 (8.32) 式作变换,有:

Yi β X u
= 1 + β2 i + i (8.25)
wi wi wi wi

(8.41)式中权重 wi 是未知的,随机扰动项 ui / wi 也是未知的,在实践中为了估计 wi 进而估

计 LPM 模型,可采取以下步骤:

ˆ
第一步,不考虑异方差,用 OLS 法估计原模型(8.16),计算 Y=i βˆ1 + βˆ2 X i 作为

E (Yi X i ) = pi 的估计值 pˆ i ,取 wˆ i = Yˆi (1 − Yˆi ) = pˆ i (1 − pˆ i ) 作为 wi 的估计值。

第二步,用 ŵi 按照(8.41)式对观察数据 Yi 和 X i 进行变换,再用 OLS 法估计变换后的模

型参数,得 LPM 的参数,从而消除异方差。

(3)不满足 0 ≤ E (Yi | X i ) ≤ 1 的约束

在线性概率模型中, E (Yi | X i ) 表示在给定 X 的条件下,事件 Y 发生的概率,从理论

上, E (Yi | X i ) 的取值范围必须在 0 和 1 之间,然而在实证分析中, E (Yi | X i ) 的估计量 Yˆi

并不一定介于 0 和 1 之间,也就是说,Yˆi 的值可能大于 1,也可能小于 0,这是 LPM 的 OLS

法估计存在的实际问题。解决这一问题的一类方法是:当 Yˆi >1 时,就认定 Yˆi =1;当 Yˆi <0 时,

就认定 Yˆi =0。这是人为地把大概率事件当作必然事件,把小概率事件当作不可能事件。另

17
一类方法是,选择对数单位模型 Logit 模型或概率单位模型 Probit 模型等能够保证满足

0 ≤ E (Yi | X i ) ≤ 1 约束的非线性模型。

3、非线性概率模型

应当指出的是,虽然我们可以采用 WLS 解决异方差性问题、增大样本容量减轻非正态

性问题,通过约束迫使所估的事件 Y 发生的概率落入 0~1,但是,LPM 与经济意义的要求

不符:随着 X 的变化,X 对 pi 的 “边际效应”保持不变。如在住户是否购买商品房的例子

中,当 βˆ2 = 0.1 时,表明 X 每变化一个单位(比如说 1000 元),拥有商品住房的概率恒等地

增加 0.1。这就是说,无论住户的收入水平为 8000 元,还是 22000 元,拥有商品住房的概率

都以相同的增量增加。在线性概率模型中,不论 X 的变化是在什么水平上发生的,参数都

不发生变化,显然这与现实经济所发生的情况是不符的。

因此,表现概率平均变化比较理想的模型应当具有这样的特征:

=
(1)概率 (Yi 1| X i ) 随 X 的变化而变化,但永远不超出 0~1 区间。
pi E=

(2)随着 X i → −∞ , pi → 0 ;随着 X i → ∞ , pi → 1 ;即随着 X i 变小,概率 pi 趋于

零的速度越来越慢;而随着 X i 变大,概率 pi 趋于 1 的速度也越来越慢。 pi 随 X i 变化而变

化,且变化速率不是常数, pi 和 X i 之间是非线性关系。

符合这些特征的函数可用图 8.4 形象地刻画。

1
CDF

—∞ 0 ∞ X
图 8.4 非线性概率函数的图形

图 8.4 的模型满足 0 ≤ E (Yi | X i ) ≤ 1 ,以及 pi 是 X i 非线性函数的假设,呈现出 S 型的

曲线特征。因此可以设法找到符合这种 S 型曲线特征的函数形式来作为二项选择计量经济模

型的设定形式。

原则上,任何适当的、连续的、定义在实轴上的概率分布都将满足上述两个条件。对于

连续随机变量来说,密度函数的积分代表概率的大小,也就是说,连续随机变量的(累积)

18
分布函数(CDF)可以满足上述两个要求。由于历史的原因,通常选择逻辑斯蒂分布(logistic

distribution)和正态分布(Normal distribution)的累积分布函数去设定非线性概率模型。当选

用逻辑斯蒂分布时,就生成了 Logit 模型,本书只介绍 Logit 模型。

二、Logit 模型
1、Logit 模型的基本概念

Logit 模型也称为对数单位模型。如上所述,当选择用逻辑斯蒂分布函数去设定二元响

应计量经济模型时,有
e β1 + β2 X i 1 1
Pr ob (Y=
i ) p=i
1= =
β1 + β 2 X i
=
− ( β1 + β 2 X i )
(8.26)
1+ e 1+ e 1 + e − zi
其中, zi = β1 + β 2 X i 。

(8.26)式有以下特征:

(1) 随着 zi → ∞ , pi → 1 (1 为 pi 的饱和值);反之, zi → −∞ 时, pi → 0 ;即

−∞ ≤ zi ≤ ∞ , 0 ≤ Pi ≤ 1 ; zi = 0 时, pi = 0.5 。

(8.26)式有一个拐点,在拐点之前,随 zi 或 X i 增大, pi 的增长速度越来越快;


(2)

在拐点之后,随 zi 或 X i 增大, pi 的增长速度越来越慢,逐渐趋近于 1。

这些特征正好满足前面讨论的非线性概率模型的要求。

考虑在估计中便利,我们采用以下变换:

 Pr ob (Y = 1)   pi 
=Li ln=
  ln  
 Pr ob (Y 0 ) 
=  1 − pi 

 e β1 + β2 X i (1 + e β1 + β2 X i ) 
= ln 
1 − [ e β1 + β 2 X i
(1 + e β1 + β 2 X i
)]
= (
 ln e )
β1 + β 2 X i
= β1 + β 2 X i (8.27)
 

pi
式中,比率 通常被称为机会比率,即所研究的事件(或属性)“发生”的概率与“没
1 − pi

有发生”的概率之比。机会比率在市场调查民意测验等社会学以及流行病学方面有着广泛的

pi
应用。“机会比率的对数” Li = ln( ) 被称为对数单位,这里的对数单位 Li 不仅是 X i 的
1 − pi

线性函数,而且也是 β 的线性函数。所以,(8.27)也称为对数单位模型(或 logit 模型)。

2、Logit 模型的估计

19
虽然 Logit 模型(8.42)或(8.43)式满足非线性概率模型的要求,但由于 pi 不仅对 X i 是

非线性关系,而且对 β1 和 β 2 也是非线性关系,不能直接运用 OLS 法估计参数。必须设法

把非线性关系转换为可以运用 OLS 估计的线性形式。

若记 pi 为事件发生的概率,那么有:

1
pi =
1 + e − Zi
1 1
1 − pi = 1 − − Zi
= (8.28)
1+ e 1 + e Zi
由(8.27)和(8.28)式有:

pi 1 + e zi
= −Zi
= e zi (8.29)
1 − pi 1 + e

对(8.29)式两边取自然对数:

p
Li = ln( i ) = ln(e z i ) = Z i = β1 + β 2 X i (8.30)
1 − pi

模型(8.30)表明, X i 变动一个单位,机会比率的对数(注意不是概率 pi )平均变化 β 2 个

单位。需要注意 Logit 模型的以下特点:

(1)随着 pi 从 0 变化到 1,或 Z 从 −∞ 变化到 ∞ ,对数单位 Li 从 −∞ 变化到 ∞ ,即概

率 pi 在 0 与 1 之间,但对数单位 Li 并不一定在 0 与 1 之间。

(2)虽然对数单位 Li 对 X i 是线性的,但概率 pi 对 X i 并不是线性的,这与线性概率模

型不同。

(3)注意对 Logit 模型中参数的意义: β 2 是 X i 每变动一个单位时,对数单位 Li (机会

比率的对数)的平均变化,然而我们研究的目的并不是对数单位 Li ,而是概率 pi 。

(4)如果设法估计出参数 β1 和 β 2 ,给定某一水平 X i = X ,若欲估计 pi ,当 β1 和 β 2 估


*

计量已知时,可从(8.30)式中直接得到( Z i = βˆ1 + βˆ2 X i ),就可能计算出要估计的概率 pi 。

从计量经济的角度引入随机扰动项,将式(8.30)改记为:

pi
Li = ln = Z i = β1 + β 2 X i + u i (8.31)
1 − pi

20
问题是如何得到 β1 和 β 2 的估计量? 对(8.31)式直接估计会遇到以下困难:

(1)当事件发生时 pi = 1 , Li = ln(1 0) ;当事件没有发生时 pi = 0 , Li = ln(0 1) ,机

会比率 pi (1 − pi ) 的对数都无意义,不能直接用 OLS 法估计模型,而只能采用极大似然法

(ML)估计参数。当样本容量 N 较大,可选用加权最小二乘法进行估计。

(2)估计参数需要的机会比率的对数 Li 的数据无法观测。解决办法是对应于每个 X i ,

样本观测值个数 N i 较大时,可利用整理汇总的数据,用相对频率作为对 pi 的估计,并估计

机会比率对数 Li 。例如购商品房的模型,对于收入水平 X i ,家庭总数为 N i ,其中购商品

房家庭数为 ni ,可计算相对频率 pˆ i = ni N i 。样本容量 N i 足够大时, p̂i 可视为对 pi 的较

Li : Lˆi ln[ pˆ i (1 − pˆ i )] 。
好估计,并可用于估计机会比率对数 =

(3)式(8.31)模型的随机项 ui 为异方差,可以证明,N 足够大时

 1 
u i ~ N  0,  (8.32)
 N i pi (1 − pi ) 

为了估计 ui 的方差 σ i2 ,可通过用相对频率 p̂i 代替 pi 去估计,有

1
σˆ i2 = (8.33)
N i pˆ i (1 − pˆ i )

估计出 ui 的方差以后,可用加权最小二乘法去估计参数,权数 wi 为:

1 1
wi = σˆ i2 = = (8.34)
N i pˆ i (1 − pˆ i ) N i pˆ i (1 − pˆ i )

可以看出,对数单位模型参数的估计程序是较为繁琐的,但运用 Eviews 进行估计却较

方便。

另外,关于二元选择模型的模型设定检验、异方差性检验、拟合优度分析等内容,已超

出本书的讨论范围,在此不作讨论。

第四节 案例分析

汽车工业向来有“火车头工业”之称,作为我国的支柱产业之一,很大程度上改变了中国

人的生活方式。随着经济的快速发展,存在着很多影响私人汽车拥有量的因素,私人汽车拥

21
有量正在以每年一千多万辆的速度持续增长。表 8.1 选取了 1990 年-2015 年中国私人汽车拥

有量、城镇居民人均可支配收入、公路里程数、公路运营汽车拥有量、原油产量以及一年期

贷款利率等相关数据,对中国私人汽车拥有量的主要影响因素进行分析。

表 8.1 中国私人汽车拥有量及其影响因素
私人汽车 城镇居民人 公路里程数 公路营运汽 原油产量 一年期贷
年 份 拥有量 Y 均可支配收 X3 车拥有量 X4 X5(万吨) 款利率 X6
(万辆) 入 X2(元) (万公里) (万辆)
1990 81.62 1510.2 102.83 31.30 13831.00 9.36
1991 96.04 1700.6 104.11 31.67 14099.00 8.64
1992 118.2 2026.6 105.67 30.87 14210.00 8.64
1993 155.77 2577.4 108.35 28.96 14524.00 10.98
1994 205.42 3496.2 111.78 27.97 14608.00 10.98
1995 249.96 4283.0 115.70 27.49 15004.95 12.06
1996 289.67 4838.9 118.58 28.81 15733.39 10.08
1997 358.36 5160.3 122.64 29.89 16074.14 8.64
1998 423.65 5425.1 127.85 31.88 16100.00 6.39
1999 533.88 5854.0 135.17 501.77 16000.00 5.85
2000 625.33 6280.0 167.98 702.82 16300.00 5.85
2001 770.78 6859.6 169.80 764.39 16395.87 5.85
2002 968.98 7702.8 176.52 826.34 16700.00 5.31
2003 1219.23 8472.2 180.98 924.64 16959.98 5.31
2004 1481.66 9421.6 187.07 1067.18 17587.33 5.58
2005 1848.07 10493.0 334.52 733.22 18135.29 5.58
2006 2333.32 11759.5 345.70 802.58 18476.57 6.12
2007 2876.22 13785.8 358.37 849.22 18631.82 7.47
2008 3501.39 15780.8 373.02 930.61 19001.24 5.31
2009 4574.91 17174.7 386.08 1087.35 18948.96 5.31
2010 5938.71 19109.4 400.82 1133.32 20301.40 5.81
2011 7326.79 21809.8 410.64 1263.75 20287.55 6.56
2012 8838.60 24564.7 423.75 1339.89 20747.80 6.00
2013 10501.68 26955.1 435.62 1504.73 20991.85 6.00
2014 12339.36 29381.0 446.39 1537.93 21142.92 5.60
2015 14099.10 31790.3 457.73 1473.12 21455.28 4.35
数据来源:根据《中国统计年鉴》数据整理。

私人汽车作为现代家庭的消费品,首先要受到居民可支配收入的较大影响。因此,先研

究城镇居民可支配收入对私人汽车拥有量的弹性,为此对私人汽车拥有量 Y 和城镇居民可

支配收入 X 2 分别取对数,分别生成变量 lnY 和 ln X 2 的数据,其相关关系如图 8.5 所示:

22
图 8.5 城镇居民可支配收入的对数 ln X 2 与私人汽车拥有量对数 lnY 的散布图

从图 8.5 中可以发现,城镇居民可支配收入的对数 ln X 2 与私人汽车拥有量的对数 lnY

存在较明显的折线关系,转折点出现在 1996 年,转折点前后分别近似线性形式。

为了分析私人汽车拥有量在 1990 年—2015 年不同时期的数量关系,以 1996 年度的转

折点作为依据,引入虚拟变量 D1,1996 年度所对应的 lnX2 为 8.484。据此,我们设定了如

下以加法和乘法两种方式同时引入虚拟变量的的模型:

β1 + β 2 ln X 2t + β3 (ln X 2t − 8.48) D1t + ut


ln Yt =

1 t = 1996年以后
其中: D1t = 
0 t = 1996年及以前

对上式进行回归,结果如图 8.6 所示。

图 8.6 回归结果

23
·Y =
ln −4.78 + 1.25ln X 2t + 0.77(ln X 2t − 8.484) D1t
t

se = (0.49) (0.060) (0.080)


t = (−9.77) (20.90) (9.62)
R 2 =0.9970 R 2 =0.9968 F=3861.65 DW=0.376

由于 ln X 2t 和 (ln X 2t − 8.484) D1t 参数估计量的 t 值均大于临界值 t0.05 (26 − 3) =


2.069 ,

表明各解释变量的斜率系数在显著性水平 α = 0.05 下显著地不等于 0,私人汽车拥有量的回

归模型分别为:

· Y = −4.78 + 1.25ln X 2t t ≤ 1996


ln t 
−11.31 + 2.02 ln X 2t t > 1996
这表明 1996 年前后私人汽车拥有量的回归方程在统计意义上确实有所不同。1996 年以

前城镇居民可支配收入每增加 1%,平均说来私人汽车拥有量的增长率为 1.25%。1996 年以

后随着城镇居民可支配收入的增加, 私人汽车拥有量的增速较 1996 年之前有所增加。上述

模型同城镇居民可支配收入的对数与私人汽车拥有量的对数之间的散布图吻合,与这一时段

中国的实际经济运行状况也是相符的。

需要注意的是,在上述建模过程中,为了方便通过图形特征建立模型,没有考虑公路里

程数等其它影响私人汽车拥有量的因素。也就是说图 8.5 中城镇居民可支配收入的对数 Y

与私人汽车拥有量的对数 ln X 2 的折线结构,是没有控制其它因素的。如果要将其它因素考

虑进来建立多元回归模型,它们之间的折线关系就不一定成立了,也就不能直接利用图 8.5

给出的折线结构去建立模型。可是,在多元回归中,要绘制控制其它因素不变时两个变量的

散布图比较困难,因此通常可利用经济背景来设定虚拟变量以改善模型的拟合效果。

首先用私人汽车拥有量的对数 lnY 对城镇居民可支配收入的对数 ln X 2 以及公路里程等

其它变量进行回归,结果如图 8.7 所示。

24
图 8.7 回归结果

从图 8.7 中 t 检验的 p 值看出,各解释变量在显著性水平 α = 0.05 下均显著。但 DW 统

计量 1.6752,显示模型不能排除存在自相关,这可能是由于模型忽略了某些重要变量造成

的。

2001 年 12 月 11 日,世贸组织正式宣布中国成为世贸组织的一员,这意味着中国市场

能与国际市场相连接,极大地促进了中国经济的发展和人民的生活水平的提高。这一变化同

样也可能会影响到中国的私人汽车拥有量。尝试以 2001 年底加入 WTO 为转折点,在私人汽

车拥有量的对数 lnY 对城镇居民可支配收入的对数 ln X 2 以及公路里程等其它变量进行回归

的基础上,引入虚拟变量,建立以下多元回归模型:

β1 β 2 ln X 2t + β3 X 3t + β 4 X 4t + β5 X 5t + β 6 X 6t + β 7 D2t + ut
ln Yt =+

式中

1 t = 2001年以后
D2t = 
0 t = 2001年及以前

回归结果如图 8.8 所示。

25
图 8.8 回归结果

·Y =
ln −4.19 + 0.96 ln X 2t + 0.0017 X 3t + 0.0004 X 4t + 0.0001X 5t − 0.014 X 6t + 0.0785 D2t
t

se = (0.27) (0.056) (0.0003) (0.00005) (0.00003) (0.007) (0.037)


t = (−15.7) (17.05) (5.77) (7.73) (3.61) (-2.06) (2.12)
2 2
R =0.99944 R =0.99927 F=5668.37 DW=1.9954

可以看出,引入加入 WTO 的虚拟变量以后,模型的所有解释变量在显著性水平 α = 0.1

下均显著,并且 DW 统计量显示模型不存在自相关。因此相比于没有引入虚拟变量的模型,

模型设定更为合理,模型结果也与实际经济运行相一致。在解释此模型虚拟变量 D2t 的经济

意义时,需要注意被解释变量为私人汽车拥有量的对数,因此虚拟变量 D2t 的参数 0.0785

表示的是,固定其它因素不变加入 WTO 以后平均来说私有汽车拥有量是加入 WTO 之前的

0.0785
1.08 倍( e 倍)。或者说,加入 WTO 以后平均来说私有汽车拥有量比加入 WTO 之前多 8%。

需要指出的是,在上述建模过程中,主要是从教学的目的出发,说明运用虚拟变量的规

则和方法,没有考虑更多建模的可能性。在实证分析中,还可以进一步考虑分段回归更多的

分段点、多元回归中更多的时间分割点以及虚拟变量对回归系数的影响等。

本章小结
1. 虚拟变量是人工构造的取值为 0 和 1 的作为属性变量代表的变量。

2. 虚拟变量的设置要注意区分基础类型和比较类型。虚拟变量个数的设置有一定规则:

在有截距项的模型中,若定性因素有 m 个相互排斥的类型,只能引入 m-1 个虚拟变量,否

则会陷入所谓“虚拟变量陷阱”,产生完全的多重共线性,在无截距项的模型中,若定性因

素有 m 个相互排斥的类型,则可引入 m 个虚拟变量。

26
3.在计量经济模型中,加入虚拟解释变量的途径有两种基本方式:一是加法方式;二是

乘法方式。以加法方式引入虚拟变量改变的是模型的截距;以乘法方式引入虚拟变量改变的

是模型的斜率。

4.解释变量只有一个分为两种相互排斥类型的定性变量而无定量变量的回归,称为方差

分析模型。

5.解释变量包含一个分为两种类型定性变量的回归时,只使用了一个虚拟变量;解释变

量包含一个两种以上类型的定性变量的回归时,定性变量有 m 种类型,依据虚拟变量设置规

则引入了 m-1 个虚拟变量。

6.解释变量包含两个(或 K 个)定性变量的回归中,可选用了两个(或 K 个)虚拟变量

去表示,这并不会出现“虚拟变量陷阱”。

7.以乘法形式引入虚拟解释变量的主要作用在于:对回归模型结构变化的检验;定性因

素间交互作用的影响分析;分段线性回归等。

8.以虚拟变量作为被解释变量的模型中,被解释变量 Yi 的条件期望实际上是 Yi 取值为 1

的条件概率。线性概率模型(LPM)存在一定局限性,模型估计也面临某些困难。对数单位

模型(Logit 模型)是以虚拟变量作为被解释变量的非线性模型之一。

9.主要公式见表 8.2。

表 8.2 主要公式表

名称 公式

虚拟变量表示不同截矩的回归——加法类型 1
α1 + α 2 X t + α 3 Dt + ut
Yt = Dt = 
0

虚拟变量表示不同斜率的回归——乘法类型 Yt = α1 + α 2 Dt + β1 X t + β 2 ( Dt X t ) + ut

用虚拟变量作交互效应分析 Yi = α1 + α 2 D2i + α 3 D3i + α 4 ( D2i D3i ) + βX i + ui

分段线性回归 Yt = α 0 + β1 X t + β 2 ( X t − X * ) Dt + ut

1 X ≥ X*
D=
0 X < X*

线性概率模型 E (Yi | X i ) = β1 + β 2 X i = pi

27
Logit 模型 1
pi = E (Yi = 1 | X ) = −( β1 + β 2 X i )
1+ e
1
pi = E (Yi = 1 | X ) =
1 + e− Z i
pi
Li = ln = Z i = β1 + β 2 X i + u i
1 − pi

机会比率 pi
1 − pi

对数单位—机会比率的对数 p
Li = ln( i )
1 − pi

思考题
8.1 什么是虚拟变量?它在模型中有什么作用?

8.2 虚拟变量为何只选 0、1,选 2、3、4 行吗?为什么?

8.3 对式(8.10)的模型,如果选择这样一个虚拟变量:

D = { 1 大专及大专以上
0 高中
−1 高中以下

这样的设置方式隐含了什么假定?这一假定合理吗?

8.4 引入虚拟解释变量的两种基本方式是什么?它们各适用于什么情况?

8.5 以各种不同的方式引入虚拟变量会产生什么不同的效应?

8.6 式(8.12)中回归模型的结构变化和式(8.15)中的分段线性回归,二者均是用虚拟变

量去表示线性回归模型截距和斜率的变化,它们之间有什么不同?

8.7 引入虚拟被解释变量的背景是什么?含有虚拟被解释变量模型的估计方法有哪些?

8.8 设服装消费函数为

Yi =α1 + α 2 D2i + α 3 D3i + β X i + ui

其中:Xi 为收入水平;Yi 为年服装消费支出; D3 = 1, 大专及大专以上 ; D2 = 1, 女性


0其他 0,男性

试写出不同人群组的服装消费函数模型。

8.9 利用月度数据资料,为了检验下面的假设,应引入多少个虚拟解释变量?

1)一年里的 12 个月全部表现出季节模式;

2)只有 2 月、6 月、8 月、10 月和 12 月表现出季节模式。

28
练习题
8.1 使用 102 个国家的数据来分析教育投入对国内生产总值的影响,模型设定如下:

ln GDP = β1 + β 2 ln Educ + β 3 ln K + β 4 ln L + β 5 D1 + β 6 D2 + β 7 D1D2 + u

式中,GDP 表示国内生产总值,Educ 表示教育投入,K 表示资本总量,L 表示劳动力总量,

D1,D2 为虚拟变量,分别表示南北半球国家以及国家发展情况:

1 南半球 1 发展中国家
D1 =  D2 = 
0 北半球 0 发达国家

如果我们重新设置虚拟变量:

1 北半球发展中国家 1 北半球发达国家 1 南半球发展中国家


D1* =  D2* =  D3* = 
 0 其它  0 其它 0 其它

将南半球发达国家作为基础类型。按如下方式重新设定回归模型:

* * *
ln GDP = α1 + α 2 ln Educ + α 3 ln K + α 4 ln L + α 5 D1 + α 6 D2 + α 7 D3 + u

请找出以上两模型参数间的等价关系。

8.2 在一项对某地区大学生月消费支出的调查研究中,反映出不同状况大学生的消费支

出有差异,除了受家庭每月收入水平影响外,例如是否获得到奖学金、来自农村还是城市、

家庭在经济发达地区还是欠发达地区、性别等因素可能对大学生的消费水平也有影响,而且

这些因素间可能还有一定交互作用。选择比较不同状况大学生消费水平的适当基础类型,并

设定合适的计量模型检验如下几种状况学生与其他学生的平均消费支出是否有显著差异:

(1)来自发达地区、城市地区、得到奖学金的女生的平均消费支出;

(2)来自欠发达地区、农村地区、得到奖学金的男生的平均消费支出;

(3)来自欠发达地区、城市地区、未得到奖学金的女生的平均消费支出;

(4)来自发达地区、农村地区、得到奖学金的女生的平均消费支出。
8.3 从 20 世纪 70 年代 101 个国家的人均收入 X 和预期寿命数据中,Sen 和 Srivastava
获得以下回归结果 :

Yµi =
−2.40 + 9.39 ln X i − 3.36(ln X i − 7) Di
se = (4.73) (0.859) (2.42) R 2 =0.752

29
1 lnX i > 7
其中: Di = 
0 lnX i ≤ 7
假设除了分段点处斜率的变化以外还存在回归线的跳跃,如图 8.9 所示:

图 8.9 分段跳跃回归

在分段回归模型基础上,请重新设置带跳跃的分段回归模型。
8.4 表 8.3 是美国华盛顿 2012 年 12 月的共享单车日志数据。
表 8.3 美国华盛顿 2012 年 12 月共享单车日志数据

日期 日租量 标准化体 工作日 晴天 日期 日租量 标准化体 工作日 晴天


感温度 感温度
1 5191 0.316904 0 0 17 4585 0.401500 1 0
2 4649 0.359208 0 0 18 5557 0.409708 1 1
3 6234 0.455796 1 1 19 5267 0.342162 1 1
4 6606 0.469054 1 1 20 4128 0.335217 1 0
5 5729 0.428012 1 1 21 3623 0.301767 1 0
6 5375 0.258204 1 1 22 1749 0.236113 0 1
7 5008 0.321958 1 0 23 1787 0.259471 0 1
8 5582 0.389508 0 0 24 920 0.258900 1 0
9 3228 0.390146 0 0 25 1013 0.294465 0 0
10 5170 0.435575 1 0 26 441 0.220333 1 0
11 5501 0.338363 1 0 27 2114 0.226642 1 0
12 5319 0.297338 1 0 28 3095 0.255046 1 0
13 5532 0.294188 1 1 29 1341 0.242400 0 0
14 5611 0.294192 1 1 30 1796 0.231700 0 1
15 5047 0.338383 0 1 31 2729 0.223487 1 0
16 3786 0.369938 0 0
数据来源:加州大学机器学习公开数据库:http://archive.ics.uci.edu/ml/index.php

1)以共享单车日租量为被解释变量,标准化体感温度为解释变量建立线性回归模型。

引入工作日和晴天两个虚拟变量,它们影响的回归模型的截距和斜率吗?解释其经济意义。

(以 α = 0.1 为显著性水平)

30
2)如果数据为整年的数据而非整月数据,模型设定需要进行怎样的调整?为什么?

8.5 表 8.4 是中国 2013 年 1 月-2017 年 6 月房地产板块上市公司的平均股价数据。

表 8.4 房地产板块上市公司平均股价

年份 平均股价 年份 平均股价 年份 平均股价


2013 年 01 月 7.248077 2014M07 6.505997 2016M01 8.450126
2013 年 02 月 7.301959 2014M08 6.531709 2016M02 8.250904
2013 年 03 月 6.627953 2014M09 7.246967 2016M03 9.133254
2013 年 04 月 6.619531 2014M10 7.467187 2016M04 8.963423
2013 年 05 月 7.210040 2014M11 8.673835 2016M05 8.796588
2013M06 6.057501 2014M12 10.17106 2016M06 8.783204
2013M07 6.122588 2015M01 10.26002 2016M07 9.223007
2013M08 6.627759 2015M02 10.75373 2016M08 10.36740
2013M09 6.702009 2015M03 13.17591 2016M09 10.36783
2013M10 6.494679 2015M04 14.73211 2016M10 10.35390
2013M11 6.541881 2015M05 15.12296 2016M11 10.60076
2013M12 6.189791 2015M06 14.26309 2016M12 10.01681
2014M01 5.836715 2015M07 11.63705 2017M01 9.686717
2014M02 5.657154 2015M08 10.18595 2017M02 9.927000
2014M03 6.185556 2015M09 9.178281 2017M03 10.08556
2014M04 6.040875 2015M10 10.75378 2017M04 9.996459
2014M05 5.830878 2015M11 11.39390 2017M05 9.428131
2014M06 5.790821 2015M12 12.54533 2017M06 9.579914
数据来源:CSMAR 数据库,WIND 数据库

1)画出房地产上市公司平均股价的时间序列图形,依据图形设定适当的计量经济学模型分

析平均股价随时间变动的数量规律,并对结果进行解释。。

2)你能设定出两种形式的表现房地产上市公司平均股价随时间变动的计量经济模型吗?对

这两种形式的模型进行比较。

8.6 为了分析个人收入与工作年限、学历以及是否为管理人员间的关系,某销售公司得到

如表 8.5 所示的数据。
表8.5 某公司销售人员收入状况、受教育程度等的调查数据
工 龄 工 龄 是否为
序 收入S 受教育状 是否为管 序 收 入 S 受教育状
X X 管理人
号 /(元) 况 E 理人员M 号 /(元) 况 E
/(年) /(年) 员M
1 13876 1 高中 是 24 22884 6 本科 是
2 11608 1 研究生 否 25 16978 7 高中 是
3 18701 1 研究生 是 26 14803 8 本科 否

31
4 11283 1 本科 否 27 17404 8 高中 是
5 11767 1 研究生 否 28 22184 8 研究生 是
6 20872 2 本科 是 29 13548 8 高中 否
7 11772 2 本科 否 30 14467 10 高中 否
8 10535 2 高中 否 31 15942 10 本科 否
9 12195 2 研究生 否 32 23174 10 研究生 是
10 12313 3 本科 否 33 23780 10 本科 是
11 14975 3 高中 是 34 25410 11 本科 是
12 21371 3 本科 是 35 14861 11 高中 否
13 19800 3 研究生 是 36 16882 12 本科 否
14 11417 4 高中 否 37 24170 12 研究生 是
15 20263 4 研究生 是 38 15990 13 高中 否
16 13231 4 研究生 否 39 26330 13 本科 是
17 12884 4 本科 否 40 17949 14 本科 否
18 13245 5 本科 否 41 25685 15 研究生 是
19 13677 5 研究生 否 42 27837 16 本科 是
20 15965 5 高中 是 43 18838 16 本科 否
21 12336 6 高中 否 44 17483 16 高中 否
22 21352 6 研究生 是 45 19207 17 本科 否
23 13839 6 本科 否 46 19346 20 高中 否
数据来源:http://www.ilr.cornell.eduThadi/RABE4

试根据表 8.5 的数据,完成如下工作:

1)构造用于描述学历和管理者的虚拟变量,设定并估计描述收入影响因素的计量经济模

型,并简要说明你对模型设定的理由,分析模型估计的结果。

2)若在上述模型的基础上,进一步考虑学历与是否管理者间有无交互效应,模型应如何

设定?分析估计结果并画出残差图,你得出的结论是什么?。

3)你还能够依据上述交互效应模型残差图的异常信息对模型加以完善吗?

8.7 利用 2011 年中国家庭金融调查(CHFS)的数据,随机抽取 50 名受访者,获得其

社会基本养老保险的持有状况及相应社会经济特征数据(见表 8.6)。

表 8.6 社会基本养老保险持有情况及相关社会经济特征数据

持有基本 是否身 持有基本 是否身


序号 养老保险 年龄 体建康 对数家庭收入 序号 养老保险 年龄 体建康 对数家庭收入
1 1 81 0 10.799 26 0 38 1 9.798
2 0 35 0 5.768 27 1 31 0 10.716
3 1 29 1 10.668 28 1 73 0 11.115
4 0 35 1 10.373 29 1 41 1 10.621
5 1 43 1 10.762 30 1 29 1 10.684
6 1 72 1 11.601 31 0 30 0 10.502
7 1 29 0 10.589 32 1 34 0 10.916
8 1 44 1 11.457 33 0 30 0 10.969
9 1 82 1 10.087 34 1 33 0 10.802

32
10 1 79 1 10.359 35 1 51 0 11.304
11 0 28 1 7.8240 36 1 56 1 11.265
12 1 33 0 11.092 37 0 36 0 10.085
13 1 45 1 11.296 38 1 34 1 10.308
14 0 40 0 8.588 39 1 40 1 10.738
15 0 40 0 7.659 40 1 24 1 11.695
16 0 22 1 12.917 41 1 27 1 10.922
17 1 41 1 10.617 42 1 46 0 11.280
18 1 75 1 10.491 43 1 35 1 10.933
19 1 71 0 10.688 44 1 31 1 10.126
20 1 58 0 10.942 45 1 32 0 9.392
21 1 60 1 11.107 46 1 74 1 10.867
22 1 75 0 11.206 47 1 46 1 10.518
23 0 22 1 10.465 48 1 40 0 10.528
24 1 35 1 11.270 49 1 55 0 10.505
25 1 67 0 13.112 50 0 20 1 12.081
数据来源:中国家庭金融调查(CHFS)

试用 Logit 及 Probit 模型对社会基本养老保险的持有状况的效应进行估计,并分析相应

的边际效应。

8.8 联系自己所学的专业选择一个包含属性因素的实际问题,设定一个虚拟变量计量经

济模型,并自己去收集样本数据,用本章的方法估计和检验这个模型,你能得出什么有意义

的结果吗?

33
第九章 设定误差与测量误差 1

引子
这样的粮食生产模型真的就合理吗?

为了研究影响粮食产量的因素,学者们从不同角度建立了各种计量经济学模型。有人认

为,现在农业生产已由传统的农家肥向现代新型肥料转变,化肥施用量的增加极大地促进了

粮食产量的提高,化肥施用量对粮食产量贡献最为显著。因此,主张模型可设定为

β1 + β 2 ln X 2t + ut
ln Yt =

并依据 1983-2016 年国内粮食总产量 Y 和全国化肥施用总量 X 2 的数据,得到模型估计的结

果:

ln Yˆt 9.7619 + 0.3152 ln X 2t


=

t= (34.5692) (11.7572)

R 2 =0.8120 R 2 =0.8061 DW=0.3857 F=138.2306

这个模型可决系数较高,t 检验和 F 检验都很显著,因此认为这种最简单的粮食生产模型是

合理的。

可是,也有人认为,粮食产量不只是取决于化肥施用量,将“化肥施用量”作为唯一解

释变量的模型并不合理,还有一些其他的重要因素会影响到粮食产量,比如粮食播种面积以

及对农业的劳动力投入等因素,应当考虑添加其他的解释变量。对于粮食产量的分析,应当

如何验证哪种模型的设定才是更为合理的呢?

对模型的设定是计量经济研究的重要环节。所设定的模型要求正确地描述被解释变量与

解释变量之间的真实关系,在第二章提出线性回归模型的基本假定时,除了对随机扰动项 ui

的假定以外,也强调了假定模型对变量和函数形式的设定是正确的,还假定模型中的变量没

有测量误差。但是在实际的建模实践中,对模型的设定不一定能够完全满足这样的要求,从

而会使模型出现设定误差或测量误差。

第一节 设定误差类型及后果

1 本章内容供本科教学选择

1
一、设定误差的类型
计量经济模型是研究者对经济变量间因果关系的设想,实际是对总体回归函数的某种设

定。所设定的模型如果是个”好”的模型,就能够比较好的表现被解释变量的基本特征和变化

规律。反之如果模型设定是错误的,对被解释变量的基本特征和变化规律的刻画就会出现偏

误。这种由模型设定而导致的偏误,在计量经济学中被统称为设定误差。从误差来源看,设

定误差主要包括:①变量的设定误差,包括相关重要变量的遗漏(欠拟合)、无关变量的误

选(过拟合);②模型函数形式的设定误差;③变量数据的测量误差;④随机扰动项设定误

差。

若所设定的回归模型是“正确”的,主要任务是对所选模型参数的估计和假设检验。若

检验统计量 R 2 , t , F 和 DW 等在统计意义上是显著的,则模型的建模过程结束。反之,若这

些统计量中的一个或多个不显著,我们就会去寻找其他的估计方法进行参数估计和检验,例

如,在加权和广义差分的基础上用最小二乘法解决异方差性或自相关性问题。但是如果对计

量模型的各种诊断或检验仍不能令人满意,这时就应把注意力集中到模型的设定方面,考虑

所建模型是否遗漏了重要的变量?是否包含了多余的变量?所选模型的函数形式是否正

确?随机扰动项的设定是否合理?关于被解释变量和解释变量的数据收集是否有误差?等

等。

出现设定误差的原因是多方面的。首先,数据来源渠道可能不畅。在建模过程中,尽管

某个变量有着重要的经济意义和计量经济学解释作用,但这个变量的数据很难取得,而被迫

将该变量排斥在模型之外,例如消费行为分析中消费者财富的变量就是例证。其次,虽然知

道模型中应当包含哪些变量,但却不知道这些变量应当以什么确切的函数形式出现在回归模

型中。也就是说,经济管理的基本理论并没有提示模型中变量的准确函数形式。例如,经济

学理论不会肯定消费水平与有关变量的关系是线性的还是对数线性的,或者非线性的,或者

是某种混合形式的。最后,更为重要的是,事实上我们事先并不知道所研究的实证数据中所

隐含的真实模型究竟是什么。正是上述这些原因,设定误差在建模中是比较容易出现的。设

定误差的存在可能会对模型形成不良的后果。

二、变量设定误差的后果
变量设定误差主要有两类:一类是相关重要变量的遗漏,也称为模型“欠拟合”;另一

类是无关变量的误选,也称为模型“过拟合”。从实质上看,变量设定误差的主要后果,是

一个或多个解释变量与随机扰动项之间存在着相关性,而影响参数估计的统计特性。

2
1、遗漏相关变量(欠拟合)的偏误

采用遗漏了重要解释变量的模型进行估计而带来的偏误,称为遗漏相关变量偏误。

如果正确的模型应当为:

β1 β 2 X 2i + β3 X 3i + ui
Yi =+ (9.1)

其离差形式为 yi= β 2 x2i + β 3 x3i + (ui − u ) (9.2)

但是由于某种原因,设定模型时将变量 X 3i 遗漏了,实际采用的回归模型为:

α1 α 2 X 2i + vi
Yi =+ (9.3)

假定其他有关线性模型的古典假设都成立,则式(9.3)中 α 2 的 OLS 估计量为:

aˆ2 =
∑ x2i yi
(9.4)
∑x 2
2i

将正确模型的离差形式式(9.2)代入式(9.4),得:

aˆ2 =
∑ x2i [ β 2 x2i + β 3 x3i + (ui − u )]
∑x 2
2i

=
∑β x + β 3 ∑ x2i x3i + ∑ x2i (ui − u )
2
2 2i

∑x 2
2i

= β2 + β3
∑x x2 i 3i
+
∑ x (u 2i i − u)
(9.5)
∑x 2
2i ∑x 2
2i

对式(9.5)两边取条件期望,有:

E (αˆ 2 | X 2 ) =
E{[ β 2 + β3
∑x x 2 i 3i
+
∑ x (u − u ) ] | X }
2i i
(9.6)
∑x ∑x
2 2 2
2i 2i

在小样本下, 式(9.6)中的第二项求期望不会为零,表明 OLS 估计量 α̂ 2 在小样本下有

偏。为分析当样本容量无限增大时 α̂ 2 的概率极限性质,对式(9.5)两边取概率极限:(证

明见附录 9.1),得

Cov ( X 2i , X 3i ) Cov ( X 2i , ui )
p lim αˆ 2 =
β 2 + β3 + (9.7)
n →∞ Var ( X 2i ) Var ( X 2i )

由此可以看出, X 3 的遗漏将产生以下后果:

(1)如果遗漏的 X 3 与 X 2 相关,则参数估计量 α̂ 2 将是有偏且不一致性的,即

3
E (αˆ 2 ) ≠ β 2 , p lim(αˆ 2 ) ≠ β 2 。
n →∞

=
这是因为在(9.3)式中 vi β 3 X 3i + ui ,所以

Cov ( vi=
, X 2i | X 2 ) Cov ( β 3 X 3i + ui , X 2i | X 2 )
= Cov ( β 3 X 3i , X 2i | X 2 ) + Cov ( ui , X 2i | X 2 ) (9.8)

式(9.8)中,虽然 Cov ( ui , X 2i | X 2 ) = 0 ,但 Cov


= ( β3 X 3i , X 2i | X 2 ) β3Cov ( X 3i , X 2i | X 2 ) ≠ 0 。
1
OLS 估计量 α̂ 2 不仅在小样本下有偏,在大样本下式(9.5)第二项中的
n
∑ x2i x3i 也不会随着
样本的增大而趋于零,表明 OLS 估计量 α̂ 2 在大样本下也是不一致的,即有 p lim αˆ 2 ≠ β 2 。
n →∞

同样可以证明,参数估计量 α̂1 也是有偏且不一致性的,即 E (αˆ1 ) ≠ β1 ,p lim(αˆ1 ) ≠ β1


n →∞ 。

2)若 X 3 与 X 2 不相关,即 ∑x x =0, α̂ 2 满足无偏性和一致性,但可以证明这时截


2 i 3i

距项的估计 α̂1 却是有偏的(证明从略)


3) α̂ 2 的方差是 β̂ 2 方差的有偏估计。对于式(9.3),已知

σ2
Var (αˆ 2 ) =
∑x 2
2i

而对于式(9.1),有

σ2 σ2
=Var ( βˆ2 ) = (9.9)
(∑ x2i x3i ) 2 ∑ x22i (1 − r232 )
∑ 2i
x 2
(1 − )
∑ x22i ∑ x32i

如第三章所讨论的,Var ( βˆ 2 ) 是 β 2 方差的无偏估计,而如果漏掉的 X 3 与 X 2 相关,r232 ≠ 0 ,

Var (αˆ 2 ) ≠ Var ( βˆ 2 ) ,故 Var (αˆ 2 ) 是有偏的。

4)遗漏 X 3 的式(9.3)中的随机扰动项 vi 的方差估计量 σˆ v2 = RSSv (n − 2) 将是有偏的,

即 E (σˆ v2 ) ≠ σ u2 ;与方差相关的假设检验,包括区间估计等,都会导出错误的结论。

对从模型中遗漏变量时参数估计性质的认识,还有两点需要注意:

( )
(1) 若 X 3 与 X 2 相关, r232 ≠ 0 ,显然 Var (αˆ 2 ) ≠ Var βˆ2 ,似乎有 Var (αˆ 2 ) < Var βˆ2 。 ( )
但实际情形并不完全如此。可以注意到,依据式(9.1)和式(9.3)分别计算的的残差平方

和 RSS ,由于自由度不同,估计结果是不等的。即 RSSv ( n − 2) ≠ RSSu ( n − 3) ,或

4
σˆ v2 ≠ σˆ u2 。因此,有可能从式(9.3)估计得到的 RSSv (n − 2) 大于从式(9.1)估计得到

的 RSSu ( n − 3) 。

(2) 若 X 3 与 X 2 不相关,有 r232 = 0 和 ∑x x


2 i 3i ∑x 2
2i = 0 ,似乎分别有 E (αˆ 2 ) = β 2 ,

Var ( βˆ2 ) = Var (αˆ 2 ) 。若这两个等式成立,意味着尽管变量 X 3 在理论上分析是有关的变量,

但从所选模型中略去似乎也不会导致什么危害。这种认识实际也不正确。因为

^ σˆ v2 RSSv n − 2 ^ σˆ u2 RSSu n − 3
(αˆ 2 )
Var= = ,与 Var=( βˆ2 ) = 不相等,即使 X 3 与
∑ x22i ∑ 2i
x 2
∑ x2i 2
∑ x22i
^ ^
X 2 不相关,也有 Var ( βˆ2 ) ≠ Var (αˆ 2 ) ,致使假设检验的结果有可能是可疑的。况且,在大

多数的实证经济研究中, X 3 与 X 2 通常都是相关的,更可能会产生上述后果。因此必须清

楚,一旦根据相关理论把模型建立起来,再从中删除变量需要充分地谨慎。

2、包含无关变量(过拟合)的偏误

模型中包括了不重要的解释变量,即误选了无关解释变量的模型进行估计而带来的偏

误,称为包含无关变量偏误。

为讨论方程中包含了无关变量的情形,假设正确的模型是:

Yi = β1 + β 2 X 2i + ui (9.10)

而回归模型加入了无关变量 X3,被设定为:

Yi = α1 + α 2 X 2i + α 3 X 3i + vi (9.11)

可将式(9.10)视为式(9.11)的以 α 3 = 0 为约束的特殊形式。采用 OLS 法对式(9.11)进行参数

估计,由 式(3.27)有:

αˆ 2 =
∑x y ∑x −∑x y ∑x
2i i
2
3i 3i i x
2 i 3i
(9.12)
∑ x ∑ x − (∑ x x )
2
2i
2
3i 2 i 3i
2

将式(9.10)的离差形式 yi = β 2 x2i + (ui − u ) 代入式(9.12),并整理,得:

(∑ x32i )(∑ x2i (ui − u )) − (∑ x2i x3i )(∑ x3i (ui − u ))


αˆ= β2 + (9.13)
∑x ∑x − (∑ x2i x3i ) 2
2 2 2
2i 3i

对式(9.13)求条件期望,得

E (αˆ 2 | X 2 , X 3 ) = β 2

5
其方差为

σ v2
Var (αˆ 2 ) = (9.14)
∑x 2
2i (1 − r232 )

由以上可知,无关变量的设定误差的后果为:

(1)可以证明,式(9.11)参数的 OLS 估计量是无偏的,且为一致性估计量。即:

E (αˆ 2 ) = β 2 , p lim αˆ 2 = β 2 。同理,可证明 E (αˆ1 ) = β1 , E (αˆ 3 ) = β 3 = 0 ; p lim αˆ1 = β1


n →∞ n →∞

和 p lim αˆ=
3 β=
3 0 。其中,参数 α̂ 2 一致性的证明见本章附录 9.2。
n →∞

σ u2
(2) α̂ 2 不是有效估计量。因为 β̂ 2 的方差为 ,那么:
∑x 2
2i

Var (αˆ 2 ) 1 σ v2
= (9.15)
Var ( βˆ2 ) (1 − r23 ) σ u
2 2

虽然变量 X3 对被解释变量 Y 是无关的,但解释变量 X3 与 X2 之间很可能一定程度相关,

即 0 ≤ r232 ≤ 1 ,则 Var (αˆ 2 ) ≥ Var ( βˆ 2 ) 。这表明,无关变量 X3 的误选,会使得 α̂ 2 的方差增

大,导致 α̂ 2 的估计精度下降,且偏离程度随着解释变量间相关程度的增加而增大。此结论

对 α̂1 也成立;

( )
(3) E σˆ v2 = σˆ v2 ,即随机误差项的方差的估计仍为无偏估计;

(4)通常的区间估计和假设检验程序依然有效,但 α̂ 2 的方差增大,接受错误假设的概

率会较高。

比较遗漏相关变量和误选无关变量两类设定误差可以看出,如果遗漏了重要的相关变

量,将导致参数估计量有偏,且不一致;如果误选了无关变量,虽然参数估计量具有无偏性、

一致性,又会损失参数估计量的有效性。由于事先并不可能清楚地知道隐含在数据中的真实

数量关系,建模过程中将面临如何选择更为恰当变量的两难境地。若是主要注重估计量的无

偏性、一致性,那么可能会宁愿误选无关变量也不愿遗漏相关变量;若是主要注重估计量的

有效性,有时可能宁愿删除相关变量。通常误选无关变量不如遗漏相关变量的后果严重。因

此,一定程度上模型的设定实际是对偏误与有效进行权衡,偏爱哪一方取决于模型的研究目

的。若建模目的只是为了进行预测,最小均方误差则可能是兼顾有效性和无偏性的良好准则。

均方误差(简记作 MSE)是参数估计量 β̂ 与参数真实值 β 离差平方的期望

6
βˆ ) E ( βˆ − β ) 2
MSE (= (9.16)

容易证明,均方误差与方差有如下关系:

E ( βˆ − β ) 2 = E[ βˆ − E ( βˆ )]2 + [ E ( βˆ ) − β ]2 (9.17)

均方误差 E ( βˆ − β ) 是方差 E[ βˆ − E ( βˆ )] 与偏倚的平方 [ E ( βˆ ) − β ] 之和,包含了两个


2 2 2

方面的因素。当在较小偏倚(或无偏性)和较小方差(或最小方差性)
“二者不可得兼”时,

需要进行“权衡与折衷”
,可用均方误差准则。

第二节 设定误差的检验

相关变量的遗漏和无关变量的误选,在不同程度上给模型的设定形成了不良影响,有必

要对变量设定误差进行检验。当然,这种假设检验必须在经济理论指导下进行,不可抛弃经

济理论而进行假设检验。对于是否误选无关变量的检验,只要针对无关变量系数是否为零的

假设,用 t 检验或 F 检验,对无关变量作显著性检验即可。对于遗漏变量设定误差的检验有

多种方法,例如 DW 检验、拉格朗日乘数检验(Lagrange Multiplier, LM)


、RESET 一般性检

验以及一般性的 F 检验等。这里讨论的只是设定误差及模型选择的一些最常用的基本方法。

这些方法也可以用于对某些函数形式设定误差的检验。

一、 DW 检验
用 DW 检验去检验是否遗漏相关变量,其基本思想是认为遗漏的相关变量应包含在随

机扰动项中,那么回归所得的残差序列就会呈现单侧的自相关性,因此可从自相关性的角度

检验相关变量的遗漏。

从遗漏变量的模型看,可以认为遗漏变量模型是无遗漏变量模型的一个特例:被遗漏变

量的系数为 0。例如,当式(9.1)中变量 X 3i 的系数为 0 时,则为式(9.3)


。我们称式(9.1)

为无约束回归模型,而式(9.3)为受约束回归模型。

DW 检验的具体步骤如下:

(1) 对设定的回归模型运用 OLS 法得残差序列 ei 。

(2) 设定 H 0:受约束回归模型(即约束条件成立,无遗漏变量), H1:无约束回归模型

(即约束条件不成立,有遗漏变量)。按(可能)遗漏的解释变量的递增次序对残差序列 ei 进

行排序,对排序后的残差序列 ei 计算 d 统计量

7
n

∑ (e i − ei −1 ) 2
d= i =2
n
(9.18)
∑e
i =1
2
i

(3) 查 Durbin-Watson 表,若 d 统计量显示存在正自相关,则拒绝原假设,受约束回归

模型不成立,存在模型设定误差,否则接受原假设,受约束回归模型成立,模型无设定误差。

例如,对表 9.1 的数据设定总生产成本函数,准备使用如下的三个备选模型:

模型 1: β1 β 2 X i + β3 X i2 + β 4 X i3 + u1i
Yi =+

模型 2: β1 + β 2 X i + β3 X i2 + u2i
Yi =

模型 3: β1 + β 2 X i + u3i
Yi =

其中,只有模型 1 为真实模型,试用 DW 法检验模型设定误差。

表 9.1 总成本(Y)和产出(X)数据

序号 总成本(Y) 产出(X) 序号 总成本(Y) 产出(X)


1 193 1 6 260 6
2 226 2 7 274 7
3 240 3 8 297 8
4 244 4 9 350 9
5 257 5 10 420 10
首先,对上述三个模型分别代入数据回归,得:

Yˆi =141.767+63.478 X i -12.962 X i2 +0.939 X i3

(6.375) (4.778) (0.9856) (0.0592)

(22.238) (13.285) (-13.151) (15.861)

R 2 =0.9983 R 2 =0.9975 DW=2.70

Yˆi =222.383-8.0250 X i +2.542 X i2

(23.488) (9.809) (0.869)

(9.468) (-0.818) (2.925)

R 2 =0.9284 R 2 =0.9079 DW=1.038

Yˆi =166.467+19.933 X i

(19.201) (3.066)

(8.752) (6.502)

8
R 2 =0.8409 R 2 =0.8210 DW=0.716

由于本例中,遗漏变量已经按递增次序排列,此时的 DW 值等于 d 值,无需重新计算 d

统计量。对上述模型的 DW 统计量的分析及查表情况如下:

(1)对于模型 1 有 DW=2.70,当 n=10、 k ′ =3、α =5%时,dL=0.525, du=2.016,不

能表明存在显著的正相关关系,接受 H 0 ,表示没有遗漏的变量。

(2)对于模型 3 有 DW=0.716,当 n=10、k ′ =1、α =5%时,d L = 0.879 ,dU = 1.320 ,

显然存在正的自相关,拒绝 H 0 ,表明存在遗漏变量;

(3)对于模型 2,计算结果有 n=10,DW=1.038,那么,当 n=10, k ' = 2 , α =5%时,

d L = 0.697 , dU = 1.641 ,显然有 0.697<1.038<1.641,属于无法确定的区域。这时,可采

用修正的 DW 检验法进行检验,即扩大拒绝区域,可依据 DW= 1.038 < dU= 1.641 ,判别

残差中存在正的自相关,认为也存在遗漏变量。

二、拉格朗日乘数(LM)检验
拉格朗日乘数检验的基本思想,是认为模型中遗漏的相关变量包含在随机扰动项中,因

此随机扰动项或回归所得的残差序列应与遗漏的相关变量呈现出某种依存关系,因此可以进

行残差序列与相关变量的回归,在一定显著水平下若相关变量对残差序列的影响具有统计显

著性,则认为存在遗漏变量形成的设定偏误,若相关变量的影响不具有统计显著性,则认为

没有遗漏变量形成的设定误差。

拉格朗日乘数检验的具体步骤如下:

(1)对可能存在遗漏变量设定偏误的模型(受约束回归模型)进行回归,得到残差序

列 ei ;

(2)用残差序列 ei 对全部的解释变量(包括可能遗漏的变量)进行回归(无约束回归模

2
型),得可决系数 R ;

(3)设定 H 0:受约束回归模型 , H1:无约束回归模型 。构造检验统计量 nR2,恩格尔

(Engle)曾经证明,在大样本情况下:
asy
nR 2 ~ χ 2 ( 约束个数 ) (9.19)

其中:asy(asymptotically)表示渐近地;约束个数是 H 0 中设定的受约束个数。

9
(4)进行显著性检验的判断:若 nR 2 > χα2 ( 约束个数 ) ,则拒绝 H 0 ,认为受约束模型不

成立,存在遗漏变量;否则,若 nR 2 < χα2 (约束个数 ) ,则接受 H 0 ,认为受约束模型成立,

进而 无遗漏变量 。

三、一般性检验(RESET)
一般性检验(regression error specification test,RESET)是拉姆齐(Ramsey)于 1969 年提

出的一种检验方法。其检验的基本思想为:如果事先知道遗漏了哪个变量,只需将此变量引

入模型,估计并检验其参数是否显著不为零即可,可是问题是并不知道遗漏了哪个变量,这

时可寻找一个替代变量 Z 来进行上述检验。RESET 检验中,替代变量 Z 通常选用所设定模

型被解释变量拟合值 Ŷ 若干次幂的线性组合。若模型估计所得的残差包含着遗漏的相关变

量,那么这个残差可用被解释变量拟合值 Ŷ 的线性组合近似表示;若这个线性组合的影响

是显著的,则认为原模型的设定有误。由于可引入若干个替代变量去判断是否有多个变量被

遗漏,所以该方法被称为一般性设定偏误检验。

RESET 检验的基本步骤为:

第 1 步:对模型进行回归,用 OLS 法估计

Yi = β1 + β 2 X 2i + K + β k X ki + ui

分别得到 Yi 的拟合值 Ŷi 和残差 ei 。若残差 ei 与拟合值 Ŷi 之间存在某种函数关系,则可用拟

合值 Ŷi 若干次幂的线性组合充当工具变量;

第 2 步:用被解释变量 Yi 的拟合值 Ŷi 的线性组合,测度残差中是否包含着遗漏的相关

变量。具体做法为,在第 1 步的模型中增加一个包含拟合值 Ŷi 的函数。这个函数通常选择为

拟合值 Ŷi 的平方、三次方、四次方,或它们的线性组合。例如:

Yi =β1 + β 2 X 2i + K + β k X ki + δ1Yˆi 2 + δ 2Yˆi 3 + δ 3Yˆi 4 + vi (9.20)

并对上述模型进行估计;

第 3 步:构造原假设: H 0 : δ j = 0 , j = 1, 2 ,3 。然后用 F 统计量进行检验。F 检验统计

量为

=F
(=
RSSR − RSS U ) J (R − R ) J
2
U
2
R
(9.21)
RSS U [n − ( k + J )] (1 − R ) [n − ( k + J )]
2
U

10
即 =F
(=
RSSR − RSS U ) 3 (R − R ) 3
2
U
2
R
(9.22)
RSS U [n − ( k + 3)] (1 − R ) [n − ( k + 3)]
2
U

其中,RSS U 和 RU2 分别为对式(9.20)进行回归得到的残差平方和与拟合优度,RSSR 和 RR2

分别为当原假设 H 0 : δ j = 0 , j = 1, 2 ,3 成立时,对式(9.20)进行回归得到的残差平方和与拟

合优度,J 为约束条件的个数。

若 F 统计值大于 F 临界值,则拒绝原假设,表明存在某种形式的设定误差问题。

四、嵌套模型选择的 F 检验
对于遗漏变量设定误差的检验,是对是否应当包含某些解释变量模型的选择,可以视

为对嵌套模型选择的检验。所谓嵌套模型是指对于同一个被解释变量,一个模型的解释变量

完全包含另一个模型的解释变量。例如考虑下列模型:

β1 β 2 X 2i + β3 X 3i + β 4 X 4i + β5 X 5i + β 6 X 6i + ui
模型 A: Yi =+ (9.23)

模型 B: β1 β 2 X 2i + β3 X 3i + β5 X 5i + ui
Yi =+ (9.24)

模型 A 嵌套模型 B(或者说模型 B 嵌套在模型 A 中),受约束的模型 B 可视为在无约

束的模型 A 中遗漏了 X 4t 和 X 6t 的模型。那么实际应用时是选择无约束的模型 A 还是受约

束的模型 B 呢?这即是检验 H 0 : β=
4 β=
6 0。

一般性的 F 检验统计量是

( RSS R − RSSU ) q
=F : F ( q, n − k ) (9.25)
RSSU (n − k )

其中, RSSR 是受约束模型(本例的模型 B)的残差平方和; RSS U 是无约束模型(本

例的模型 A)的残差平方和;q 是约束个数,k 是无约束模型参数个数,n 是样本容量。


(本

例中 q=2,k=6)。如果 F 统计量的值大于临界值,则拒绝原假设,选择模型 A;否则接受原

假设,选择模型 B。

一般性的 F 检验对于嵌套模型的变量选择非常有用,实际上 RESET 检验可看作是嵌套

模型选择 F 检验的应用。

五、模型函数形式设定的检验
在计量经济分析中,能否建立一个令人满意的计量经济模型至关重要,一个好的模型除

了变量的确定外,还必须选择模型的函数形式。所谓模型函数形式的选择实际是指对被解释

11
变量条件期望函数的设定,是根据关于变量间依存关系的理论分析,正确选择

E (Y | X i ) = f ( X i ) 中 f (⋅) 的具体函数形式。当选取了错误的模型函数形式并对其进行估计

时,可能会带来偏误,这称为错误函数形式偏误(wrong functional form bias)。

模型错误的函数形式往往会引起随机扰动项的自相关。当模型存在自相关时,为了发现

模型是否有错误的函数形式,比较简便的方法之一是用回归的残差 ei 对解释变量的较高次幂

回归,然后检验新的残差项是否还有自相关,如果残差 ei 对解释变量的较高次幂回归所得到

的新残差不再有自相关,则很可能原模型采用了错误的函数形式。

此外,对遗漏变量设定误差的一些检验方式,有时也可检验模型函数形式是否正确。例

如,总生产成本 Y 与产出 X 关系的模型,有可能分别设定为

β1 + β 2 X i + ui
Yi = (9.26)

β1 + β 2 X i + β3 X i2 + ui
Yi = (9.27)

β1 β 2 X i + β3 X i2 + β 4 X i3 + ui
Yi =+ (9.28)

可以运用 DW 检验、拉格朗日乘数 LM 检验和 RESET 检验等方法,检验上述模型中的

X i2 和 X i3 是否被遗漏的变量,也就检验了其中哪种函数形式更加符合实际。

对模型其他函数形式设定误差的检验,还可以采用对非嵌套模型设定的假设检验,如戴

维森-麦金农的 J-检验,非嵌套 F 检验等。 2

第三节 测量误差

计量经济研究中需要运用大量的观测数据,在搜集相关的数据时,经常遇到所搜集的数

据不能确实地反映变量间经济行为的情况。在计量经济模型中使用了经济变量不准确的数据

时,则称模型中包含了测量误差。测量误差将会影响计量经济分析的结果。

一、模型变量的测量误差
测量误差指在收集数据过程中的登记误差、在数据加工整理过程中的整理误差以及其他

统计误差。计量经济研究中运用的观测数据出现测量误差,原因是多方面的。首先,受人为

因素和技术因素的影响,对经济现象和过程的调查登记本身就可能产生误差,例如虚报和误

解指标含义而产生的统计误差;其次,数据的加工处理过程中也可能导致一定的误差,例如

2对其他模型函数形式设定误差的检验已超出了本科教学的要求,本书不再介绍。

12
错误的汇总或分组导致的偏差,又如经过修匀加工的数据与实际情况的偏差;此外,数据的

不当使用也会出现误差,例如错误地理解和运用了不同内涵、不同范围、不同计量单位的数

据。可以把这些有关数据的误差统称为“测量误差”。测量误差可能是被解释变量的测量误

差,也可能是解释变量的测量误差。

为了说明测量误差的后果,设正确的回归模型为

α β X i* + ui
Yi * =+ (9.29)

* *
其中: Yi * 为被解释变量的理论值; X i 为解释变量的理论值,且 Yi * 和 X i 都是不可直

接测量的,而只能通过下列测量过程得到其样本数据:

Yi = Yi * + ε i ε i ~ N (0, σ ε2 ) (9.30)

X i = X i* + ω i ω i ~ N (0, σ ω2 ) (9.31)

且 Cov(ε i , ω i ) = 0 , Cov(ε i , X i ) = 0

其中: Yi 是 Yi * 的测量结果; ε i 是 Yi * 的测量误差; X i 是 X i* 的测量结果; ω i 是 X i* 的

测量误差; ε i 与 ω i 相互无关, ε i 与 X i 也无关,且各误差都没有序列相关。

用观测到的样本数据进行回归时,等价于对下式回归:

Yi = α + β ( X i − ωi ) + ui + ε i

= α + β X i + ui + ε i − βωi (9.32)

将式(9.29)—式(9.31)分别以离差形式表示:

*
yi* = βxi + (ui − u ) (9.33)

yi = yi* + (ε i − ε ) (9.34)

xi =xi* + (ωi − ω ) (9.35)

对式(9.29)采用 OLS 法,有

βˆ = ∑x y
i i

∑x 2
i

将式(9.34)和式(9.35)代入,并在大样本下,取概率极限得(推导过程见附录 9.3)

13
β VarX i*
^ β
P lim β =
=
VarX i* + σ ω2 σ ω2 (9.36)
1+ 2
σX *

其中 σ ω2 为式(9.31)中 ω 的方差; σ X * 为 X i* 的方差。因为式(9.36)中 σ ω2 σ X2 * > 0 ,这


2

表明当测量误差存在时,OLS 法常常会低估真实的回归参数。

值得指出的是,回归变量中的测量误差是数据问题,目前计量经济学家们只能要求尽量

避免测量误差。一般的做法往往是忽略测量误差问题,主观上希望测量误差足够小,从而不

破坏计量分析的合理性。

二、测量误差的检验
测量误差的存在使得回归系数被低估,将直接影响计量经济分析的结果,因此有必要对

是否存在测量误差进行检验。

关于测量误差存在与否的检验是豪斯曼(Hausman)1978 年提出的检验方法 3,豪斯曼

方法的具体步骤为:

(1)对所研究的回归模型,无论是否存在测量误差,先采用 OLS 法得到参数估计量;

(2)对可能存在测量误差的解释变量,选择与其相关的工具变量,将可能存在测量误

差的解释变量对选择的工具变量进行回归,并获得回归残差 ω̂ ;

(3)将回归残差 ω̂ 加入第(1)步中的回归表达式,再次进行 OLS 估计,得 ω̂ 的参数

估计值 βˆωˆ 及假设检验结果;

(4)若 βˆωˆ 为显著时,则认为解释变量的确存在观测误差,反之,认为解释变量不存在

测量误差。

现以一个例子说明上述检验步骤:

利用观测到的样本数据作回归,已得到以下结果:

EXˆP = −46.81 + 0.00324 AID + 0.00019 INC − 0.597 POP (9.37)

t = (−0.56) (13.64) (8.12) (−5.17)

R 2 = 0.993 F = 2190

其中:EXP 为某贫困地区地方政府的支出;AID 为中央政府的拨款量;INC 为贫困地

3 J.A.Hausman:“Specification Tests in Econometrics”, Econometrica, vol.46, pp1251-1271, Nov.1978.

14
区地方政府的财政收入;POP 为该地区的总人口数。现怀疑中央政府的拨款量 AID 存在测

量误差。现选择工具变量 PS(PS 为贫困人口数),其原因为扶贫支出是该地区地方政府支

出中比重最大的支出,其经费来源主要是依赖中央政府的拨款,因此 PS 与 AID 有较高相关

性。将 AID 对 PS 进行回归,得到如下的残差变量 ω̂ :

ωˆ i =AIDi − ( 77.95 + 0.845PSi ) (9.38)

t = (−1.28) (18.02) R 2 = 0.87

将 ω̂ i 项加入式(9.37),再回归,得到以下结果:

EXˆP = −138.51 + 0.00174 AID + 0.00018 INC − 0.275 POP + 1.372ω̂ i (9.39)

t = (−1.41) (1.94) (7.55) (−1.29) (1.73)

从(9.39)看出,因为 ω̂ i 系数的 t 值是 1.73(<1.96),在 5%的显著性水平下,双侧 t 检

验接受原假设(不存在测量误差),但在 10%的显著性水平上,双侧 t 检验则拒绝原假设而

接受备择假设(存在测量误差)。

我们注意到,引进对测量误差可能性的修正,使 AID 变量的系数变小,这从另一个侧

面说明,测量误差夸大了 AID 对 EXP 的影响。

第四节 案例分析
以本章引子中所提出的问题为例,分析不同解释变量的设定对于解释粮食产量的合理
性。
有人根据现实农业发展状况,考虑到最主要的影响因素及模型的简洁,认为合理的模型
应设定为

β1 + β 2 ln X 2t + ut
ln Yt = (9.40)

式中,Yt 是国内粮食总产量,ln Yt 是 Yt 的对数; X 2t 是化肥施用总量,ln X 2t 是 X 2t 的对数。

也有人认为,粮食产量不止取决于化肥施用量,还有一些其他的重要因素可能会影响到
粮食产量,应当考虑添加其他的解释变量,例如,粮食播种面积、农业劳动力人口等等。因
此,主张考虑将“粮食播种面积”和“农业劳动力人口”的影响也纳入模型中,将模型设定
为:

β1 + β 2 ln X 2t +β3 ln X 3t +β 4 ln X 4t + ut
ln Yt = (9.41)

式中, X 3t 是国内粮食播种总面积, ln X 3t 是 X 3t 的自然对数; X 4t 是代表农业劳动力人口

的变量,由于农业劳动力人口数据获取困难,用统计年鉴中的“乡村人口总数”作为农业劳

15
动力人口的代理变量, ln X 4t 是 X 4t 的自然对数。

为了分析式 9.40 的回归模型是否有变量的设定误差,需要对其进行变量设定误差检验。

如果设定的式 9.40 回归模型遗漏了变量,那么 X 3 和 X 4 是否是被遗漏的重要变量呢?从

CEIC 经济数据库中获得 1983-2016 年粮食总产量、化肥施用总量、粮食播种总面积、乡村


人口总数等数据(见表 9.2)。
表 9.2 粮食总产量、化肥施用总量、粮食播种总面积、乡村人口总数

粮食总产量 化肥施用总量 粮食播种总面积 乡村人口总数


年份
(Y)/千吨 (X2) /千吨 (X3) /千公顷 (X4) /百万人
1983 387275.00 16598.00 114047.30 807.34
1984 407305.00 17398.00 112884.00 803.40
1985 379108.00 17758.00 108845.13 807.57
1986 391512.00 19306.00 110932.70 811.41
1987 402980.00 19993.00 111268.00 816.26
1988 394080.00 21415.00 110122.70 823.65
1989 407550.00 23571.00 112204.70 831.64
1990 446243.00 25903.00 113465.87 841.38
1991 435293.00 28051.00 112313.60 846.20
1992 442658.00 29302.00 110559.70 849.96
1993 456488.00 31519.00 110508.70 853.44
1994 445101.00 33179.00 109543.70 856.81
1995 466618.00 35937.00 110060.40 859.47
1996 504535.00 38279.00 112547.92 850.85
1997 494171.00 39807.00 112912.10 841.77
1998 512295.30 40837.00 113787.40 831.53
1999 508385.80 41243.20 113160.98 820.38
2000 462175.20 41464.12 108462.54 808.37
2001 452636.70 42537.63 106080.03 795.63
2002 457057.50 43393.90 103890.83 782.41
2003 430695.26 44115.60 99410.37 768.51
2004 469469.49 46365.80 101606.03 757.05
2005 484021.90 47662.18 104278.38 745.44
2006 498042.27 49276.93 104957.70 731.60
2007 501602.77 51078.32 105638.36 714.96
2008 528709.16 52390.23 106792.65 703.99
2009 530820.78 54043.52 108985.75 689.38
2010 546477.12 55616.80 109876.09 671.13
2011 571208.49 57042.36 110573.02 656.56
2012 589579.66 58388.49 111204.59 642.22
2013 601938.40 59118.64 111955.56 629.61
2014 607026.06 59959.38 112722.58 618.66
2015 621439.18 60226.03 113342.93 603.46

16
2016 616250.50 59840.29 113034.48 589.73
数据来源:CEIC 经济数据库
1. 是否有遗漏变量的检验
依据表 9.2 中 1983-2016 年的数据,将所有变量的数据进行对数化处理,首先作式(9.40)
的回归,结果如图 9.1。

图 9.1 回归结果
图 9.1 回归结果的残差图见图 9.2。

图 9.2 残差图
图 9.2 显示模型可能存在自相关,模型遗漏了重要的相关变量可能是重要的原因。
(1)DW 检验
对式(9.40)模型估计结果的 DW 统计量为 0.3857,根据 n=34 和 k`=1,α=0.05 的 DW

统计量的临界值为 d L = 1.393 , dU = 1.514 ,由于 DW


= 0.3857 < d=
L 1.393 ,表明存在

正的自相关,式(9.37)模型显著存在遗漏变量。

(2)LM 检验
为了检验粮食播种总面积等变量是否为被遗漏的重要变量,按照LM检验的步骤,对于式
(9.40)的受约束模型,首先生成其残差序列EE=resid,再用EE对全部解释变量(包括遗漏
变量)进行回归,得出图9.3的结果。

17
图 9.3 LM 检验的回归结果

对 于 H0 : 受 约 束 模 型 , 查 表 χ 0.025
2
(2) = 7.37776 , 由 图 9.3 中 可 决 系 数 数 据 计 算

nR 2 = 31.0614 ,显然, nR 2 = 31.0614 > χ 0.025


34 × 0.91357 = 2
(2) = 7.37776 ,拒绝 H 0 :
受约束回归模型,即式(9.40)不合理,可判断存在重要的遗漏变量。
(3)一般性检验(RESET)
进行 RESET 检验,在 EViews8.0 中,在对式(9.40)回归的输出结果中,点“View /
Stability Diagnostics / Ramsey RESET Test”,在“Number of fitted terms”中选取拟

合项数目,如选“1”,意味着添加了拟合值 Ŷi 的平方;选“2”,意味着添加拟合值 Ŷi 的平

方和三次方两项。点“OK”即得 RESET 检验结果,如图 9.4。

4
图9.4 RESET检验结果

图 9.4 显示的 F 统计量的 p 值为 0.0013,拒绝原假设,认为存在遗漏变量的问题。


2. 对模型设定的调整

为纠正遗漏变量的设定误差,在解释变量中补充 ln X 3t 和 ln X 4t ,作式(9.41)的回归,

回归结果如图9.5所示。

4 为限制篇幅,这里只显示了输出结果的一部分。

18
图 9.5 回归结果
(1)DW 检验
式(9.41)模型估计结果的 DW 统计量为 1.8084,根据 n=34 和 k`=3,α=0.05 的 DW 统

计 量 的 临 界 值 为 d L = 1.271 , dU = 1.652 , 由 于

d=
U 1.652 < DW
= 1.8084 < 4 − d=
U 2.348 ,表明不存在自相关,式(9.41)模型已不

存在显著的遗漏变量。
(2)一般性检验(RESET)
进行 RESET 检验,在 EViews8.0 中,在对式(9.41)回归的输出结果中,点“View /
Stability Diagnostics / Ramsey RESET Test”,在“Number of fitted terms”中选取拟
合项数目,如“1”,点“OK”即得 RESET 检验结果,如图 9.6。

图 9.6 RESET 检验的回归结果


图 9.6 显示 F 统计量的 p 值为 0.4304,不拒绝原假设,认为不存在显著的遗漏变量。
经过变量设定检验说明,对于中国的粮食产量问题,相对更合理的模型是经过检验后
无遗漏变量的式(9.41)
。需要指出的是,在上述建模过程中,主要是从教学的目的出发进
行遗漏变量的讨论,没有考虑时间序列数据的特殊问题。而在实证分析中,还应该对这类问
题进行更进一步讨论。

本章小结

1.计量经济学模型中的古典假设除了对随机扰动项 ui 分布的假定以外,还假定模型中的

变量和函数形式的设定是正确的。

19
2.模型设定误差主要指:重要变量的遗漏;无关变量的引入;错误函数形式的设置及随

机扰动项的非正确设定等。

3.当模型中遗漏了真实的变量时,模型的参数估计是有偏且不一致的;参数估计的方差

估计不正确,随机扰动项方差的估计也是不正确的,将使得假设检验、区间估计失效。

4.当模型包含无关变量,后果不如遗漏变量那么严重,模型的参数估计仍然是无偏且一

致的,随机扰动项的方差将被正确估计,但所估计的方差将趋于过大,从而使得参数估计的

有效性降低,参数估计较为不准确,区间估计的精度下降。

5.检验方程设定误差的常用方法有:(1)DW 检验;(2)LM 检验;(3)F 检验;(4)

RESET 检验。

6.主要公式见表 9.3。

表 9.3 主要公式表

名称 公式

均方误差(简记作 MSE) βˆ ) E ( βˆ − β ) 2
MSE (=

均方误差与方差的关系 E ( βˆ − β ) 2 = E[ βˆ − E ( βˆ )]2 + [ E ( βˆ ) − β ]2
n n
DW 检验 d = ∑ (ei − ei −1 ) 2
i =2
∑e
i =1
2
i

ays
拉格朗日乘数检验
nR 2 ~ χ 2 ( 约束个数 )

嵌套模型选择的 F 检验 ( RSS R − RSSU ) q


=F : F ( q, n − k )
RSSU (n − k )

思考题
9.1 什么是设定误差?设定误差有哪些基本表现?不同类型的设定误差对模型参数估

计有哪些影响?

9.2 检验变量设定误差有哪几种方法?它们的共性和差异是什么?

9.3 如何进行遗漏变量设定误差的后果分析?其检验有哪些方法?如何检验?

9.4 如何进行无关变量设定误差的后果分析?其检验有哪些方法?如何检验?

9.5 嵌套模型选择的 F 检验如何进行?

20
练习题
9.1 某人在判定是否存在变量设定误差时,提出了如下的四条准则:

(1)理论: 解释变量在模型中的位置是不是含糊不清,从理论上看是否是合理的?

(2) t 检验: 解释变量系数估计值在预期的方向上是否是显著的?

(3) R 2 :将解释变量加入模型后,调整后的总体拟合优度是否有所改进?

(4)偏误: 将解释变量加入模型后,其他解释变量系数估计值是否是有显著的变化?

若这四条准则均满足,则该解释变量就应当包含在模型中,若这四条准则均不满足,则
该解释变量应为不相关的解释变量,可以很有把握地将其从模型中剔除。

试根据所学的知识,给出自己对这四条准则的评价。

9.2 假设制造业企业工人的平均劳动生产率(Y)与工人的平均培训时间(t)和平均能力
(X)之间存在依存关系,可建立如下的的回归模型:

Y = β 0 + β1t + β 2 X + u

若政府给那些工人能力低的企业以政府培训补助,则平均培训时间就和工人平均能力负相
关。现在考虑这个因素,采用如下模型进行回归:

Y = α 0 + α1t + ε

问由此获得的 α̂1 会有怎样的偏误。

9.3 如果从中国统计年鉴得到 1990 年-2012 年的全国居民消费水平(CT)与国内生产


总值(GDP)的数据,又从网络上得到国民总收入(GNI)数据,如表 9.4。

表 9.4 1990-2012 年全国居民消费水平、国民总收入与国内生产总值数据


国民总收 国内生产总 全国居民 国民总收 国内生产 全国居民
年份 入 GNI 值 GDP 消费水平 年份 入 GNI 总值 GDP 消费水平
(亿元) (亿元) CT (元) (亿元) (亿元) CT (元)
1990 18718.3 18667.8 833 2002 110115.7 120332.7 4144
1991 20006.2 21781.5 932 2003 134977.0 135822.8 4475
1992 26007.3 26923.5 1116 2004 123853.6 159878.3 5032
1993 35260.0 35333.9 1393 2005 135717.4 184937.4 5596
1994 40108.5 48197.9 1833 2006 216204.4 216314.4 6299
1995 52140.5 60793.7 2355 2007 232122.0 265810.3 7310
1996 70142.5 71176.6 2789 2008 316030.3 314045.4 8430
1997 72060.9 78973.0 3002 2009 312320.0 340902.8 9283
1998 83024.3 84402.3 3159 2010 399759.5 401512.8 10522
1999 81239.2 89677.1 3346 2011 431215.0 473104.0 12272
2000 92600.5 99214.6 3632 2012 500662.0 519322.0 13946
2001 108068.2 109655.2 3887

依据弗里德曼的持久收入假设,消费函数的真正模型应为

α + β GNI t + ut
CTt =

21
如果怀疑从网络得到的国民总收入(GNI)数据有误,需要进行测量误差检验。试用检验来

自网络的国民总收入(GNI)是否存在测量误差。

9.4 对于本章的案例,有人提出粮食总产量与上年的化肥施用量也可能有关,认为粮食

总产量除了当年化肥施用量、国内粮食播种面积和农村人口数变量外,式(9.41)的模型还

可能遗漏了“上年化肥施用量”变量,你怎样利用表 9.2 的数据加以检验?

9.5 用本章的方法检验你在练习题 2.9 和练习题 3.7 中所建立的模型是否存在遗漏重要

变量的设定误差?

附录 9.1 α̂ 2 概率极限性质的证明

p lim αˆ 2 =
p lim β 2 + p lim β 3
∑x x 2 i 3i
+ p lim
∑ x (u − u )
2i i

n →∞ n →∞ n →∞ ∑x 2
2i n →∞ ∑x 2
2i

1 1
p lim ∑ x2i x3i p lim ∑ x2i (ui − u )
β 2 + β3 n→∞ n
= + n→∞ n
1 1
p lim ∑ x22i p lim ∑ x22i
n →∞ n n →∞ n

Cov ( X 2i , X 3i ) Cov ( X 2i , ui )
β 2 + β3
= +
Var ( X 2i ) Var ( X 2i )
1 1 1
其中:
n
∑ x22i 为 X2 的样本方差, ∑ x2i x3i 为 X2 和 X3 的样本协方差, ∑ x2i (ui − u )
n n
为 X2 和 ui 的样本协方差。

附录 9.2 参数 α̂ 2 一致性的证明
 ( ∑ x32i )( ∑ x2i (ui − u )) − ( ∑ x2i x3i )( ∑ x3i (ui − u )) 
p= lim αˆ 2 p lim β 2 + p lim  
n →∞ n →∞ n →∞ 
 ∑ x22i ∑ x32i − (∑ x2i ∑ x3i )2 

 p lim (∑ x32i )(∑ x2i (ui − u )) − (∑ x2i x3i )(∑ x3i (ui − u ))  
 
= β 2 +  n→∞
 p lim  ∑ x22i ∑ x32i − (∑ x2i ∑ x3i ) 2  
 n →∞ 

 p lim(∑ x32i ) p lim(∑ x2i (ui − u )) − p lim(∑ x2i x3i ) p lim(∑ x3i (ui − u )) 
= β 2 +  n→∞ n →∞ n →∞ n →∞ 
 p lim ( ∑ x2i ∑ x3i − (∑ x2i ∑ x3i ) )
2 2 2 
 n →∞ 

22
 
 
 Var ( X 3i ) Cov ( X 2i , ui ) − Cov ( X 2i , X 3i ) Cov ( X 3i , ui ) 
= β2 +
 1 
2

 Var ( X 2i ) Var ( X 3i ) − p lim  ∑ x2i ∑ x3i  
 n →∞  n  

=
当 (
Cov X 2 i ,ui ) 0,
= Cov X 3 i ,ui ( ) 0时

 
 
Var ( X 3i ) × 0 − Cov ( X 2i , X 3i ) × 0
β2 + 
p lim αˆ 2 = =β2
n →∞  1  
2

 Var ( X 2i ) Var ( X 3i ) − p lim  ∑ x2i ∑ x3i  


 n →∞  n  
同理,可证 E (αˆ1 ) = β1 , E (αˆ 3 ) = β 3 = 0 ; p lim αˆ1 = β1 和 p lim αˆ=
3 β=
3 0。
n →∞ n →∞

附录 9.3 有测量误差模型参数估计结果的推导

βˆ = ∑x y i i

∑x 2
i

=
∑[x *
i + (ω i − ω )][ yi* + (ε i − ε )]
∑[x *
i + (ω i − ω )]2

=
∑ x y + ∑ (ω − ω ) y +∑ x (ε − ε ) + ∑ (ω − ω )(ε
* *
i i i
*
i
*
i i i i −ε )
∑ x + ∑ (ω − ω ) + 2∑ x (ω − ω ) * 2 2 *
i i i i

=
∑ x ( β x + (u
*
i
*
i i − u ) ) + ∑ (ωi − ω ) ( β xi* + ( ui − u ) ) + ∑ xi* (ε i − ε ) + ∑ (ωi − ω )(ε i − ε )

∑x + ∑ (ωi − ω ) + 2∑ xi* (ωi − ω )


*2 2
i

β ∑ xi* + ∑ xi* (ui − u ) + β ∑ (ωi − ω ) xi* + ∑ (ωi − ω )(ui − u ) + ∑ xi* (ε i − ε ) + ∑ (ωi − ω )(ε i − ε )
2

=
∑x + ∑ (ωi − ω ) + 2∑ xi* (ωi − ω )
*2 2
i

因此,测量误差模型参数估计的概率极限为

p lim  β ∑ xi* + ∑ xi* (ui − u ) + β ∑ (ωi − ω ) xi* + ∑ (ωi − ω )(ui − u ) + ∑ xi* (ε i − ε ) + ∑ (ωi − ω )(ε i − ε ) 
2

p lim βˆ =  
p lim ∑ xi + ∑ (ωi − ω ) + 2∑ xi (ωi − ω )
 2
*2 * 
 

β Var ( X i* ) + Cov ( X i* , ui ) + β Cov ( X i* , ωi ) + Cov (ωi , ui ) + Cov ( X i* , ε i ) + Cov (ωi , ε i )


=
Var ( X i* ) + Var (ωi ) + 2Cov ( X i* , ωi )

β VarX i* β
= =
VarX i* + σ ω2 σ2
1 + 2ω
σX *

23
第十章 时间序列计量经济模型

引子:

是真回归还是伪回归?
在经典的回归分析中,通常的做法是:首先采用普通最小二乘法对回归模型进行估计,

然后根据可决系数 R2 或 F 检验统计量值的大小来判定变量之间的相依程度,根据回归系数

估计值的 t 统计量对系数的显著性进行判断,最后在回归系数显著不为零的基础上对回归系

数估计值给予经济解释。

为了分析美国的个人可支配总收入(I)与个人消费总支出(E)的关系,遵照以上作法,收

集了 1970 年至 1991 年的季度时间序列数据,用 OLS 法作 E 关于 I 的线性回归,得到如下

结果:

E t = −171.4412 + 0.9672 I t

t=(-7.4809) (119.8711)

R 2 = 0.9940 DW = 0.5316

2
从回归结果来看, R 非常高,个人可支配总收入 I 的回归系数 t 统计量也非常大,边际消

费倾向符合经济假设 ①。

凭借经验判断,这个模型的设定是好的,所用数据也是可靠的,样本容量很充分,这应

是满意的结果。准备将这个计量结果用于经济结构分析和经济预测。

可是有人提出,这个回归结果可能是虚假的!可能只不过是一种“伪回归”!如果真是

这样,将所估计的模型直接用于经济结构分析和预测,就要千万小心!

这里用时间序列数据进行的回归,究竟是真回归还是伪回归呢?为什么模型、样本、数

据、检验结果都很理想,却可能得到“伪回归”的结果呢?

时间序列数据被广泛地运用于计量经济研究。经典时间序列分析和回归分析有许多假

定前提,如序列的平稳性、正态性等,,如果直接将经济变量的时间序列数据用于建模分析,

实际上隐含了这些假定。在这些假定成立的条件下,进行的 t、F、 χ 等检验才具有较高的


2

可靠度。但是,越来越多的经验证据表明,经济分析中所涉及的大多数时间序列是非平稳的。

① 资料来源:古扎拉蒂《计量经济学》(第三版)下册,第 719 页,中国人民大学出版社,2000 年。

1
那末,如果直接将非平稳时间序列当作平稳时间序列来进行分析,会造成什么不良后果?如

何判断一个时间序列是否为平稳序列?当我们在计量经济分析中涉及到非平稳时间序列时,

应作如何处理呢?这就是本章要讨论的基本内容。

第一节 时间序列计量经济分析的基本概念

一、伪回归问题
经典计量经济学建模过程中,通常假定经济时间序列是平稳的,而且主要以某种经济理

论或对某种经济行为的认识来确立计量经济模型的理论关系,并依据理论模型进行数据收集、

参数估计以及模型检验,这是 20 世纪 70 年代以前计量经济学的主导方法。然而,这种针对

平稳变量的建模方法在 20 世纪 70 年代出现石油危机后引起的经济动荡面前却失灵了。这里

的失灵不是指这些模型没能预见石油危机的出现,而是指这些模型无法预计石油危机的振荡

对许多基本经济变量的动态影响。因此引起了计量经济学界对经典计量经济学方法论的反思,

并将研究的注意力转向宏观经济变量非平稳性对建模的影响。人们发现,由于经济分析中所

涉及的经济变量数据基本上是时间序列数据,而大多数经济时间序列是非平稳的,如果直接

将非平稳时间序列当作平稳时间序列进行回归分析,则可能会带来不良后果,如伪回归问题。

所谓“伪回归”,是指变量间本来不存在有意义的关系,但回归结果却得出存在有意义

关系的错误结论。经济学家早就发现经济变量之间可能会存在伪回归现象,但在什么条件下

会产生伪回归现象,长期以来无统一认识。直到 20 世纪 70 年代,Grange、Newbold 研究发

现,造成“伪回归”的根本原因在于时间序列变量的非平稳性。他们用 Monte Carlo 模拟方

法研究表明,如果用传统回归分析方法对彼此不相关联的非平稳变量进行回归,t 检验值和

F 检验值往往会倾向于显著,从而得出“变量相依”的“伪回归结果”。

因此,当经济变量数据为时间序列数据时,在利用回归分析方法讨论经济变量有意义的

经济关系之前,必须对经济变量时间序列的平稳性与非平稳性进行判断。如果经济变量时间

序列是非平稳的,则需要寻找新的处理方法。20 世纪 80 年代发展起来的协整理论就是处理

非平稳经济变量关系的行之有效的方法。该理论自从诞生以来,受到众多经济学家的重视,

并广泛运用于对实际经济问题的研究。

二、随机过程的概念
在概率论和数理统计中,随机变量是分析随机现象的有力工具。对于一些简单的随机

现象,一个随机变量就足够了,如候车人数,某单位一天的总用水量等。对于一些复杂的随

2
机现象,用一个随机变量来描述就不够了,而需要用若干个随机变量来加以刻画。如平面上

的随机点,某企业一天的工作情况(产量、次品率、耗电量、出勤人数等)都需要用多个随

机变量来刻画。

还有些随机现象,要认识它必须研究其发展变化过程,这一类随机现象不能只用一个或

多个随机变量来描述,而必须考察其动态变化过程,随机现象的这种动态变化过程就是随机

过程。例如,某一天电话的呼叫次数ξ,它是一个随机变量。若考察它随时间 t 变动的情况,

则需要考察依赖于时间 t 的随机变量ξt,{ξt}就是一个随机过程。又如,某国某年的 GDP

总量,是一个随机变量,但若考查它随时间变化的情形,则{GDPt}就是一个随机过程。

一般地,若对于每一特定的 t(t∈T),Yt 为一随机变量,则称这一簇随机变量{Yt}为

一个随机过程。若指标集 T 为一连续区间,则{Yt}为连续型随机过程。若 T 为离散集合,

如 T=(0,1,2,……)或 T=(……,-2,-1,0,1,2,……),则{Yt}为离散型随机

过程。随机过程的统计特征通常用其分布及数字特征来刻画。

离散型时间指标集的随机过程通常称为随机型时间序列,简称为时间序列。经济分析中

常用的时间序列数据都是经济变量随机序列的一个实现。

三、时间序列的平稳性
所谓时间序列的平稳性,是指时间序列的统计规律不会随着时间的推移而发生变化。

也就是说,生成变量时间序列数据的随机过程的特征不随时间变化而变化。以平稳时间序列

数据作为计量经济模型变量的观测值时,其估计方法、检验过程才可能采用前面几章所介绍

的方法。

直观上,一个平稳的时间序列可以看作一条围绕其均值上下波动的曲线。从理论上,

有两种意义的平稳性,一是严格平稳,另一是弱平稳。严格平稳是指随机过程{Yt}的联合

分布函数与时间的位移无关。设{Yt}为一随机过程,n, h 为任意实数,若联合分布函数满

足:

FYt ,Yt
1 2
,L ,Ytn (Y1 ,L Yn ) = FYt +h ,L ,Yt +h (Y1 ,L , Yn )
1 n
(10.1)

则称{Yt}为严格平稳过程,它的分布结构不随时间推移而变化。

弱平稳是指随机过程{ Yt }的期望、方差和协方差不随时间推移而变化。若{Yt}满足:

E (Yt ) = µ

Var (Yt ) = r0 = σ 2 (10.2)

3
Cov(Yt , Ys ) =Cov(Yt + h , Ys + h ) =r (t − s, 0) =rt − s

则称{Yt}为弱平稳随机过程。在以后的讨论中,关于平稳性的概念通常是指弱平稳。

所谓时间序列的非平稳性,是指时间序列的统计规律随着时间的位移而发生变化,即

生成变量时间序列数据的随机过程的特征随时间而变化。当生成序列的随机过程是非平稳的

时候,其均值函数,方差函数不再是常数,自协方差函数也不仅仅是时间间隔 t—s 的函数,

前面所介绍的高斯一马尔科夫定理不再成立,一个变量对其它变量的回归可能会导致伪回归

结果,前面所介绍的计量经济技术也将遇到困难。

在经济领域中,我们所得到的许多时间序列观测值大都不是由平稳过程产生的。例如,

国内生产总值 GDP 大多数情况下随时间的位移而持续增长;货币供给量 M2 在正常状态下

会随时间的位移而扩大。也就是说,2007 年 GDP 或 M2 的随机性质与 1996 年的 GDP 和

M2 的随机性质有相当的区别。

由于在实际中遇到的时间序列数据很可能是非平稳序列,而平稳性在计量经济建模中又

具有重要地位,因此有必要对观测值的时间序列数据进行平稳性检验。

第二节 时间序列平稳性的单位根检验
时间序列平稳性的检验方法主要有传统方法和现代方法,前者以自相关函数检验为代表,

后者以单位根检验为代表。本书只介绍目前最常用的单位根检验法。

一、单位根过程
一般来讲,由于经济系统惯性的作用,经济时间序列往往存在着前后依存关系,这种前

后依存关系是时间序列预测的基础。假定{Yt}为一时间序列,最简单的一种前后依存关系

就是变量当前的取值主要与其前一时期的取值状况有关,而与其前一时期以前的取值状况无

直接关系,也就是说 Yt 主要与 Yt-1 相关,与 Yt-2 ,Yt-3,……无关。可用如下的一阶自回归

模型来描述这种关系:

Yt γ Yt −1 + ε t
= (10.3)

常记作 AR(1)。其中 ε t 为独立同分布且均值为零、方差恒定为 σ 2 的白燥声 。


如果 Yt 不仅与前一期 Yt-1 有关,而且与 Yt-2 相关,显然,在这种情况下用 AR(1)来刻画

Yt 的动态依存关系就不恰当了,需要在模型中引入 Yt-2。一般的,如果 Yt 与过去时期直到

Yt-p 的取值相关,则{Yt}的动态关系就需要使用包含 Yt-1 ,……Yt-p 在内的 p 阶自回归模型


为与其他随机扰动项相区别,本章均用 ε t 表示白噪声。

4
来加以刻画。P 阶自回归模型的一般形式为:

Y=
t γ 1Yt −1 + γ 2Yt − 2 + L + γ pYt − p + ε t (10.4)

=
为了说明单位根过程的概念,这里侧重以 AR(1)模型 Yt γ Yt −1 + ε t 进行分析。根据平稳

时间序列分析的理论可知,当 γ < 1 时,该序列{Yt}是平稳的,此模型是经典的 Box-Jenkins

时间序列 AR(1)模型。但是,如果 γ = 1 ,则序列的生成过程变为随机游走过程(random walk

process):

Yt Yt −1 + ε t
= (10.5)

式中, {ε t } 独立同分布且均值为零、方差恒定为 σ 2 。随机游走过程的方差为:

Var (Yt ) = Var (Yt −1 + ε t )


= Var (Yt − 2 + ε t −1 + ε t )

= Var (ε1 + ε 2 + L + ε t −1 + ε t )
= tσ 2

当 t → ∞ 时,序列的方差趋于无穷大,这说明随机游走过程是非平稳的。

如果一个序列是随机游走过程,则称这个序列是一个单位根过程 。较随机游走更一般

的,是一般的单位根过程。若随机过程 {Yt } 遵从:

Yt = γYt −1 + u t (10.6)

式中,γ = 1 ,{ut } 为一平稳过程,且 E (ut ) = 0, Cov(ut , ut − s ) = µ s < ∞, s = 0,1,2,L 。则

称序列 {Yt } 为(不带漂移的)单位根过程。带漂移和时间趋势的单位根过程服从如下模型:


将一阶自回归模型表示成如下形式: Yt- γ Yt-1=εt 或 (1 − γ L)Yt = ε t ,其中,L 是滞后算子,

即 LYt = Yt −1 。根据模型的滞后多项式 (1 − γ L) ,可以写出对应的线性方程:1 − γz = 0 (通常称为特征

方程),该方程的根为: z =1 γ 。当 γ < 1 时序列是平稳的,特征方程的根满足条件 z > 1 ,我们称方

程的根在单位圆以外;当 γ = 1 时,序列的生成过程变为随机游走过程,由前面可知,随机游走过程是非

平稳的,由于此时方程的根 z = 1 ,所以通常称序列含有单位根,或者说序列的生成过程为“单位根过程”。
由此可见,检验序列的非平稳性就变为检验特征方程是否有单位根,这就是单位根检验方法的由来。

5
Yt = α + βt + Yt −1 + u t (10.7)

显然,随机游走过程是一般单位根过程的一个特例。

从单位根过程的定义可以看出,含一个单位根的过程 {Yt } ,其一阶差分:

∆Yt = Yt − Yt −1 = u t

是一平稳过程,像这种经过一次差分后变为平稳的序列称为一阶单整序列(Integrated Process),

记为 {Yt } ~I(1)。有时,一个序列经一次差分后可能还是非平稳的,如果序列经过二阶差分后

才变成平稳过程,则称序列为二阶单整序列,记为 {Yt } ~I(2)。一般地,如果序列 {Yt } 经过 d

次差分后平稳,而 d-1 次差分却不平稳,那么称 {Yt } 为 d 阶单整序列,记为 {Yt } ~I(d),d

称为整形阶数。特别地,若序列 {Yt } 本身是平稳的,则称序列为零阶单整序列,记为 {Yt } ~I

(0)。

二、Dickey-Fuller 检验(DF 检验)


我们知道大多数的经济变量,如 GDP、总消费、价格水平以及货币供给 M2 等都会呈

现出强烈的趋势特征。这些具有趋势特征的经济变量,当发生经济振荡或冲击后,一般会出

现两种情形,一是受到振荡或冲击后,经济变量逐渐又回到它们的长期趋势轨迹;二是这些

经济变量没有回到原有轨迹,而呈现出随机游走的状态。若我们研究的经济变量遵从一个非

平稳过程(比如随机游走过程),当运用最小二乘法时,前面所介绍的高斯一马尔科夫定理不

再成立,一个变量对其他变量的回归可能会导致伪回归结果。同时,如果我们所研究的经济

变量(如 GDP)是非平稳的,则经济出现突发性振荡(如石油价格猛增,金融危机或政府开支

骤减等)所造成的影响不会在短期内消失,其影响将是持久性的。这也是研究单位根检验的

重要意义所在。

假设数据序列是由下列自回归模型生成的:

Yt = γYt −1 + ε t (10.8)

式中, ε t 独立同分布,期望为零,方差为 σ 2 ,我们要检验该序列是否含有单位根。检验的

零假设为: H 0 : γ = 1 ,对于无截距项的(10.8)式的回归,回归系数 γ 的 OLS 估计为:

γˆ = ∑
Yt −1Yt
∑Y 2
t −1

6
检验所用的统计量为:

γˆ − γ
t=
σˆ γˆ

在 H 0 : γ = 1 成立的条件下,t 统计量为:

γˆ − 1
t= (10.9)
σˆγˆ

但麻烦的是,Dickey、Fuller 通过研究发现,在原假设成立的情况下,该统计量不服从 t 分

布。由于 t 检验统计量不再服从传统的 t 分布,所以传统的 t 检验方法失效。可以证明,上

述统计量的极限分布存在,一般称其为 Dickey—Fuller 分布。根据这一分布所作的检验称为

DF 检验,为了区别,t 统计量的值有时也称为 τ 值。

Dickey、Fuller 得到 DF 检验的临界值,并编制了 DF 检验临界值表供查。在进行 DF 检

验时,比较 t 统计量值与 DF 检验临界值,就可在某个显著性水平上拒绝或接受原假设。在

实际应用中,可按如下检验步骤进行:

(1)根据所观察的数据序列,用 OLS 法估计一阶自回归模型:

Yt = γYt −1 + ε t

得到回归系数 γ 的 OLS 估计

γˆ = ∑
Yt −1Yt
∑Y 2
t −1

(2)提出假设: H 0 : γ = 1 ,检验用统计量为常规 t 统计量,

γˆ − γ
t=
σˆ γˆ

(3)计算在原假设成立的条件下 t 统计量值,查 DF 检验临界值表得临界值,然后将

t 统计量值与 DF 检验临界值进行比较:若 t 统计量值小于 DF 检验临界值,则拒绝原假设

H 0 : γ = 1 ,说明序列不存在单位根;若 t 统计量值大于或等于 DF 检验临界值,则接受原

假设 H 0 : γ = 1 ,说明序列存在单位根。

此外,Dickey、Fuller 研究发现,DF 检验的临界值同序列的数据生成过程以及回归模

型的类型有关,因此他们针对如下三类模型编制了临界值表,后来 Mackinnon 加以扩充,

形成了目前使用广泛的 Mackinnon 临界值表,EViews 软件中使用的就是该表。

7
模型 10.1 Yt = γYt −1 + ε t

模型 10.2 Yt = α + γYt −1 + ε t

模型 10.3 Yt = α + β t + γYt −1 + ε t

三、Augmented Dickey-Fuller 检验(ADF 检验)

上述 DF 检验存在的问题是,在检验所设定的模型时,假设随机扰动项 ε t 不存在自相关。

但大多数的经济数据序列是不能满足此项假设的,当随机扰动项存在自相关时,直接使用

DF 检验法会出现偏误。为了保证单位根检验的有效性,人们对 DF 检验进行拓展,从而形

成了扩展的 DF 检验(Augmented Dickey-Fuller Test),简称为 ADF 检验。

ADF 检验中的基本模型为如下三种类型:

模型 10.4 Yt = γYt −1 + u t

模型 10.5 Yt = α + γYt −1 + u t

模型 10.6 Yt = α + β t + γYt −1 + u t

式中, u t 为随机扰动项,它可以是一个一般的平稳过程。当 u t 存在自相关性时,ADF 检验

将模型变为如下形式:

p
模型 10.7 Yt = γYt −1 + ∑ α i ∆Yt −i +ε t
i =1

p
模型 10.8 Yt = α + γYt −1 + ∑ α i ∆Yt −i +ε t
i =1

p
模型 10.9 Yt = α + β t + γYt −1 + ∑ α i ∆Yt −i +ε t
i =1

与 DF 检验中的模型设定相比较,ADF 检验中的模型设定,引入了 ∆Yt −i ( i =


1, 2,K p ) 项,

其目的是消除自相关性。可以证明,在上述模型中检验原假设 H 0 : γ = 1 的 t 统计量的极限

分布,同 DF 检验的极限分布相同,从而可以使用相同的临界值表,这种检验称为 ADF 检验。

【例 10.1】根据《中国统计年鉴 2017》,得到我国 1978—2016 年的 GDP 序列,检验其

是否为平稳序列。在 Eviews 中录入数据,其结果如表 10.1,时间序列图见图 10.1。

表 10.1 中国 1978—2017 年度 GDP 序列 (单位:亿元)

8
年度 GDP 年度 GDP 年度 GDP
1978 3678.7 1991 22005.6 2004 161840.2
1979 4100.5 1992 27194.5 2005 187318.9
1980 4587.6 1993 35673.2 2006 219438.5
1981 4935.8 1994 48637.5 2007 270232.3
1982 5373.4 1995 61339.9 2008 319515.5
1983 6020.9 1996 71813.6 2009 349081.4
1984 7278.5 1997 79715.0 2010 413030.3
1985 9098.9 1998 85195.5 2011 489300.6
1986 10376.2 1999 90564.4 2012 540367.4
1987 12174.6 2000 100280.1 2013 595244.4
1988 15180.4 2001 110863.1 2014 643974.0
1989 17179.7 2002 121717.4 2015 689052.1
1990 18872.9 2003 137422.0 2016 744127.2

图 10.1 GDP 时间序列图

由图 10.1 可以看出,该序列可能存在趋势项,因此选择 ADF 检验的模型 3 进行检验。

估计结果如下:
�𝑡𝑡 = −5636.761 + 638.2892𝑡𝑡 + 0.9680𝐺𝐺𝐺𝐺𝑃𝑃𝑡𝑡−1
𝐺𝐺𝐺𝐺𝐺𝐺
+0.6592∆𝐺𝐺𝐺𝐺𝑃𝑃𝑡𝑡−1 − 0.2328∆𝐺𝐺𝐺𝐺𝑃𝑃𝑡𝑡−2 + 0.6024∆𝐺𝐺𝐺𝐺𝑃𝑃𝑡𝑡−3

在原零假设 H 0 : γ = 1 下,检验单位根的 t 统计量的值为:

𝛾𝛾� − 𝛾𝛾 −0.032007
t= = = −1.2152
𝜎𝜎�𝛾𝛾� 0.026339
在 1%、5%、10%三个显著性水平下,单位根检验的 Mackinnon 临界值分别为-4.243644、

-3.544284、-3.204699,显然,上述 t 检验统计量值大于相应临界值,从而不能拒绝 H 0 ,表

明我国 1978~2016 年度 GDP 序列存在单位根,是非平稳序列。

在 EViews 软件中,有专用的单位根检验命令。在序列数据窗口中点击菜单“view/Unit

Root test”,即可得到检验输出结果。

9
第三节 协 整
一、协整的概念
在给出协整(Cointegration)概念之前,先看一个货币需求分析的例子。经典的理论

分析告诉我们,一个国家或地区的货币需求量主要取决于规模变量和机会成本变量,即实际

收入、价格水平以及利率。如果以对数形式的计量经济模型将货币需求函数描述出来,其形

式为:

ln M t = β 0 + β 1 ln Pt + β 2 ln Yt + β 3 rt + u t

其中,M 为货币需求,P 为价格水平,Y 为实际收入总额,r 为利率,u 为扰动项, β i 为模

型参数。

人们关心的问题是如何估计出上述回归模型,检验模型参数是否满足条件:

β 1 = 1, β 2 > 0, β 3 < 0 ,并回答估计出来的货币需求函数是否揭示了货币需求的长期均衡关

系。如果上述货币需求函数是适当的,那么货币需求对长期均衡关系的偏离将是暂时的,扰

动项序列是平稳序列,估计出来的货币需求函数就揭示了货币需求的长期均衡关系。相反,

如果扰动项序列有随机趋势而呈现非平稳现象,那么模型中的误差会逐步积聚,使得货币需

求对长期均衡关系的偏离在长时期内不会消失。因此,上述货币需求模型是否具有实际价值,

关键在于扰动项序列是否平稳。

但面临的问题是,货币供给量、实际收入、价格水平以及利率可能是非平稳的 I(1)

序列。一般情况下,多个非平稳序列的线性组合也是非平稳序列。如果货币供给量、实际收

入、价格水平以及利率的任何线性组合都是非平稳的,那么上述货币需求模型的扰动项序列

就不可能是平稳的,从而模型并没有揭示出货币需求的长期稳定关系。反过来说,如果上述

货币需求模型描述了货币需求的长期均衡关系,那么扰动项序列必定是平稳序列,也就是说,

非平稳的货币供给量、实际收入、价格水平以及利率四变量之间存在平稳的线性组合。

上述例子揭示了这样一个事实:“包含非平稳变量的均衡系统,必然意味着这些非平稳

变量的某种组合是平稳的”。这正是协整理论的思想。

所谓协整,是指多个非平稳经济变量的某种线性组合是平稳的。例如,收入与消费,工

资与价格,政府支出与税收,出口与进口等,这些经济时间序列一般是非平稳序列,但它们

之间却往往存在长期均衡关系。下面给出协整的严格定义:

10
对于两个序列 { X t } 与 {Yt } ,如果 Yt ~ I (1), X t ~ I (1) ,且存在一组非零常数 α 1、α 2 ,

使得 α1 X t + α 2Yt ~ I (0) ,则称 X t 和 Yt 之间是协整的。

一般的,设有 k (≥ 2) 个序列 {Y1t } , {Y2t } ,L , {Ykt } , 用 Yt = (Y1t , Y2t ,L , Ykt )′ 表示由此

①每一个序列 {Y1t } , {Y2t } ,L , {Ykt } 都是 d 阶单整序列,


k 个序列构成的 k 维向量序列,如果:

即 Y jt ~ I (d ) ;②存在非零向量 α = ( a1 , a2 ,L , ak )′ ,使得 α ′Yt= a1Y1t + a2Y2t + L + ak Ykt 为

(d-b)阶单整序列,即 α ′Yt ~ I ( d − b) , 0 < b ≤ d 。则称向量序列 Yt = (Y1t , Y2t ,L , Ykt )′ 的分

量间是 d、b 阶协整的,记为 Yt ~ CI ( d , b) ,向量 α = ( a1 , a 2 , L , a k ) ′ 称为协整向量。

特别地,若 d = b = 1 ,则 Yt ~ CI (1,1) ,说明尽管各个分量序列是非平稳的一阶单整

序列,但它们的某种线性组合却是平稳的。这种(1,1)阶协整关系在经济计量分析中较为

常见。例如,假设变量 Y1t 与变量 Yit (i = 2,L , m) 之间存在(1,1)阶协整关系,协整向量

为 α = (1, − β 2 , L ,− β m )′ ,则这种协整关系可表示为:

Y1t − β 2Y2t − L − β mtYmt =


ut (10.10)

组合变量 u t 是均值为 0 的 I(0)过程。

协整概念的提出对于用非平稳变量建立计量经济模型,以及检验这些变量之间的长期均

衡关系非常重要:

(1)如果多个非平稳变量具有协整性,则这些变量可以合成一个平稳序列。这个平稳

序列就可以用来描述原变量之间的均衡关系。

(2)当且仅当多个非平稳变量之间具有协整性时,由这些变量建立的回归模型才有意

义。所以协整性检验也是区别真实回归与伪回归的有效方法。

(3)具有协整关系的非平稳变量可以用来建立误差修正模型。由于误差修正模型把长

期关系和短期动态特征结合在一个模型中,因此既可以克服传统计量经济模型忽视伪回归的

问题,又可以克服建立差分模型忽视水平变量信息的弱点。

二、协整检验
协整性的检验有两种方法,一种是基于回归残差的协整检验,这种检验也称为单一方

程的协整检验;另一种是基于回归系数完全信息的 Johansen 协整检验。这里我们仅介绍单

一方程的 EG 两步法协整检验。

11
假设只有两个变量序列,要求这两个变量的单整次数应该相同。

第一步, 用 OLS 法作协整回归。用 OLS 法对回归方程(也称为协整回归方程)

Y1t =α + β 2Y2t + L + β k Ykt + ut (10.11)

进行估计,得到残差序列 et = Y1t − (αˆ + βˆ2Y2t + L + βˆk Ykt ) 。

第二步,检验 et 的平稳性。若 et 为平稳的,则 {Y1t } , {Y2t } ,L , {Ykt } 是协整的,反之,

则不是协整的。因为若 {Y1t } , {Y2t } ,L , {Ykt } 不是协整的,则它们的任一线性组合都是非平

稳的,因此残差 et 将是非平稳。换言之,对残差序列 et 是否具有平稳性的检验,也就是对

{Y1t } , {Y2t } ,L , {Ykt } 是否存在协整的检验。


检验 et 为非平稳的假设可用两种方法。一种方法是对残差序列进行(A)DF 检验,即

对 et 进行单位根检验,其检验方法在前面已介绍,但要注意的是,用于检验协整的(A)DF

检验应该使用专用临界值。

还需要注意的是,协整检验的临界值不仅与协整回归模型中是否含有漂移项、趋势项

有关,而且还与所含非平稳变量个数有关。

当多个非平稳变量进行协整检验时,其临界值可以从麦金龙(Mackinnon)提供的协整检

验临界值表(见附录表 6)中查到。麦金龙协整检验临界值 C (α ) 的计算公式为:

C (α ) =
ϕ∞ + ϕ1T −1 + ϕ2T −2 (10.12)

其中:α 为显著性水平;T 为样本容量;附表 6 中 N 为协整回归式中所含变量个数;ϕ∞ , ϕ1 , ϕ 2

分别为表中提供的对应参数。当 N = 1 时,协整检验即转化为单变量的平稳性检验。

另一种检验方法是协整回归 DW 检验。具体做法为,用协整回归所得的残差构造 DW

统计量:

DW =
∑ (e − e t t −1 )2
(10.13)
∑e 2
t

若 et 是随机游走的,可以证明 DW 也应接近于 0。因此,只需检验: H 0 : DW = 0 是

否成立,若 H 0 成立, et 为随机游走,Xt 与 Yt 间不存在协整,反之则存在协整。Sargan 和

Bhargava 最早编制了用于检验协整的 DW 临界值表。表 10.2 是观察数为 100 时,该检验的

12
临界值。例如,当 DW=0.71 时,在 1%的显著性水平上我们能拒绝 H 0 : DW = 0 ,即拒绝

非协整假设。

表 10.2 检验 DW=0 的临界值

显著性水平% DW 临界值

1 0.511

5 0.386

10 0.322

三、误差修正模型
误差修正模型(Error Correction Model ,ECM)是一种具有特定形式的计量经济模型。

其基本思路是,若变量间存在协整关系,即表明这些变量间存在着长期稳定的关系,而这种

长期稳定的关系是在短期动态过程的不断调整下得以维持。产生这种结果的原因在于,大多

数的经济时间序列的一阶差分是平稳序列。同时,存在着某种联系方式(如线性组合)把相互

协整过程和长期稳定均衡状态结合起来。这时相互协整隐含的意义是:即使所研究的水平变

量各自都是一阶差分后平稳,受支配于长期分量,但这些变量的某些线性组合也可以是平稳

的,即所研究变量中的长期分量相互抵消,产生了一个平稳的时间序列。之所以能够这样,

是因为一种调节过程(误差修正机制)在起作用,防止了长期关系的偏差在规模或数量上的

扩大。因此,任何一组相互协整的时间序列变量都存在误差修正机制,反映短期调节行为。

建立误差修正模型一般采用两步,分别建立区分数据长期特征和短期待征的计量经济

学模型。从理论上讲,第一步,建立长期关系模型。即通过水平变量和 OLS 法估计出时间

序列变量间的关系。若估计结果形成平稳的残差序列时,那么这些变量间就存在相互协整的

关系.长期关系模型的变量选择是合理的,回归系数具有经济意义。第二步,建立短期动态

关系.即误差修正方程。将长期关系模型中各变量以一阶差分形式重新加以构造,并将长期

关系模型所产生的残差序列作为解释变量引入,在一个从一般到特殊的检验过程中,对短期

动态关系进行逐项检验,不显著的项逐渐被剔除,直到最适当的表示方法被找到为止。值得

注意的是,作为解释变量引入的长期关系模型的残差,代表着在取得长期均衡的过程中各时

点上出现“偏误”的程度,使得第二步可以对这种偏误的短期调整或误差修正机制加以估计。

下面以建立货币需求函数为例,说明误差修正模型的建模过程。

货币需求函数通常在局部调整的结构下加以设定。在这种模型中,当前实际货币需求

13
余额是关于实际货币需求余额滞后值、实际国民收入和机会成本等变量的回归。那么这种依

据交易方程设定的模型可作为长期关系模型,其一般形式为:
M M
( )t =β 0 + β1Yt + β 2π t + β3 ( )t −1 + ε t (10.14)
P P
其中:M 为相应的名义货币余额,P 为物价指数(通常用 GDP 的平减指数表示),Y 为实际的

国内生产总值(GDP), π 为季度通货膨胀率(根据综合物价指数衡量)。

第二阶段误差修正方程的一般形式是:

M l l l
M
∆( )t = α 0 + ∑ βi ∆Yt −i + ∑ γ i ∆π t −i + ∑ σ i ∆( )t −i −1 + λ ECt −1 + ε t (10.15)
P=i 0=i 0 =i 0 P

式中,EC 为长期关系模型中的残差。

在具体建模中,首先要对长期关系模型的设定是否合理进行单位根检验,以保证 EC 为

平稳序列。其次,对短期动态关系中各变量的滞后项,进行从一般到特殊的检验,在这个检

验过程中,不显著的滞后项逐渐被剔除,直到找出最佳形式为止。通常滞后期在 l=0,1,2,3

中进行试验。

第四节 格兰杰因果检验 ④
在经济学分析中,常常要对经济变量之间的因果关系做出判断。例如,在制定货币政策

时,就需要对可供选择的不同的政策方案的有效性做出评价,进而判明货币变量与名义收入、

通货膨胀和利率等变量之间的因果关系,是政策有效性评价中的一个重要组成部分。2003

年诺贝尔经济学奖获得者格兰杰(Granger, 1969)从计量经济学的观点提出了著名的因果关

系检验,用于分析时间序列经济变量之间的因果关系。

一、格兰杰因果关系
格兰杰因果关系检验的思想很直观,对于时间序列变量 X 和 Y ,如果 X 是 Y 变化的原

因,则 X 的变化应该发生在 Y 变化之前,而且 X 的过去值应该有助于预测 Y 的未来值,但

Y 的过去值不应该能够预测 X 的未来值。具体说,作公式(10.16)Y 关于 Y 的滞后变量的回

归,这是有约束回归

s
=Yt ∑α Y
i =1
i t −i + u1t (10.16)

在式(10.16)中添加 X 的滞后变量作为解释变量,所得的公式(10.17)是无约束回归。


这部分内容供本科教学选择使用

14
s m
Yt =∑ αiYt −i + ∑ β i X t −i + u2 t (10.17)
=i 1 =i 1

如果 X 是 Y 变化的原因,式(10.17)的模型与式(10.6)相比,应该显著增加回归模型的解

释能力。如果存在这样一种关系,称 X 是 Y 的格兰杰原因。反之,如果添加 X 的滞后变量

作为解释变量后,没有显著增加回归模型的解释能力,称 X 不是 Y 的格兰杰原因。

二、格兰杰因果检验的实施
根据格兰杰因果关系的意义, X 对 Y 是否存在格兰杰因果关系的检验,可通过检验以

Y 为被解释变量的方程中是否可以把 X 的全部滞后变量剔除掉而完成。对于两个平稳时间

序列 X t , Yt ,考虑分别作式(10.16)和式(10.17)的回归。如有必要,常数项,趋势项,季节虚

拟变量等都可以包括在上式中。检验 X 对 Y 存在格兰杰因果关系的零假设是

H 0 : β=
1 L= β m= 0 ,即变量 X 不是变量 Y 的格兰杰原因。显然,如果式(10.17)中 X 的

滞后变量的回归参数的估计值全部不存在显著性,则上述假设不能被拒绝。换句话说,如果

X 的任何一个滞后变量的回归参数的估计值存在显著性,则结论应是 X 对 Y 存在格兰杰

因果关系。分别计算有约束模型式(10.16)和无约束模型式(10.17)回归的残差平方和 SSRR 与

SSRU ,上述检验可用 F 统计量完成:

( SSRR − SSRU ) / m
F= (10.18)
SSRU /[n − ( s + m )]

其中, m 为约束条件的个数, s + m 是无约束回归(10.17)的回归系数个数,n 为样本

容量。

在零假设成立的条件下,检验统计量 F ~ F [m, n − ( s + m )] 。在显著性水平 α 下,如

果 F > Fα [m, n − ( s + m )] ,则拒绝零假设,即变量 X 是变量 Y 的格兰杰原因。

三、格兰杰因果检验的注意事项
1. 关于信息集的设定

格兰杰因果检验是针对特定的信息集,如果做类似式(10.17)的回归,很容易出现遗

漏重要解释变量的情况。格兰杰指出,信息集中遗漏重要解释变量很可能导致虚假的因果性

推断,如果适当地拓展信息集合,原来的因果关系很可能会消失。

2. 关于非平稳变量的问题

15
在原始的格兰杰因果定义中,并没有规定时间序列必须是平稳的。但如果变量是非平稳

的,那么式(10.18)中的统计量就不再服从 F 分布,如果继续使用 F 分布做统计推断,可

能会得到不可靠的结论。因此,在做格兰杰因果检验之前,需要对时间序列的平稳性进行检

验。

3. 关于滞后期数问题

格兰杰因果检验对于式(10.16)与式(10.17)滞后期数的选择十分敏感,不同的滞后

期可能会得到完全不同的检验结果。因此,一般而言,常进行不同滞后期长度的检验,以检

验模型中随机扰动项为白噪声过程的滞后期长度来选取滞后期;在实际应用中,也可以通过

AIC、BIC 等模型选择来确定滞后期数。

4. 经济学含义
格兰杰检验方法主要是检验一个经济变量的历史信息是否可用来预测另一个经济变量
的未来变动,该检验的重要价值在于预测。也就是说格兰杰因果关系不等于实际因果关系,
实际因果关系还需借助经济理论进行进一步的分析;但统计意义上的格兰杰因果关系也是很
有意义的,对于经济预测将起很大的作用。

在 Eviews 中,格兰杰因果检验的具体操作为,选择并打开要进行格兰杰因果检验的两

个序列,点菜单 View ,选择 Granger Causality,并在对话框中输入滞后阶数。点击确认后

即得到格兰杰检验的结果,如图 10.2 所示。

需要注意的是,图 10.3 中包含的是两次格兰杰因果检验的结果,对应的原假设分别为:

a. H0 : Y 不是 X 的格兰杰原因;b. H0 : X 不是 Y 的格兰杰原因。

图 10.2 格兰杰因果检验结果

第五节 案例分析
在许多关于国际汇率问题的研究中,研究者都发现:
(1)汇率一般都存在单位根;
(2)

不同货币的汇率之间往往存在联系。在本章的案例分析中,使用日元兑美元与韩元兑美元的

汇率作为例子,来验证以上的两个结论,分析两者之间是否存在长期均衡关系。

16
本案例使用的汇率数据来自 FRED Economic Data,选取了从 2010 年 7 月 1 日至 2011

年 3 月 31 日的日元兑美元(jpus)与韩元兑美元(kous)的当日午间买入汇率,两个时间

序列各 187 个观测值(具体数据见表 10.3)。

表 10.3 日元兑美元(jpus)与韩元兑美元(kous)序列

日期 jpus kous 日期 jpus kous 日期 jpus kous


10.07.01 87.42 1227.00 10.09.30 83.53 1140.10 11.01.04 81.96 1124.20
10.07.02 87.69 1228.50 10.10.01 83.30 1130.25 11.01.05 83.22 1127.30
10.07.06 87.55 1222.00 10.10.04 83.33 1122.25 11.01.06 83.15 1121.00
10.07.07 87.16 1221.55 10.10.05 83.17 1129.85 11.01.07 83.04 1120.20
10.07.08 88.44 1209.40 10.10.06 82.80 1117.40 11.01.10 82.78 1128.10
10.07.09 88.48 1197.50 10.10.07 82.35 1114.00 11.01.11 83.36 1124.00
10.07.12 88.53 1203.35 10.10.08 81.86 1120.70 11.01.12 83.29 1111.60
10.07.13 88.24 1212.50 10.10.12 81.74 1130.15 11.01.13 82.72 1111.20
10.07.14 88.59 1201.55 10.10.13 81.81 1119.00 11.01.14 82.99 1114.55
10.07.15 87.41 1201.50 10.10.14 81.44 1110.40 11.01.18 82.66 1111.00
10.07.16 86.40 1202.50 10.10.15 81.32 1109.60 11.01.19 82.03 1113.20
10.07.19 86.77 1216.00 10.10.18 81.16 1115.00 11.01.20 83.02 1124.10
10.07.20 87.22 1206.40 10.10.19 81.60 1126.70 11.01.21 82.63 1118.00
10.07.21 87.30 1203.50 10.10.20 81.14 1124.90 11.01.24 82.44 1118.00
10.07.22 87.00 1202.95 10.10.21 81.16 1128.40 11.01.25 82.35 1121.60
10.07.23 87.31 1198.50 10.10.22 81.48 1125.60 11.01.26 82.27 1116.00
10.07.26 87.20 1191.00 10.10.25 80.61 1115.60 11.01.27 83.03 1114.30
10.07.27 87.88 1181.95 10.10.26 81.28 1122.00 11.01.28 82.03 1115.60
10.07.28 87.62 1185.00 10.10.27 81.55 1130.00 11.01.31 81.97 1119.10
10.07.29 86.87 1185.35 10.10.28 80.99 1123.00 11.02.01 81.48 1113.60
10.07.30 86.43 1182.00 10.10.29 80.48 1124.00 11.02.02 81.82 1113.60
10.08.02 86.42 1172.50 10.11.01 80.66 1116.73 11.02.03 81.48 1113.60
10.08.03 85.88 1167.20 10.11.02 80.80 1111.00 11.02.04 81.99 1113.60
10.08.04 86.26 1167.25 10.11.03 81.41 1109.80 11.02.07 82.40 1103.60
10.08.05 85.83 1166.00 10.11.04 80.61 1106.53 11.02.08 81.92 1100.90
10.08.06 85.25 1161.00 10.11.05 81.35 1107.70 11.02.09 82.47 1107.40
10.08.09 85.88 1160.00 10.11.08 81.14 1114.00 11.02.10 83.11 1120.90
10.08.10 85.88 1168.60 10.11.09 81.15 1111.40 11.02.11 83.52 1126.30
10.08.11 85.36 1182.00 10.11.10 82.53 1109.60 11.02.14 83.32 1125.90
10.08.12 85.83 1185.90 10.11.12 82.44 1127.20 11.02.15 83.79 1121.30
10.08.13 86.20 1183.70 10.11.15 82.90 1134.70 11.02.16 83.73 1115.30

17
10.08.16 85.33 1186.90 10.11.16 83.41 1129.80 11.02.17 83.25 1114.50
10.08.17 85.51 1176.00 10.11.17 83.15 1143.75 11.02.18 83.22 1111.00
10.08.18 85.31 1174.00 10.11.18 83.64 1129.90 11.02.22 82.94 1125.35
10.08.19 85.27 1172.15 10.11.19 83.49 1131.15 11.02.23 82.39 1125.20
10.08.20 85.63 1183.20 10.11.22 83.46 1126.00 11.02.24 81.67 1130.55
10.08.23 85.16 1181.60 10.11.23 82.86 1162.00 11.02.25 81.76 1125.00
10.08.24 84.16 1191.00 10.11.24 83.38 1146.00 11.02.28 81.94 1123.70
10.08.25 84.56 1196.15 10.11.26 84.08 1153.95 11.03.01 81.86 1123.50
10.08.26 84.61 1190.10 10.11.29 84.34 1164.05 11.03.02 81.62 1121.00
10.08.27 85.10 1195.10 10.11.30 83.56 1157.20 11.03.03 82.41 1115.40
10.08.30 84.67 1191.00 10.12.01 84.00 1149.00 11.03.04 82.35 1117.50
10.08.31 84.10 1198.00 10.12.02 83.53 1148.00 11.03.07 82.12 1115.35
10.09.01 84.48 1184.00 10.12.03 82.73 1136.50 11.03.08 82.69 1115.00
10.09.02 84.15 1178.00 10.12.06 82.70 1136.70 11.03.09 82.78 1114.45
10.09.03 84.45 1173.00 10.12.07 83.04 1130.00 11.03.10 82.98 1123.70
10.09.07 83.75 1177.00 10.12.08 84.16 1142.50 11.03.11 81.77 1126.00
10.09.08 83.85 1171.50 10.12.09 83.85 1140.00 11.03.14 81.65 1127.00
10.09.09 83.83 1166.75 10.12.10 83.87 1143.00 11.03.15 80.82 1135.60
10.09.10 84.13 1164.85 10.12.13 83.57 1144.90 11.03.16 80.17 1132.60
10.09.13 83.53 1159.00 10.12.14 83.52 1139.00 11.03.17 78.74 1133.10
10.09.14 83.05 1159.50 10.12.15 84.04 1154.95 11.03.18 81.14 1126.00
10.09.15 85.63 1158.00 10.12.16 84.23 1155.00 11.03.21 81.11 1121.50
10.09.16 85.72 1161.00 10.12.17 84.15 1155.05 11.03.22 81.00 1120.60
10.09.17 85.77 1160.00 10.12.20 83.72 1154.10 11.03.23 80.94 1124.10
10.09.20 85.74 1160.50 10.12.21 83.76 1155.15 11.03.24 80.82 1118.60
10.09.21 85.36 1160.00 10.12.22 83.56 1153.90 11.03.25 81.12 1110.70
10.09.22 84.37 1150.00 10.12.23 82.97 1151.90 11.03.28 81.67 1111.50
10.09.23 84.32 1150.65 10.12.27 82.91 1148.90 11.03.29 82.38 1112.20
10.09.24 84.24 1154.20 10.12.28 82.21 1143.00 11.03.30 82.98 1100.50
10.09.27 84.17 1146.00 10.12.29 81.90 1143.00 11.03.31 82.76 1097.25
10.09.28 83.82 1145.50 10.12.30 81.67 1130.60
10.09.29 83.61 1139.00 11.01.03 81.56 1124.30

数据来源:FRED Economic Data.

在 EViews 中建立文档,录入日元兑美元(jpus)与韩元兑美元(kous)序列的数据。

依照惯例,我们将汇率数据取自然对数,其操作如下:点击 Object 菜单,选择 Generate Series…,

并输入 lnjpus=log(jpus)或 lnkous=log(kous),分别生成 lnjpus 和 lnkous 序列。双击打开序列,

18
点击 View / Graph…,可以直观地看到两序列关于时间的变化(图 10.3):

图 10.3 lnjpus 和 lnkous 序列关于时间的变化

根据协整关系的检验方法,首先回答 lnjpus 与 lnkous 序列是否为非平稳序列,即考察

其单整阶数。首先,对 lnjpus 序列进行 DF 检验,在 Eviews 中的操作步骤如下:双击打开

lnjpus 序列,并点击 View 打开下拉菜单,选择 Unit Root Test…,随后出现对话窗口,在对

话窗口的“Test for unit root in”中选择“Level”,表示对原序列进行单位根检验;在“Include

in test equation”中选择带截距项(intercept);在滞后阶数“Lag length”中选择 User specified,

并在其后窗口中输入 0,如图 10.4 所示。选择 OK 得到 DF 检验的结果,如图 10.5。

图 10.4 DF 检验选项设定

图 10.5 lnjpus 序列的 DF 检验结果


从检验结果看,在 1%、5%、10%三个显著性水平下,单位根检验的 Mackinnon 临界

值分别为-3.4656、-2.8769、-2.5751, t 检验统计量值-2.392625 大于相应临界值,从而不能

拒绝 H 0 ,表明 lnjpus 序列存在单位根,是非平稳序列。

当然,如果 lnjpus 序列的随机扰动项存在自相关性,以上基于 DF 检验的结果可能是不

准确的。如果发生这种情况,需要使用 ADF 检验。ADF 检验的操作如下:在图 10.4 的窗口

19
中,其他选项保持不变,滞后阶数 Lag length 选择 Automatic selection,并在下拉菜单中选

择 Schwarz Info Criterion,即用 SIC 这种方法自动选择 ADF 中的修项的阶数,如图 10.6。选

择 OK 即得到 ADF 检验的结果,发现与上述 DF 检验的结果相同。

图 10.6 ADF 检验选项

由此知道 lnjpus 序列是非平稳的。为了确定序列的单整阶数,对 lnjpus 的一阶差分序列

进行单位根检验,即在单位根检验窗口的“Test for unit root in”中选择“1st difference”,其

他选项保持不变,结果见图 10.7。

从检验结果看,在 1%、5%、10%三个显著性水平下,单位根检验的 Mackinnon 临界

值分别为-3.4658、-2.8770、-2.5751, t 检验统计量值为-15.10486,小于相应临界值,从而

拒绝 H 0 ,表明 lnjpus 的差分序列不存在单位根,是平稳序列。即 lnjpus 序列是一阶单整的,

lnjpus~I(1)

图 10.7 lnjpus 一阶差分序列的 ADF 检验结果

对 lnkous 进行同样的操作,得到 lnkous 序列也是一阶单整的。这与文献中大部分关于

汇率的研究结果相同。

为了分析 lnjpus 和 lnkous 序列之间是否存在协整关系,使用 EG 两步法,先作两变量之

间的回归,然后检验回归残差的平稳性。

第一步,以 lnkous 为被解释变量,以 lnjpus 为解释变量,用 OLS 方法估计回归模型,

结果如图 10.8。

20
图 10.8 lnkous 对截距项和 lnjpus 的回归

估计的回归模型为:

ln koust = 2.710116 + 0.979048 ln jpust + et (10.19)

第二步,对上述回归的残差进行平稳性检验。在回归结果窗口中,点击 Proc -> Make

Residual Series,将回归的残差命名为 resid_eg,并对此序列进行无截距项、无趋势项的 ADF

“Include in estimate equation”选择“None”),得到的单位


检验(即在单位根检验的窗口中,

根检验的结果见图 10.9。

图 10.9 残差序列的平稳性检验估计结果

图 10.9 中的 t 统计量为-4.499077,根据式(10.12)与本书附录表 6,在 5%的显著性水平

下,EG 两步法检验的临界值为-3.3377-5.967/187-8.98/187^2= -3.3699,大于 t 统计量,从而

拒绝 H 0 ,表明残差序列不存在单位根,是平稳序列,说明日元 lnjpus 和韩元 lnkous 之间存

在协整关系。

两序列之间存在协整,表明两者之间有长期均衡关系,但从短期来看,可能会出现失

衡。为了增强模型的精度,可以把协整回归(10.19)式中的误差项 et 看作均衡误差,通过

建立误差修正模型把韩币兑美元汇率的短期行为与长期变化联系起来。误差修正模型的结构

如下:

21
∆ ln koust = α + β ∆ ln jpust + γet −1 + εt (10.20)

其中 et −1 即是生成的残差序列 resid_eg。要估计 ECM,我们首先要生成 lnkous 与 lnjpus

的一阶差分序列。点击 Genr,并输入“dlnkous = lnkous - lnkous(-1) ”和“dlnjpus = lnjpus -

lnjpus(-1) ”。以 dlnkous 为被解释变量,dlnjpus 和 resid_eg(-1)为解释变量,估计回归式,结

果如图 10.10。

图 10.10 回归模型(10.20)估计结果

最终得到误差修正模型的估计结果:

� t = −0.000572 + 0.02550∆lnjpust − 0.1196et−1


∆lnkous

t= (-1.3143) (0.3822) (-3.7651)

从回归结果可以看到,误差修正项前的系数的估计值为-0.1196,且显著。

上述结果表明,日币与韩币兑美元的汇率之间存在协整关系,韩币兑美元汇率的变化

一方面取决于日币兑美元汇率的变化,另一方面还取决于上一期韩币兑美元汇率对均衡水平

的偏离。当上一期的汇率偏离两者的长期均衡关系时,误差修正机制使汇率会更倾向于回到

它们的长期均衡,误差项 et −1 估计的系数-0.1196 体现了对偏离的修正,上一期偏离越远,本

期修正的量就越大,即系统存在误差修正机制。

本章小结
1. 大多数经济时间序列是非平稳的,如果直接将非平稳时间序列当作平稳时间序列来

进行回归分析,则可能造成“伪回归”,即变量间本来不存在相依关系,但回归结果却得出

存在相依关系的错误结论。经济学家研究发现,造成“伪回归”的根本原因在于时序序列变

22
量的非平稳性。

2. 时间序列的平稳性,是指时间序列的统计规律不会随着时间的推移而发生变化。严

格平稳是指随机过程{Yt}的联合分布函数与时间的位移无关。弱平稳是指随机过程{ Yt }的

均值、方差和协方差不随时间推移而变化。

3. 单位根过程是最常见的非平稳过程。如果非平稳序列 {Yt } 经过 d 次差分后平稳,而

d-1 次差分却不平稳,那么称 {Yt } 为 d 阶单整序列,记为 {Yt } ~I(d)


,d 称为整形阶数。

4. 时间序列平稳性的检验方法主要有两类:自相关函数检验法和单位根检验法。本书

只介绍最常用的单位根检验法——DF 检验法和 ADF 检验法。

5. 协整是指多个非平稳经济变量的某种线性组合是平稳的。协整分析对于检验变量之

间的长期均衡关系非常重要,而且也是区别真实回归与伪回归的有效方法。

6. 任何一组相互协整的时间序列变量都存在误差修正机制。误差修正模型把长期关系

和短期动态特征结合在一个模型中,既可以克服传统计量经济模型忽视伪回归的问题,又可

以克服建立差分模型忽视水平变量信息的弱点。

7. 格兰杰(Granger)检验方法主要是检验一个经济变量的历史信息是否可用来预测另

一个经济变量的未来变动,该检验的重要价值在于预测。格兰杰因果关系不等于实际因果关

系,实际因果关系还需借助经济理论进行进一步的分析;但统计意义上的格兰杰因果关系也

是很有意义的,对于经济预测将起很大的作用。

表 10.4 主要公式表

严格平稳 FYt1 ,Yt2 ,L ,Ytn ( y1 , L yn ) = FYt1 + h ,L ,Ytn + h ( y1 , L , yn )


时间序

E(Yt)=μ, Var (Yt ) = σ


列的平 2

稳性 弱平稳
Cov(Yt , Ys ) =Cov(Yt + h , Ys + h ) =r (t − s, 0) =rt − s t ≠ s

随机游走 Yt = Yt −1 + ε t
单位根

过程
一般的单位根过程 Yt = α + βt + Yt −1 + ut { u t }为一般平稳过程。

DF 检 模型 1 Yt = γYt −1 + ε t

23

模型 2 Yt = α + γYt −1 + ε t

模型 3 Yt = α + β t + γYt −1 + ε t

p
模型 1 Yt = γYt −1 + ∑ α i ∆Yt −i +ε t
i =1

ADF p
模型 2 Yt = α + γYt −1 + ∑ α i ∆Yt −i +ε t
检验 i =1

p
模型 3 Yt = α + β t + γYt −1 + ∑ α i ∆Yt −i +ε t
i =1

协整 y t ~ I (1), xt ~ I (1) 如果存在一组非零常数 α 1、α 2 ,使得 α 1 xt + α 2 y t ~ I (0)

p q m
Yt =∑ α iYt −i + ∑ β j X t − j +
= ut Yt ∑α Y i t −i + vt
格兰杰 =i 1 =j 1 i =1

因果检 Yt ~ I (0), xt ~ I (0) ( SSRR − SSRU ) / q


F= ,如果 F > Fα (q, T − ( p + q )) ,
验 SSRU / (T − ( p + q ))

则认为变量 X 是变量 Y 的格兰杰原因。

思考题
10.1 对时间序列进行分析,为什么提出平稳性问题?

10.2 简述模型出现“伪回归”的含义。

10.3 什么是非平稳?为什么随机游走过程是非平稳的?

10.4 试述单位根检验的基本步骤。

10.5 怎样判断变量之间是否存在协整关系。

10.6 什么是误差修正机制?误差修正模型的特点是什么?

10.7 什么是格兰杰因果关系?格兰杰因果关系检验的基本思想是什么?

练习题
10.1 表 10.5 是某国的季度宏观经济数据。GDP 为国内生产总值, PDI 为个人可支配

收入, PCE 为个人消费支出。

24
表 10.5 1990 第 1 季度--2017 第 3 季度某国宏观经济季度数据

日期 GDP PDI PCE 日期 GDP PDI PCE

1990Q1 8947.129 6376.468 5658.687 2004Q1 13606.509 9904.677 9096.415

1990Q2 8981.727 6414.640 5676.423 2004Q2 13706.247 10002.264 9155.468

1990Q3 8983.945 6417.037 5699.300 2004Q3 13830.828 10054.941 9243.002

1990Q4 8907.363 6366.168 5656.174 2004Q4 13950.376 10180.633 9337.837

1991Q1 8865.564 6379.730 5636.708 2005Q1 14099.081 10082.492 9409.222

1991Q2 8934.366 6423.863 5684.016 2005Q2 14172.695 10162.278 9511.451

1991Q3 8977.252 6447.210 5711.641 2005Q3 14291.757 10214.447 9585.233

1991Q4 9016.444 6502.332 5710.052 2005Q4 14373.438 10298.739 9621.339

1992Q1 9122.950 6641.922 5817.316 2006Q1 14546.119 10533.962 9729.225

1992Q2 9223.545 6711.357 5857.169 2006Q2 14589.585 10549.798 9781.025

1992Q3 9313.208 6740.671 5920.598 2006Q3 14602.633 10579.888 9838.106

1992Q4 9406.528 6763.811 5991.057 2006Q4 14716.930 10718.365 9938.409

1993Q1 9424.065 6801.742 6013.833 2007Q1 14726.022 10788.663 9990.657

1993Q2 9480.106 6813.697 6067.801 2007Q2 14838.664 10809.538 10024.604

1993Q3 9526.337 6817.701 6134.756 2007Q3 14938.467 10837.871 10069.158

1993Q4 9653.509 6862.515 6189.096 2007Q4 14991.784 10846.991 10081.798

1994Q1 9748.156 6910.602 6260.054 2008Q1 14889.450 10925.264 10060.966

1994Q2 9881.384 6983.806 6308.615 2008Q2 14963.357 11155.661 10077.940

1994Q3 9939.655 7025.314 6357.469 2008Q3 14891.643 10899.245 10005.097

1994Q4 10052.518 7122.963 6425.929 2008Q4 14576.985 10969.231 9884.724

1995Q1 10086.878 7190.901 6442.942 2009Q1 14375.018 10948.502 9850.832

1995Q2 10122.122 7207.255 6500.691 2009Q2 14355.558 11026.432 9806.377

1995Q3 10208.772 7271.651 6560.332 2009Q3 14402.477 10905.429 9865.864

1995Q4 10281.246 7313.742 6606.361 2009Q4 14541.901 10891.014 9864.805

1996Q1 10348.691 7383.717 6667.696 2010Q1 14604.845 10902.018 9917.689

1996Q2 10529.379 7454.301 6740.080 2010Q2 14745.933 11043.804 9998.389

1996Q3 10626.778 7513.727 6780.698 2010Q3 14845.458 11098.757 10063.083

1996Q4 10739.057 7552.887 6833.958 2010Q4 14939.001 11176.156 10166.127

1997Q1 10820.908 7628.691 6906.064 2011Q1 14881.301 11312.927 10217.123

1997Q2 10984.150 7693.917 6937.418 2011Q2 14989.555 11295.233 10237.676

1997Q3 11124.013 7785.460 7056.142 2011Q3 15021.149 11355.094 10282.234

1997Q4 11210.329 7897.061 7139.909 2011Q4 15190.255 11362.033 10316.777

1998Q1 11321.246 8065.328 7213.553 2012Q1 15291.035 11547.786 10379.022

1998Q2 11431.046 8178.007 7340.989 2012Q2 15362.415 11636.654 10396.630

1998Q3 11580.587 8261.362 7437.539 2012Q3 15380.802 11630.759 10424.119

25
1998Q4 11770.686 8328.480 7546.837 2012Q4 15384.254 11936.122 10453.204

1999Q1 11864.675 8403.080 7618.691 2013Q1 15491.878 11437.747 10502.300

1999Q2 11962.524 8423.895 7731.528 2013Q2 15521.559 11504.416 10523.929

1999Q3 12113.075 8480.303 7819.273 2013Q3 15641.336 11571.732 10573.135

1999Q4 12323.336 8605.081 7934.144 2013Q4 15793.928 11596.613 10662.222

2000Q1 12359.095 8774.569 8054.859 2014Q1 15757.570 11720.446 10713.384

2000Q2 12592.530 8865.621 8132.194 2014Q2 15935.825 11871.513 10805.115

2000Q3 12607.676 8969.157 8211.276 2014Q3 16139.513 11995.295 10909.862

2000Q4 12679.338 8999.501 8284.400 2014Q4 16220.222 12169.576 11045.225

2001Q1 12643.283 9076.223 8319.403 2015Q1 16349.970 12297.642 11145.286

2001Q2 12710.303 9068.234 8340.761 2015Q2 16460.889 12414.199 11227.947

2001Q3 12670.106 9282.636 8371.247 2015Q3 16527.587 12470.797 11304.567

2001Q4 12705.269 9167.785 8499.132 2015Q4 16547.619 12561.187 11379.273

2002Q1 12822.258 9390.812 8524.579 2016Q1 16571.573 12567.688 11430.549

2002Q2 12893.002 9438.448 8568.126 2016Q2 16663.516 12627.206 11537.728

2002Q3 12955.769 9426.253 8628.043 2016Q3 16778.148 12649.232 11618.098

2002Q4 12964.016 9471.610 8674.353 2016Q4 16851.420 12590.849 11702.120

2003Q1 13031.169 9498.000 8712.527 2017Q1 16903.240 12680.434 11758.040

2003Q2 13152.089 9635.544 8809.507 2017Q2 17031.085 12765.604 11852.958

2003Q3 13372.357 9793.433 8939.387 2017Q3 17163.894 12787.701 11916.576

2003Q4 13528.710 9833.026 9008.815

(1) 画出 PDI 和 PCE 的时序图,并直观地考察这两个时间序列是否是平稳的。

(2) 应用单位根检验分别检验两个时间序列是否是平稳的。

10.2 表 10.6 是 1980 年至 2016 年中国固定资产投资(亿元)和进出口总额(亿元)的年度数

据。根据该数据,判断固定资产投资和进出口总额序列是否平稳。

表 10.6 1980-2016 年中国固定资产投资和进出口总额 (单位:亿元人民币)

时间 固定资产投资 Y 进出口总额 X 时间 固定资产投资 Y 进出口总额 X

1980 年 910.9 570 1999 年 29854.7 29896.23

1981 年 961 735.3 2000 年 32917.7 39273.25

1982 年 1230.4 771.3 2001 年 37213.49 42183.62

1983 年 1430.1 860.1 2002 年 43499.91 51378.15

1984 年 1832.9 1201 2003 年 55566.61 70483.45

1985 年 2543.2 2066.71 2004 年 70477.43 95539.09

1986 年 3120.6 2580.4 2005 年 88773.61 116921.77

1987 年 3791.7 3084.2 2006 年 109998.16 140974.74

26
1988 年 4753.8 3821.8 2007 年 137323.94 166924.07

1989 年 4410.4 4155.9 2008 年 172828.4 179921.47

1990 年 4517 5560.12 2009 年 224598.77 150648.06

1991 年 5594.5 7225.75 2010 年 251683.77 201722.34

1992 年 8080.1 9119.62 2011 年 311485.13 236401.95

1993 年 13072.3 11271.02 2012 年 374694.74 244160.21

1994 年 17042.1 20381.9 2013 年 446294.09 258168.89

1995 年 20019.3 23499.94 2014 年 512020.65 264241.77

1996 年 22913.5 24133.86 2015 年 561999.83 245502.93

1997 年 24941.1 26967.24 2016 年 606465.66 243386.46

1998 年 28406.2 26849.68

10.3 根据习题 10.1 的数据,回答如下问题:

(1)如果 PDI 和 PCE 时间序列不是平稳的,而如果你以 PDI 来回归 PCE,那么回归

的结果会是虚假的吗?为什么?

(2)取 PDI 和 PCE 两个时间序列的一阶差分,确定一阶差分时间序列是否是平稳的。

10.4 根据第二章练习题 2.2 表 2.8 的数据,检验浙江省一般预算总收入与地区生产总

值数据是否平稳,并确定其单整阶数。

10.5 表 10.7 是 1978-2008 年中国财政收入 Y 和税收 X 的数据,判断 lnY 和 lnX 的平

稳性,检验它们之间是否存在协整关系,如果协整,建立相应的协整模型。

表 10.7 1978-2008 年中国财政收入 Y 和税收 X 的数据 (单位:亿元)


年份 国家财政决算 国家财政决算收 年份 国家财政决算 国家财政决算收
收入 入中各项税收 收入 入中各项税收
1978 1132.26 519.28 1994 5218.1 5126.88
1979 1146.4 537.82 1995 6242.2 6038.04
1980 1159.93 571.7 1996 7407.99 6909.82
1981 1175.8 629.89 1997 8651.14 8234.04
1982 1212.3 700.02 1998 9875.95 9262.8
1983 1367 775.59 1999 11444.08 10682.58
1984 1642.9 947.35 2000 13395.23 12581.51
1985 2004.82 2040.79 2001 16386.04 15301.38
1986 2122 2090.73 2002 18903.64 17636.45
1987 2199.4 2140.36 2003 21715.25 20017.31
1988 2357.2 2390.47 2004 26396.47 24165.68
1989 2664.9 2727.4 2005 31649.29 28778.54
1990 2937.1 2821.86 2006 38760.2 34804.35

27
1991 3149.48 2990.17 2007 51321.78 45621.97
1992 3483.37 3296.91 2008 61330.35 54223.79
1993 4348.95 4255.3

数据来源:中国统计年鉴 2008

10.6 表 10.8 是建立某地区消费模型所需的实际人均年消费支出 Y 和人均年收人 X 数据:

表 10.8 某地区实际人均年消费支出 C 和人均年收入 Y (单位:元)

人均消费 人均年收 人均消费支 人均年收人


年份 年份
支出 Y 人X 出Y X
1950 92.28 151.20 1971 151.20 274.08
1951 97.92 165.60 1972 163.20 286.68
1952 105.00 182.40 1973 165.00 288.00
1953 118.08 198.48 1974 170.52 293.52
1954 121.92 203.64 1975 170.16 301.92
1955 132.96 211.68 1976 177.36 313.80
1956 123.84 206.28 1977 181.56 330.12
1957 137.88 255.48 1978 200.40 361.44
1958 138.00 226.20 1979 219.60 398.76
1959 145.08 236.88 1980 260.76 491.76
1960 143.04 245.40 1981 271.08 501.00
1961 155.40 240.00 1982 290.28 529.20
1962 144.24 234.84 1983 318.48 522.72
1963 132.72 232.68 1984 365.40 671.16
1964 136.20 238.56 1985 418.92 811.80
1965 141.12 239.88 1986 517.56 988.44
1966 132.84 239.04 1987 577.92 1094.64
1967 139.20 237.48 1988 655.76 1231.80
1968 140.76 239.40 1989 756.24 1374.60
1969 133.56 248.04 1990 833.76 1522.20
1970 144.60 261.48

(1)分别取对数得到 lnY 和 lnX ,对 lnY 和 lnX 进行平稳性检验。

(2)用 EG 两步检验法对 lnY 和 lnX 进行协整性检验,建立误差修正模型,并分析该

模型的经济意义。
10.7 联系自己所学的专业选择一个实际问题,建立时间序列计量模型,并自己去收集
样本数据,用本章的方法估计和检验这个模型,你如何评价自己所做的这项研究?

28
第十一章 联立方程组模型 1

引子:

是先有鸡,还是先有蛋 ?
货币供应量及通货膨胀的关系倍受经济学家的关注。货币数量论认为:货币量增长是

通货膨胀的主要原因。正如经济学家米尔顿.弗里德曼曾指出的:
“通货膨胀永远而且处处是

一种货币现象。”(曼昆著《经济学原理》246 页)

也有经济学家认为:
“人们持有货币是因为货币是交换媒介。与债券或股票这类其他资

产不同,人们可以用货币购买他们购物单上的物品与劳务。他们为这种目的选择持有多少货

币取决于这些物品与劳务的价格。价格越高,正常交易要求的货币越多。”
“这就是说,物价

水平上升(货币价值下降)增加了货币需求量。
”(曼昆著《经济学原理》245 页)

对货币供应量、经济增长及通货膨胀的关系也一直是各国政府和货币当局争论的问题。

在出现通货膨胀时,政府强调是货币当局的货币供应量过多,使得总需求中的投资和消费过

快增长,导致了通货膨胀;货币当局又争辩,是由于经济增长过快,投资和消费对货币需求

增长,导致物价水平上升,而迫使货币供应量增加。究竟是物价上升导致货币供应量增加,

还是货币供应量增加导致物价上涨?为了验证这种类似“是先有鸡,还是先有蛋?”的争论,

在建立模型时,有人主张建立分析物价水平和经济增长影响货币供应量的方程;也有人主张

建立分析货币供应量影响物价水平和经济增长的方程。这两个方程是什么关系?当经济增长、

物价水平和货币供应量的样本数据都是既定的,两个方程可以同时估计吗?

迄今为止我们讨论的都是单一方程计量经济模型,但有的经济问题的计量需要运用联

立方程模型。本章介绍联立方程模型的基础知识,包括联立方程模型的概念和类型、联立方

程模型的识别问题及识别的方法、联立方程的估计方法等。

第一节 联立方程模型及其偏倚

一、联立方程模型的性质
单一方程模型中只有一个被解释变量,而有一个或多个解释变量,这类模型最主要的

1本章内容供本科教学选择
特征是被解释变量与解释变量间为一种单向的因果关系,通常解释变量是变化的原因,被解

释变量是变化的结果。单一方程模型中所研究的对象是单一的变量。但是,经济现象是错综

复杂的,许多情况下所研究的问题不只是一个单一的变量,而是一个由多变量构成的经济系

统。在经济系统中多个经济变量之间可能存在着双向的或多向的因果关系。例如,对某种商

品的需求量 Q 的研究中,商品需求量 Q 受到商品价格 P 的影响,同时商品价格 P 又受到商

品需求量 Q 的影响,这时需求量 Q 与价格 P 是相互影响,存在着双向的因果关系。在这种

情况下,只用单一方程已经不能正确反映经济系统中诸多因素间的复杂关系了,而需要采用

能够表现互为因果关系的联立方程模型。

所谓联立方程模型是指用若干个相互关联的单一方程,同时去表示一个经济系统中经

济变量相互联立依存性的模型,即用一个联立方程组去表现多个变量间互为因果的联立关系。

联立方程组中每一个单一方程中包含了一个或多个相互关联的内生变量,每一个方程的被解

释变量都是内生变量,解释变量则可以是内生变量,也可以是前定变量。联立方程模型也称

为联立方程组模型。

例如,商品需求与价格的模型,根据经济理论,商品的需求量 Q 受商品的价格 P 和消

费者的收入 X 等因素的影响,可建立需求模型

Qt = α 0 + α1 Pt + α 2 X t + ut (11.1)

*
同时,该商品价格 P 也受商品需求量 Q 和其他代用商品价格 P 的影响,又可建立价格模型

Pt = β 0 + β1Qt + β 2 Pt* + vt (11.2)

式(11.1)和式(11.2)中的商品需求 Q 与商品价格 P,事实上存在双向因果关系,不能只用

单一方程模型去描述这种联立依存性,而需要把两个单一方程组成一个联立方程组,同时去

研究商品的需求量 Q 和商品价格 P 的数量关系和变化规律,从而形成如下联立方程模型

Qt = α 0 + α1 Pt + α 2 X t + ut
(11.3)
Pt = β 0 + β1Qt + β 2 Pt* + vt

又如,凯恩斯宏观经济模型,设变量有国民总收入 Y、消费 C、投资 I、政府支出 G。

收入 Y 既是决定消费 C 和投资 I 的解释变量,同时又被消费 C、


投资 I 和政府支出 G 所决定。

用联立方程组模型可清晰地描述它们之间的关系

Yt = Ct + I t + Gt
Ct = α 0 + α1Yt + u1t (11.4)
I t = β 0 + β1Yt + β 2Yt −1 + u 2t
上式中 Yt −1 表示收入 Yt 的滞后一期数值,称为滞后内生变量。

二、联立方程模型中变量的类型
在单一方程模型中,被解释变量与解释变量的区分十分清晰,解释变量是变动的原因,

被解释变量是变动的结果。在联立方程模型中,多个变量可能互为因果,同一变量可能作为

被解释变量,同时又可能作为解释变量,显然将变量只是区分为解释变量与被解释变量的意

义已经不大,而需要将变量按联立方程模型的系统性质赋予新的含义。

在联立方程模型中,从变量的性质看,一些变量是由模型体现的经济系统本身所决定

的,称为内生变量,内生变量的取值是模型求解的结果,由于受模型中随机扰动项的影响,

内生变量是随机变量。例如式(11.3)模型中的需求量 Q 和商品价格 P,它们的取值由模型

所决定。同样,式(11.4)模型中的收入 Y、消费 C 和投资 I 也都是其取值由模型决定的内

生变量。另一些变量是在模型体现的经济系统之外给定的,在模型中是非随机的,称为外生

*
变量。例如式(11.3)模型中的消费者收入 X 和其他代用商品价格 P ,它们的取值是在模

型之外因素决定的。同理,式(11.4)模型中的政府支出 G 也是由模型之外的因素决定的外

生变量。应当注意,一个变量在模型中是内生变量还是外生变量,是由经济理论和经济意义

决定的,而不是从数学形式决定的。区分内生变量和外生变量对联立方程模型的估计和应用

有重要意义。为了求解模型中的内生变量,一般说来联立方程中方程的个数应等于内生变量

的个数。如果联立方程模型中内生变量的个数恰好等于方程组中方程的个数,则称该方程组

为完备的。

在联立方程模型中,外生变量数值的变化能够影响内生变量的变化,而内生变量却不

能反过来影响外生变量。对模型体系来讲,外生变量是由模型体系以外的因素所决定的,外

生变量是可控制的变量,它与随机误差项不相关,所以是非随机变量。

在联立方程模型中,有一些变量本来是内生变量,但模型中可能出现了这些变量过去时

期的滞后值或更大范围的数值。例如在式(11.4)中,收入 Y 是内生变量,而模型中收入滞

后值 Yt −1 却不能由模型决定。像这样代表内生变量滞后值的变量称为滞后内生变量。在模型

中滞后内生变量或更大范围的内生变量的作用视同于外生变量,并与外生变量一起称为前定

变量。在单一方程模型中,前定变量一般作为解释变量,内生变量一般作为被解释变量;而

在联立方程模型中,内生变量既可作为被解释变量,又可作为解释变量。

与单一方程模型相比,联立方程模型有以下特点:

(1)联立方程组模型是由若干个单一方程组成的。模型中不止一个被解释变量,通常
建立 M 个方程就应有 M 个被解释变量

(2)联立方程组模型里既有非确定性方程(即随机方程),又有确定性方程,但必须

含有随机方程。

(3)被解释变量和解释变量之间不仅是单向的因果关系,而可能是互为因果,有的变

量在某个方程为解释变量,但同时在另一个方程中可能为被解释变量。因此解释变量有可能

是随机的不可控变量。

(4)解释变量可能与随机扰动项相关,违反 OLS 基本假定。如将式(11.1)代入式(11.2)

Pt = β 0 + β1 Pt* + β 2 (α 0 + α1 Pt + α 2Yt + vt ) + ut (11.5)

考虑式(11.2)与式(11.5),显然 Pt 不仅与 vt 相关,而且与 u t 相关。

三、联立方程模型的偏倚性
由上述可以看出,在联立方程模型中,一个方程中的解释变量,在另一个方程中可以

是被解释变量。因此联立方程模型很可能会违反古典假定。下面以式(11.4)的宏观经济模

型为例,来说明联立方程组模型出现的问题,设宏观经济模型为

Yt = Ct + I t + Gt
Ct = α 0 + α1Yt + u1t (11.6)
I t = β 0 + β1Yt + β 2Yt −1 + u 2t

由第 1 个方程和第 2 个方程可以看出,因为变量 Y 与变量 C 有联系,并且变量 C 与随机误

差项 u1 相关,所以变量 Y 与 u1 相关,而变量 Y 在第 2 个方程作解释变量,这就违背了解释

变量与随机误差项不相关的假定。将第 2 个方程和第 3 个方程代入第 1 个方程,得

Yt = α 0 + α1Yt + u1t + β 0 + β1Yt + β 2Yt −1 + u 2t + Gt (11.7)

整理后得到如下结果

α0 + β0 β2 1 1
Yt = + Yt −1 + Gt + (u1t + u 2t ) (11.8)
1 − α 1 − β1 1 − α 1 − β1 1 − α 1 − β1 1 − α 1 − β1

由上式看出,变量 Y 与 (u1t + u 2t ) 相关,但在第 3 个方程里 Y 作为解释变量说明对投资的影

响,这又违背了解释变量与随机误差项不相关的假定。当用普通最小二乘法去估计每一个方

程时,如果解释变量与随机误差项相关,则参数的估计将是有偏的和不一致的 (详细证明见

附录 11.1)。这种由于联立方程模型中内生变量作为解释变量与随机误差项相关,而引起的

OLS 估计的参数有偏且不一致,称为联立方程偏倚性。联立方程偏倚性是联立方程固有的,
所以一般情况下 OLS 法不适合于估计联立方程模型。

四、联立方程模型的种类
为了方便模型的识别和估计,联立方程模型以变量间的联系形式分类,通常可分为结

构型模型、简化型模型和递归型模型。

1.结构型模型

所谓结构型模型,是指根据经济行为理论或经济活动规律,描述经济变量之间现实的

经济结构关系的模型。结构型模型表现变量间直接的经济联系,将某内生变量直接表示为内

生变量和前定变量的函数。结构型模型的标准形式为:
β11Y1t + β12Y2t + L + β1M YMt + γ 11 X 1t + γ 12 X 2t + L + γ 1k X kt = u1t
β 21Y1t + β 22Y2t + L + β 2 M YMt + γ 21 X 1t + γ 22 X 2t + L + γ 2 k X kt =u2 t
(11.9)
L
β M 1Y1t + β M 2Y2t + L + β MM YMt + γ M 1 X 1t + γ M 2 X 2t + L + γ Mk X kt =
uMt
其中: Y1 , Y2 L YM 为内生变量; X 1 , X 2 L X k 为前定变量(当 X 1 = 1 时表明存在截距项);

u1 , u 2 , L u M 为随机扰动项; β ij 为内生变量的参数( i = 1,2, L M ; j = 1.2, L M );γ ij 为前

定变量的参数 (i = 1,2, L M ; j = 1,2, L k ) 。 β ij 和 γ ij 也统称为结构参数。

结构型模型标准形式可以用矩阵表示为:

ΒY + ΓX = u (11.10)

其中: Y 为内生变量 Yit 的向量; X 为前定变量 X it 的向量; u 为随机扰动项 uit 向量; Β 为

内生变量参数 β ij 的矩阵; Γ 为前定变量参数 γ ij 的矩阵。

结构型模型有以下特点:

(1)结构方程描述了经济变量之间的结构关系,所以结构方程反映了内生变量直接受

前定变量、其它内生变量和随机误差项影响的因果关系,在结构方程的右端可能出现其它的

内生变量。

(2)结构方程中的变量的系数称为结构参数,结构参数反映了结构方程中的解释变量

对被解释变量的直接影响程度。所有的结构参数组成的矩阵称为结构参数矩阵,因此结构型

模型有明确的经济意义,可直接分析解释变量变动对被解释变量的作用。

(3)结构型模型具有偏倚性问题,所以不能直接用 OLS 法对结构型模型的未知参数进

行估计。

(4)利用联立方程组进行预测,是通过前定变量的未来值来预测内生变量的未来值,
由于在结构方程的右端出现了内生变量,所以不能直接用结构型模型进行预测。

下面给出结构型模型的一个例子,设一个简化的凯恩斯宏观经济模型为

Ct = β1 + β 2Yt + ut (11.11)

Yt = Ct + I t (11.12)

其中 C 为消费,Y 为收入,它们是内生变量;I 为投资,是外生变量;u 为随机误差项。将

上述结构型方程组表示成标准形式

Ct − β 2Yt − β1 + 0 I t = ut (11.13)

− Ct + Yt + 0 − I t = 0 (11.14)

可用矩阵表示为

 1 − β 2  Ct   − β1 0  1   ut 
   +    =   (11.15)
 − 1 1  Yt   0 − 1 I t   0 

记矩阵为

 1 − β2  − β 0
B =   Γ =  1 
−1 1   0 − 1
C  1 u 
Y =  t  X =   u =  t 
 Yt   It  0
则结构型模型的矩阵形式为

BY + ΓX = U (11.16)

2.简化型模型

所谓简化型模型,是每个内生变量都只被表示为前定变量及随机扰动项函数的联立方

程模型。

直观地看,在简化型模型中的每一个方程的右端不再出现内生变量。简化型模型的建

立有两个实现的途径:一是直接写出模型的简化形式,在已知模型所包含的全部前定变量的

条件下,将每个内生变量直接表示为前定变量和随机误差项的函数;二是通过结构型模型导

出简化型模型,从结构型模型出发,经过代数运算,求解出内生变量,从而将每个内生变量

用前定变量和随机误差项的函数来表示。

由式(11.10)的结构型模型,若 Β ≠ 0 ,由矩阵知识知,内生变量结构型参数矩阵 Β 的

逆矩阵 B 一定存在,对式(11.10)两端同时左乘 B ,得
−1 −1
Y + B −1 ΓX = B −1u (11.17)

移项得

Y = −B −1 ΓX + B −1u (11.18)

分别令

Π = −B −1 Γ (11.19)

V = B −1u (11.20)

则简化型模型的一般形式为

Y = ΠX + V (11.21)

在式(11.21)中, Π 表示简化型模型的参数矩阵,V 表示简化型模型的随机误差项向量。

由式(11.19)可以看出,简化型模型的参数 Π 是结构型模型参数 Β 和 Γ 的函数。

事实上,可以通过代数变换,将结构型模型转化为简化型模型。例如,式(11.11)和式(11.12)

的结构型联立方程模型,将式(11.12)代入式(11.11)中得

Ct = β1 + β 2 (Ct + I t ) + ut

β1 β2 1
即 Ct = + It + ut
1 − β2 1 − β2 1 − β2

由式(11.12),有 Ct = Yt − I t ,代入式(11.11)得

Yt − I t = β1 + β 2Yt + ut

β1 1 1
即 Yt = + It + ut
1 − β2 1 − β2 1 − β2

因此,由式(11.11)和式(11.12)的结构型联立方程模型导出的简化型模型为

β1 β2 1
Ct = + It + ut (11.22)
1 − β2 1 − β2 1 − β2

β1 1 1
Yt = + It + ut (11.23)
1 − β2 1 − β2 1 − β2

容易验证,用代数形式导出的简化型模型式(11.22)和式(11.23),与用式(11.19)—式(11.21)矩

阵导出的结果是一致的。

与结构型模型相比较,简化型模型有以下特点:
(1)在简化型模型中每一个方程的右端不再出现内生变量,而只有前定变量作为解释

变量。例如在式(11.22)和式(11.23)中,等式的右端只有前定变量 I 作为解释变量。

(2)简化型模型中的前定变量与随机误差项不相关。事实上,因为简化型模型的随机

误差项是结构型模型随机误差项的线性函数,而在结构型模型中的前定变量与随机误差项不

相关,所以在简化型模型中同样有前定变量与随机误差项不相关。简化型模型中每个方程的

解释变量全是前定变量,从而避免了联立方程偏倚。因此,从理论上讲可以对简化型模型的

参数运用 OLS 法进行估计,只不过注意估计出的是简化型模型的参数估计值。但简化型模

型中的参数是原结构型模型参数的函数,由估计的简化型模型参数,有可能求解出结构型参

数。

(3)简化型模型的参数综合反映了前定变量对内生变量的直接影响与间接影响,其参

数表现了前定变量对内生变量的影响乘数。

(4)在已知前定变量取值的条件下,可利用简化型模型参数的估计式直接对内生变量

进行预测分析。

3.递归模型

所谓递归模型,是指在该模型中,第一个方程的内生变量 Y1 仅由前定变量表示,而无

其它内生变量;第二个方程内生变量 Y2 表示成前定变量和一个内生变量 Y1 的函数;第三个

方程内生变量 Y3 表示成前定变量和两个内生变量 Y1 与 Y2 的函数;按此规律下去,最后一个

方程内生变量 Ym 可表示成前定变量和 m − 1 个内生变量 Y1 , Y2 , L , Ym−1 的函数。

例如,以三个内生变量 Y1 , Y2 , Y3 和三个前定变量 X 1 , X 2 , X 3 为例,构造一个递归型联

立方程组模型。

Y1 = β11 X 1 + β12 X 2 + β13 X 3 + u1


Y2 = α 21Y1 + β 21 X 1 + β 22 X 2 + β 23 X 3 + u 2 (11.24)
Y3 = α 31Y1 + α 32Y2 + β 31 X 1 + β 32 X 2 + β 33 X 3 + u3

将上式转化为标准形式

Y1 − β11 X 1 − β12 X 2 − β13 X 3 = u1


Y2 − α 21Y1 − β 21 X 1 − β 22 X 2 − β 23 X 3 = u 2 (11.25)
Y1 − α 31Y1 − α 32Y2 − β 31 X 1 − β 32 X 2 − β 33 X 3 = u3

式(11.25)的矩阵形式为

BY + ΓX = u (11.26)
在式(11.26)中

 1 0 0
 
B =  − α 21 1 0 (11.27)
−α − α 32 1 
 31
 β11 β12 β13 
 
Γ = − β 21 β 22 β 23  (11.28)
β β 32 β 33 
 31
由此,我们看到内生变量参数矩阵 Β 是一个下三角阵,而前定变量的参数矩阵 Γ 只在原结

构型模型中前定变量参数前多了一个负号。

递归模型是联立方程组模型中一种特殊的形式。它的特点是可以直接运用 OLS 方法对

模型中的方程依次进行估计,而不会产生联立方程组的偏倚性问题。虽然满足内生变量递归

特点的递归型模型确实存在,但在建模中并不多见。而且应指出,递归型模型中事实上没有

变量间互为因果的特征,所以它并不是真正意义上的联立方程模型。

第二节 联立方程模型的识别

一、对模型识别的理解
由前面的讨论已知,简化型模型中的前定变量与随机扰动项不相关,避免了联立方程

偏倚,因此对简化型模型一般可以运用 OLS 法估计其参数。然而通常的研究目的是要获得

结构型模型的参数估计值,虽然已知结构型模型的参数是简化型模型参数的函数,但能否从

简化型参数求解出结构型参数呢?这涉及到联立方程模型的识别问题。

联立方程模型的识别可以从多方面去理解,从根本上说识别是模型的设定问题。

例如,设农产品供需均衡模型为

Qd = α 0 + α1 p + u1 (11.29)
Qs = β 0 + β1 p + u 2 (11.30)
Qd = Qs (11.31)

对于方程式(11.29)和式(11.30),由于在均衡条件下,农产品的供给与需求是一致的,所

以,这时用 OLS 法估计其参数,那么无法区分估计出的参数究竟是需求方程的还是供给方

程的,这就是联立方程组模型的识别问题。

又如,设宏观经济模型为
Yt = Ct + I t (11.32)
Ct = α 0 + α1Yt + u1t (11.33)
I t = β 0 + β1Yt + u 2t (11.34)

其中 Y 为国民总收入,C 为消费,I 为投资。

式(11.33)与式(11.34)分别是消费函数和投资函数,在经济意义上应该是唯一的,

但经过一定的数学变换,可以发现事实并非如此。由(11.32)式移项得

I t = Yt − Ct (11.35)

将式(11.35)代入式(11.34)得

Yt − Ct = β 0 + β1Yt + u 2t

则有 Ct = − β 0 + (1 − β1 )Yt − u 2t (11.36)

比较(11.33)式与(11.36)式,可以看出二者变量都是 Ct 和 Yt 。现在的问题是,通过样本

数据 Ct 和 I t 所估计的参数究竟是消费函数的参数还是投资函数的参数呢?显然这时联立方

程模型有无法识别的问题。

从上述两个例子,可以看到联立方程确实存在识别问题。联立方程模型的识别可以从

多方面去理解。对联立方程识别最直观的理解,是看能否从简化型模型参数估计值中合理地

求解出结构型模型参数的估计值。如果结构型模型参数的估计值能由简化型模型的参数求解

出,则称这个结构方程是可识别的,否则是不可识别的。从理论上,也可从方程是否具有确

定的统计形式去认识联立方程的识别。如果模型中一个结构方程与另一个结构方程含有相同

的变量(包括解释变量与被解释变量),而且变量之间具有相同的统计关系,则这两个方程

具有相同的统计形式,则它们都是不可识别的。此外,也可以从方程中是否排除了必要的变

量去理解。如果一个结构方程包含了模型的所有变量,或者说该结构方程的变量系数均未实

行零限制,则称该方程为不可识别。反过来,当模型中的结构方程有零限制出现时,即某些

变量不出现在模型中某个结构方程里时,则该方程才有可能被识别。

关于模型识别的定义是针对结构型联立方程组来说的,在结构型模型中,除了定义方

程、均衡方程(定义方程)不存在识别问题,而每一个需要估计参数的结构方程都有识别问

题。如果结构型模型中的每一个结构方程都是可识别的,则称该联立方程模型是可识别的。

在结构型模型中,只要有一个结构方程不可识别,则该联立方程模型就是不可识别的。

二、联立方程模型识别的类型
由于模型提供的信息有差异,联立方程模型的识别性质可分为三种类型:不可识别、恰
好识别和过度识别。

1.不可识别

如果结构型模型中某个方程参数的估计值不能够由简化型模型参数估计值求解出,则称

该方程是不可识别。

例如,商品需求与供给的结构型模型为

Qtd = α1 + α 2 Pt + u1t (11.37)


Q = β1 + β 2 Pt + u 2t
t
s
(11.38)
Qtd = Qts (11.39)

由均衡条件式(11.39),可导出内生变量 P 与 Q 的简化型模型为

Pt = π 1 + v1t (11.40)
Qt = π 2 + v2t (11.41)

β1 − α 1 ; α β − α1 β 2 ; u − u1t α u − β 2u1t
其中 π1 = π2 = 2 1 v1t = 2t ; v2 t = 2 2 t
α 2 − β2 α2 − β2 α2 − β2 α2 − β2

在上述简化型模型与结构型模型参数的关系式中,由估计的两个简化型参数 πˆ1 与 πˆ 2 ,无法

求解出结构型模型的 4 个参数 α1、 α 2、 β1、 β 2 。因此,方程式(11.37)和式(11.38)为不

可识别,从而该联立方程组模型是不可识别。直观的理解,这是因为供给方程和需求方程的

结构形式一致,没有提供分别估计各个结构参数的足够信息,或者说对从模型的设定上方程

没有施加足够的约束。

2.恰好识别

如果结构型模型中某个方程的参数能够由简化型模型参数估计值惟一地解出,则称该方

程是恰好识别。

例如,对上述需求与供给结构型模型补充一些信息,在供给函数中引入前定变量价格的

滞后值,即上一期的价格 Pt −1 ,这时需求与供给模型为

Qtd = α1 + α 2 Pt + u1t
Qts = β1 + β 2 Pt + β 3 Pt −1 + u 2t (11.42)
Qtd = Qts

这时,需求供给的简化型模型为

Pt = π 11 + π 12 Pt −1 + v1t
(11.43)
Qt = π 21 + π 22 Pt −1 + v2t
其中

β1 − α 1 β3
π 11 = π 12 =
α2 − β2 α2 − β2
α β − β 2α1 α β
π 21 = 2 1 π 22 = 2 3
α2 − β2 α2 − β2
u 2t − u1t α u − β 2u1t
v1t = v2 t = 2 2 t
α2 − β2 α2 − β2
从简化型模型与结构型模型参数的关系可以看到,这时简化型模型的参数个数为 4 个,结构

型模型的参数个数为 5 个,因此也不能在已知简化型模型参数估计值的条件下,惟一地解出

结构型模型的所有参数。但可以看出,需求方程的参数 α1 和 α 2 是可以被惟一求解出,即

π 22
α1 = π 21 − α 2π 11 α2 =
π 12

此时需求方程是恰好识别的;而供给方程的参数估计值不能被求解出,故供给方程不可识别。

上述例子给出一个启示,模型中引进新的前定变量 Pt −1 后,能使不可识别的模型向可以

识别转变,这为改进模型的识别状态提供了重要线索。很自然,如果继续对模型补充信息,

再引进前定变量,模型的识别状况会进一步变好吗?

例如,在需求方程中再引进一个新的前定变量收入 I t ,这时模型为

Qtd = α1 + α 2 Pt + α 3 I t + u1t
Qts = β1 + β 2 Pt + β 3 Pt −1 + u 2t (11.44)
d s
Q =Q
t t

由该结构型模型导出简化型模型

Pt = π 11 + π 12 I t + π 13 Pt −1 + u1t
(11.45)
Qt = π 21 + π 22 I t + π 23 Pt −1 + u 2t

其中

β1 − α1 − α3 β3
π 11 = π 12 = π 13 =
α2 − β2 α2 − β2 α2 − β2

α 2 β1 − α1β 2 α 3 β1 α 2 β3
π 21 = π 22 = π 23 = ;
α2 − β2 α2 − β2 α2 − β2

u2t − u1t α 2u2t − β 2u1t


v1t = v2 t =
α2 − β2 α2 − β2
由上述简化型模型与结构型模型参数的关系可以看出,简化型模型的参数是 6 个,结构型模

型的参数也是 6 个,所以由简化型模型的参数估计值可以惟一地求解出结构型模型的参数,

π 23
α1 = π 21 − α 2π 11 α2 = α 3 = α 2π 12 − π 22
π 13
π
β1 = π 21 − β 2π 11 β 2 = 22 β 3 = π 23 − β 2π 13
π 12
这表明该联立方程模型中的每一个方程都是恰好识别,所以联立方程模型是恰好识别。

3.过度识别

如果结构型模型中某个方程的参数能够由简化型模型参数估计值解出,但求解出的值不

惟一,则称该方程是过度识别。

例如,在需求方程中再继续引进一个前定变量消费者拥有的财富 Rt ,这时模型为

Qtd = α1 + α 2 Pt + α 3 I t + α 4 Rt + u1t
Qts = β1 + β 2 Pt + β 3 Pt −1 + u 2t (11.46)
d s
Q =Q
t t

由该结构型模型求出简化型模型为

Pt = π 11 + π 12 I t + π 13 Rt + π 14 Pt −1 + u1t
(11.47)
Qt = π 21 + π 22 I t + π 23 Rt + π 24 Pt −1 + u 2t

其中

β1 − α 1 − α3 − α4 β3
π 11 = π 12 = π 13 = π 14 =
α 2 − β2 α2 − β2 α 2 − β2 α 2 − β2
α β − α1β 2 α 3β2 − α4β2 α 2 β3
π 21 = 2 1 π 22 = π 23 = π 24 =
α 2 − β2 α 2 − β2 α 2 − β2 α 2 − β2
u 2t − u1t α u − β 2u1t
v1t = v2 t = 2 2 t
α 2 − β2 α2 − β2

从简化型模型与结构型模型参数的关系看出,简化型模型的参数为 8 个,而这时结构型模型

的参数为 7 个。虽然可以从参数的关系式求解出结构型模型的参数,但解并不惟一。例如,

该结构型联立方程模型的供给方程中价格 Pt 的系数 β 2 ,就可由上述关系式导出两个表达式,

即 β 2 = π 22 π 12 和 β 2 = π 23 π 13 ,产生这样问题的原因,是为需求方程提供了过多的信息,

或者说为供给方程施加了过多的约束,即供给方程不仅排除了收入变量,而且还排除了财产

变量,因而供给方程是过度识别的。
三、联立方程模型识别的方法
由上述商品需求与供给联立方程模型的例子可以看出,从简化型模型与结构型模型参

数的关系去判断模型的可识别性,实际上是非常麻烦的,特别是联立方程模型规模很大的时

候。因此,需要寻求更为规范的方法对联立方程模型的识别性进行判断。这类规范的识别方

法主要是模型识别的阶条件和秩条件。

1.模型识别的阶条件
模型识别阶条件的基本思想是,一个结构型方程的识别取决于不包含在这个方程中,

而包含在模型其他方程中变量的个数,可从这类变量的个数去判断方程的识别性质。

如果模型中有 M 个方程,共有 M 个内生变量和 K 个前定变量;其中第 i 个方程包含 mi

个内生变量和 ki 个前定变量。模型识别的阶条件可以表述为:当模型的一个方程中不包含

的变量(内生变量和前定变量)的总个数,大于或等于模型中内生变量总个数 M 减 1,则

该方程可能识别。这就是说,被模型中第 i 个方程排除的变量个数为 ( M + K ) − ( mi + ki ) ,

当第 i 个方程是可识别时,必须有

( M + K ) − (mi + ki ) ≥ M − 1 (11.48)

整理后可得

K − ki ≥ mi − 1 (11.49)

即没有包含在第 i 个方程中的前定变量个数 K − ki ,大于或等于出现在该方程的内生变量个

数 mi 减 1。

由模型识别的阶条件可以判断:当 K − ki > mi − 1 时,则第 i 方程可能是过度识别;当

K − ki = mi − 1 时,则第 i 方程可能是恰好识别;当 K − ki < mi − 1 时,则第 i 方程一定是

不可识别。

例如,设定的联立方程组模型为

Yt = Ct + I t + Gt (11.50)
Ct =α1 + α 2Yt − α 3Tt + u1t (11.51)
It =β1 + β 2Yt + β3Yt −1 + u2t (11.52)
Tt =γ 1 + γ 2Yt + u3t (11.53)

模型中 Yt 、 Ct 、 I t 和 Tt 为内生变量,即 M=4。 Gt 和 Yt −1 为前定变量,即 K=2。下面分别对


模型中的每一个方程用阶条件进行判断。

方程式(11.51)有 m2 = 3, k 2 = 0 ,这时 K − k 2 = 2 − 0 = 2 ,而 m2 − 1 = 3 − 1 = 2 ,结

果相等,所以,该方程可能是恰好识别。

方程式(11.52)有 m3 = 2, k3 = 1 ,这时 K − k3 = 2 − 1 = 1 ,而 m3 − 1 = 2 − 1 = 1 ,结

果相等,所以,该方程可能是恰好识别。

方程式(11.53),有 m4 = 2, k 4 = 0 ,这时 K − k 4 = 2 − 0 = 2 ,而 m4 − 1 = 2 − 1 = 1 ,

则 K − k 4 > m4 − 1 ,所以,该方程可能是过度识别。

由于方程式(11.50)为定义方程式,故不需判断其识别性。综合上述判断,该模型有

可能是可识别。

应当指出,模型识别的阶条件只是联立方程模型中方程识别状态的必要条件,但非充

分条件。还需要寻求用联立方程模型识别的充分必要条件去加以判断。

2.模型识别的秩条件

模型识别的阶条件还不是识别的充分条件,即是说,方程不满足识别的阶条件时,方

程是不可识别的;但方程满足识别的阶条件时,并非一定是可识别的。例如,式(11.46)的供

给方程中,没有包含需求方程式(11.46)中的收入变量 I,按照阶条件供给方程是可识别的。

但是当式(11.46)中需求方程的收入 I 的系数 α 3 为 0 时,表明收入 I 仅是可能而实际并没

有列入需求方程,这时还不能确保式(11.47)中供给方程是可识别的。此时需要运用联立方程

模型识别的充分必要条件——秩条件。

联立方程模型识别的秩条件可以表述为:在有 M 个内生变量 M 个方程的完整联立方程

模型中,当且仅当一个方程中不包含但在其他方程包含的变量(不论是内生变量还是外生变

量)的结构参数,至少能够构成一个非零的 M—1 阶行列式时,该方程是可以识别的。或者

表述为,当且仅当一个方程所排斥(不包含)的变量的参数矩阵的秩等于 M—1 时,该方程

可以识别。

设结构型模型为

BY + ΓX = U (11.54)

在上式中 B 为内生变量的系数矩阵, Γ 为前定变量的系数矩阵,记矩阵 (B0 , Γ0 ) 为该方程组

中第 i 个方程中没有包含的内生变量和前定变量系数所构成的矩阵,如果当 (B0 , Γ0 ) 的秩为


M − 1 时,即只有当至少有一个 M − 1 阶非零行列式时,该方程才是可识别的。
类似阶条件有三种情况,秩条件也有三种情况:当只有一个 M − 1 阶非零行列式时,该

方程是恰好识别;当不止一个 M − 1 阶非零行列式时,该方程是过度识别;当不存在 M − 1

阶非零行列式时,该方程是不可识别。

运用秩条件判别模型的识别性,步骤如下:

(1)将结构型模型转变为结构型模型的标准形式,并将全部参数列成完整的参数表(方

程中不出现变量的参数以 0 表示);

(2)考察第 i 个方程的识别问题:划去该方程的那一行,并划去该方程出现的变量的

系数(该行中非 0 系数)所在列,余下该方程不包含的变量在其他方程中的系数的矩阵

(B0 , Γ0 ) ;
(3)计算 Rank (B0 , Γ0 ) ,检验所余系数矩阵 (B0 , Γ0 ) 的秩,看是否等于 M-1,或检验

所余系数是否能构成非零 M-1 阶行列式。

(4)判断:如果 Rank (B0 , Γ0 ) =M-1,则该方程为可识别;根据非零行列式个数判别是

恰好识别,还是过度识别。

例如,设定的联立方程模型为

Ct =α1 + α 2Yt − α 3Tt + u1t (11.55)


It =β1 + β 2Yt + β3Yt −1 + u2t (11.56)
Tt =γ 1 + γ 2Yt + u3t (11.57)
Yt = Ct + I t + Gt (11.58)

其中,M=4 个内生变量, Yt 、 Ct 、 I t 、 Tt 分别是收入、消费、投资、税收;前定变量 Gt 和

Yt −1 分别是政府支出和上年收入。

由给定方程组模型写出其结构性模型的标准形式

−α1 + Ct + 0 I t − α 2Yt + α 3Tt + 0Gt + 0Yt −1 =


u1t (11.59)
− β1 + 0Ct + I t − β 2Yt + 0Tt + 0Gt − β 3Yt −1 =
u2 t (11.60)
−γ 1 + 0Ct + 0 I t − γ 2Yt + Tt + 0Gt + 0Yt −1 =
u3t (11.61)
0 − Ct − I t + Yt + 0Tt − Gt − 0Yt −1 =
0 (11.62)

由结构型的标准形式写出其系数矩阵 ( B, Γ) ,即
 −α1 1 0 −α 2 α 3 0 0 
 
−β 0 1 − β 2 0 0 − β3 
( B, Γ) = 1
 −γ 1 0 0 −γ 2 1 0 0 
 
 0 −1 −1 1 0 −1 0 
或者将以上一般形式的结构参数列于表 11.1

表 11.1 参数结构
变量 截距项 C I Y T G Yt −1
方程 1 − α1 1 0 -α2 α3 0 0
方程 2 − β1 0 1 - β2 0 0 − β3
方程 3 − γ1 0 0 -γ 2 1 0 0
方程 4 0 -1 -1 1 0 -1 0
下面利用秩条件判断该模型的识别性。

(1)分析消费函数方程 1 的识别问题,划去方程 1 的那一行,并划去该行中非 0 系数

所在列(即 C、Y 、T 对应的列),余下方程 1 不包含的变量在其他方程中的系数,构成 ( B0 , Γ0 ) :

 1 0 − β3 
 
( B0 , Γ 0 ) =
0 0 0 
 −1 −1 0 
 

所余系数矩阵 ( B0 , Γ0 ) 能构成 M-1=3 阶行列式:

1 0 − β3
0 0 0 =0
−1 −1 0

( B0 , Γ0 ) 只能构成一个等于零的 M-1 阶行列式,或者说 Rank ( B0 , Γ0 ) <M-1,这说明消费函

数是不可识别的。值得注意的是,在阶条件的判断中该方程是有可能为恰好识别,见式(11.51)

的阶条件判断,这一例子正好说明阶条件只是必要条件,而非充分条件,亦即满足阶条件的

未必一定满足秩条件。

(2)分析投资函数方程 2 的识别问题,同样道理可以划去方程 2 的那一行,并划去该

行中非 0 系数所在列(即 I、Y 和 Yt −1 对应的列),余下方程 2 不包含的变量在其他方程中的

 1 α3 0
 
系数,构成 ( B0 , Γ0 ) ,得到 ( B0 , Γ0 ) =  0 1 0  ,其行列式为
−1 0 − 1

1 α3 0
0 1 0 ≠0
−1 0 −1

只能构成一个不等于零的 M-1 阶行列式,则说明 Rank ( B0 , Γ0 ) =M-1=3,即表明投资函数为

恰好识别。

(3)分析税收函数方程 3 的识别问题,可以划去方程 3 的那一行,并划去该行中非 0

系数所在列(即 Y 和 T 对应的列),余下方程 3 不包含的变量在其他方程中的系数,构成

( B0 , Γ0 ) ,得到 ( B0 , Γ0 ) 为

1 0 0 0 
( B0 , Γ0 ) =  0 1 0 − β3 

 −1 −1 −1 0 

这是一个三行四列的矩阵,故可构成四个三阶行列式,即

1 0 0 1 0 0 0 0 0 1 0 0
0 1 0 0 0 − β3 1 0 − β3 0 1 − β3
−1 −1 −1 −1 −1 0 −1 −1 0 −1 −1 0

很明显在这四个三阶行列式里只有

0 0
0
1 0 − β3 =
0
−1 −1 0

其余三个均为非零行列式,则表明税收函数是过度识别。

最后一个方程为恒定式,可以不需判断其识别性。综上所述,由于消费函数是不可识别,

所以,整个方程组为不可识别。

3、模型识别的一般步骤和经验方法

从前面的介绍可以看出,模型识别的秩条件是充分必要条件,但识别程序过于繁琐;模

型识别的阶条件比较简便,但又只是必要条件。在用联立方程模型作实际的计量经济研究时,

为了简化识别的工作量,可以将两种方法结合运用。首先用阶条件判断方程是否可以识别,

如果不可识别,说明不满足识别的必要条件,即可作出结论。如果阶条件显示可以识别,因

还不是充分条件,再用秩条件分析其充分条件是否满足,若不满足即可作出不可识别的结论。

若秩条件表明是可识别的,再用阶条件分析究竟是恰好识别,还是过度识别。模型识别的一

般步骤如图 11.1 所示。


阶条件 否

K − ki ≥ mi − 1 K − ki < mi − 1 不可识别

秩条件 否
r ( A) = M − 1 r ( A) ≠ M − 1或 A = 0 不可识别

是 可以识别

阶条件 否
K − ki = mi − 1 K − ki > mi − 1 过度识别


恰好识别

图 11.1 模型识别的一般步骤

模型的识别不是统计问题,而是模型的设定问题,因此在设定模型时就应设法尽量保证

模型的可识别性。一般说来在设定联立方程模型时应遵循以下原则:“在建立联立方程结构

型模型时,要使新引入的方程中包含前面已引入的每一个方程都不包含的至少 1 个变量(内

生变量或前定变量);同时,要使前面已引入的每一个方程都包含至少 1 个新引入方程未包

含的变量,并要互不相同。”因为只有新引入的方程包含前面每一个方程都不包含的至少 1

个变量,才能保证不破坏前面已有方程的可识别性。而且,只有前面每一个方程都包含至少

1 个新引入方程所未包含的变量,才能保证新引入的方程是可识别的。

第三节 联立方程模型的估计

一、联立方程模型估计方法的选择
联立方程模型在模型形式上有结构型和简化型之分,从模型的识别条件上又有恰好识

别、过度识别和不可识别之分。由于模型的类型不同,建立模型的目的不同,模型的估计

方法也有多种选择。

从模型的研究目的来看,如果研究目的是为了作经济结构分析,验证某种经济理论,

着重关注的是模型的结构参数,应当力争尽可能准确估计结构型参数。如果研究目的是为

了评价政策或论证某些经济政策的效应,就应当力争准确估计简化型参数,因为简化型参

数正好能够反映“政策乘数”和“效果乘数”。如果研究目的只是为了作经济预测,要用预测

期的外生变量值预测内生变量,只要直接估计简化型参数即可,因为简化型模型已表现了
前定变量对各内生变量的影响。

考虑数据的可用性和计算方法的复杂性,对联立方程组模型的估计,通常有两类方法,

一类是单一方程估计法或称为有限信息估计法;另一类是系统估计法或称为完全信息估计

法。单一方程估计法是指对方程组模型中的每一个方程逐一进行估计,最后得到模型中全

部方程的估计。单一方程估计法有普通最小二乘法、工具变量法、间接最小二乘估计法、

二段最小二乘估计法、有限信息最大似然法等。单一方程估计法的特点是估计方程的参数

只考虑该方程本身所带来的(有限)信息,不考虑整个模型所提供的全部信息,所以也称有

限信息法。系统估计法是指在考虑整个模型所提供的全部信息的情况下,对模型中的全部

方程同时进行估计的方法。系统估计法有三段最小二乘法(3SLS)、似乎不相关法(SUR)、

完全信息最大似然估计法(FIML)等。因为该方法在估计模型时,用到了模型全部信息,

所以也称完全信息法。从对参数估计的统计特性看,系统估计法要优于单一方程估计法;

但从方法的复杂性和可操作性看,单一方程法又优于系统估计法。所以在实际中单一方程

估计法仍然得到广泛运用。本章只介绍常用的单一方程估计法。

此外,还应从识别条件考虑,对于恰好识别方程,需要用间接最小二乘法、工具变量

法等估计参数;对于过度识别方程,需要用二段最小二乘法、三段最小二乘法等估计参数;

对于不足识别方程,则不能估计其结构型参数。对于递归型模型可直接用 OLS 法估计参

数。

二、递归模型的估计——OLS 法
在第一节联立方程模型里已介绍了递归型模型,由于该模型构造的特殊性,递归模型中

各内生变量之间的联系只是单向的,都满足 OLS 基本假定,实际上并没有联立方程偏倚问

题。

例如,式(11.24)给出的递归型模型为

Y1 = β11 X 1 + β12 X 2 + β13 X 3 + u1 (11.63)


Y2 = α 21Y1 + β 21 X 1 + β 22 X 2 + β 23 X 3 + u 2 (11.64)
Y3 = α 31Y1 + α 32Y2 + β 31 X 1 + β 32 X 2 + β 33 X 3 + u3 (11.65)

其中 Y1 , Y2 , Y3 为内生变量, X 1 , X 2 , X 3 为前定变量, u1 , u 2 , u3 为随机误差项。

递归型模型的第一个方程式(11.63),由于在等式的右端只有前定变量和随机误差项,

无内生变量,并且前定变量与随机误差项不相关,所以满足基本假定,可以直接用 OLS 法

估计参数。第二个方程式(11.64),其右端除了前定变量和随机误差项以外,还有内生变量 Y1 ,
但 Y1 与随机误差项 u 2 并不相关,所以该方程满足基本假定,可用 OLS 法估计参数。同理,

第三个方程式(11. 65)也能用 OLS 法估计参数。

尽管递归型模型的解释变量中包含了内生变量,但根据递归的特点,它们与随机误差项

不相关,不会产生联立方程模型的偏倚性,因此,如果联立方程模型为递归型模型,则可直

接运用 OLS 法估计其参数。

三、恰好识别方程的估计 ——间接最小二乘法(ILS)
将结构型模型转化为简化型模型,由于简化型模型中的每一个方程的右端只有前定变

量,并且前定变量与随机误差项不相关,可以用最小二乘法估计其参数。如果为恰好识别的

方程,通过模型的简化型参数可以唯一确定结构型参数的估计值,显然,这种情况下可以先

用 OLS 法估计简化型参数,然后再求解出结构型参数。这就是间接最小二乘法(ILS)的基

本思想。

应用间接最小二乘法的步骤为:

(1)将结构型模型转化为简化型模型,并建立简化型模型与结构型模型之间参数的关

系式;

(2)对简化型模型中的每一个方程用 OLS 法估计其参数,得到简化型方程的参数估计

量;

(3)在恰好识别的条件下,利用简化型模型与结构型模型之间参数的关系式唯一地解

出结构型方程的参数估计量。

例如,式(11.44)商品需求与供给的结构型模型为

Qtd = α1 + α 2 Pt + α 3 I t + u1t
Qts = β1 + β 2 Pt + β 3 Pt −1 + u 2t (11.44)
Qtd = Qts
由该结构型模型导出的简化型模型为

Pt = π 11 + π 12 I t + π 13 Pt −1 + u1t
(11.45)
Qt = π 21 + π 22 I t + π 23 Pt −1 + u 2t

运用阶条件和秩条件对方程式(11.44)进行判断,可知整个模型为恰好识别。运用 OLS 法

估计简化型模型式(11.45)中的参数,求得各个参数的估计值 πˆ ij ( i = 1,2; j = 1,2,3 )。将估

计的 πˆ ij 带入参数关系式,即可通过简化型模型的参数估计求解出方程式(11.44)的参数估

计:
πˆ 23
αˆ1 = πˆ 21 − αˆ 2πˆ11 αˆ 2 = αˆ 3 = αˆ 2πˆ12 − πˆ 22
πˆ13
πˆ
βˆ1 = πˆ 21 − βˆ2πˆ11 βˆ2 = 22 βˆ3 = πˆ 23 − βˆ2πˆ13
πˆ12
可以证明,间接最小二乘法参数估计有以下特性:简化型参数的估计是无偏的,并且在

大样本下是一致估计式;但因结构型参数与简化型参数是非线性关系,结构型参数的估计在

小样本中是有偏的,不过在大样本中是一致估计量。还可以证明,间接最小二乘法估计的结

构型参数不是完全有效的,即一般不具有最小方差。这些特性的证明已超出本书范围,故本

书从略。

最后还应强调,间接最小二乘法的运用有一定的假定前提,首先,结构型模型应是恰

好识别;其次,在简化型模型中的每一个方程都应满足基本假定;而且,在简化型模型中的

前定变量不存在严重的多重共线性。

四、过度识别方程的估计——二段最小二乘法(TSLS)
在计量经济分析中,许多结构型模型是过度识别的,这种情况下间接最小二乘法不适用。

联立方程模型中出现的联立方程偏倚,是因为内生变量作为了解释变量,而且与随机误差项

相关,故造成参数的估计有偏和非一致。如果能够找到一种变量,它与作为解释变量的内生

变量高度相关,但与同期的随机误差项不相关,问题便可得到解决。例如由简化型模型估计

的 Yˆi 就可能是这样的变量,用这种变量替代内生变量去作为解释变量,就可能避免联立方

程偏倚的出现。这就是二段最小二乘法(简称 TSLS)的基本思想。

例如,由结构型模型变换得到的简化型模型中的第 i 个方程为

Yi = π i1 X 1i + π i 2 X 2i + L + π ik X ki + vi (11.66)

其中的 π i1 X 1i + π i 2 X 2i + L + π ik X ki 构成了由前定变量 X 1i , X 2i , L , X ki 决定的 Yi 的精确分

量部分,随机误差 vi 构成 Yi 的随机分量部分。在简化型模型中,前定变量与随机误差项不

相关,所以可以对式(11.66)用 OLS 法估计参数,这样便可得到上述精确分量的估计 Yˆi 。

作为精确分量 Yˆi 与 Yi 高度相关,但是 Yˆi 与 vi 不相关。如果用 Yˆi 替换作为结构型模型解释变

量的 Yi ,显然根据 OLS 原理 Yˆi 与结构型模型的同期随机误差项也不相关,从而避免了联立

方程偏倚,因此,这时对经过变量替代的新结构型方程,可以用 OLS 法估计参数。可以看

出,二段最小二乘法是分为两个阶段使用最小二乘法进行参数估计的方法,实际是用 Yˆi 作
为 Yi 的工具变量。由于恰好识别是过度识别的特殊情况,所以二段最小二乘法既可以用于

过度识别条件下的参数估计,也可用于恰好识别的情况。

二段最小二乘法的具体步骤如下:

(1)将结构型模型变换为简化型模型,将结构方程中内生变量直接对所有的前定变量

回归。

Y1 = π 11 X 1 + π 12 X 2 + L + π 1k X k + v1
L L L L L L L L L L (11.67)
YM = π M 1 X 1 + π M 2 X 2 + L + π Mk X k + v M

(2)运用 OLS 法分别估计简化型方程的参数 πˆ ij ,利用所估计的 πˆ ij 和前定变量 X 求 Yˆi ,

Yˆi = πˆ i1 X 1 + πˆ i 2 X 2 + L + πˆ ik X k (11.68)

(3)用估计的 Yˆi 去替代结构方程中作为解释变量的内生变量 Yi ,得

Y1 = β11Yˆ1 + β12Yˆ2 + L + β1mYˆm + γ 11 X 1 + L + γ 1k X k + u1*


L L L L L L L L L L L L L L (11.69)
YM = β M 1Yˆ1 + β M 2Yˆ2 + L + β MM YˆM + γ M 1 X 1 + L + γ Mk X k + u M*
再运用 OLS 法估计该结构方程的参数,得到参数的 TSLS 估计值。

(4)对结构型模型的每一个方程进行估计,完成对整个模型的参数估计。

如式(11.46)的结构型模型为

Qtd = α1 + α 2 Pt + α 3 I t + α 4 Rt + u1t (11.70)


Q = β1 + β 2 Pt + β 3 Pt −1 + u 2t
t
s
(11.71)
Q =Q
t
d
t
s
(11.72)

前面已经验证了此结构型模型中的供给方程是过度识别。为了用 TSLS 法估计其参数,直接

写出它的简化型模型为

Pt = π 11 + π 12 I t + π 13 Rt + π 14 Pt −1 + u1t (11.73)
Qt = π 21 + π 22 I t + π 23 Rt + π 24 Pt −1 + u 2t (11.74)

首先,估计简化型模型中关于价格 Pt 的方程,得到估计式

Pˆt = πˆ 21 + πˆ 22 I t + πˆ 23 Rt + πˆ 24 Pt −1 (11.75)

设残差为 e1t = Pt − Pˆt ,则 Pt = Pˆt + e1t ,其中 P̂t 与 e1t 不相关。


其次,将 Pt = Pˆt + e1t 代入结构型模型中的需求方程式(11.74),得

Qtd = α1 + α 2 ( Pˆt + e1t ) + α 3 I t + α 4 Rt + u1t


(11.76)
= α1 + α 2 Pˆt + α 3 I t + α 4 Rt + ut*

其中, ut = α 2 e1t + u1t 。可以证明,这时 P̂t 与 ut 渐进不相关,因此,对式(11.76)可直接


* *

用 OLS 法估计参数,而式(11.76)正是结构型模型中商品需求方程,即完成了对需求方程

参数的估计。

类似地,也可对式(11.71)供给方程用 TSLS 法估计参数。这样便完成了对整个结构型

模型的参数估计。

运用二段最小二乘法时要注意以下使用条件:

(1)结构方程必须可以识别。

(2)结构方程中的随机误差项要满足 OLS 的基本假定。

(3)结构方程中的所有前定变量不存在严重的多重共线性,而且与随机误差项不相关。

(4)样本容量要足够大。

2 2
(5)运用二段最小二乘法时应关注简化型模型的可决系数 R ,第一段回归时 R 高,

说明 Yˆi 与 Yi 很接近,若第一段简化型方程回归中 R 很低,说明 Yˆi 对 Yi 的代表性不强,Yi 很


2

大程度上受随机分量决定,TSLS 估计事实上将无意义。

可以证明(同样本书省略了这些证明),二段最小二乘法参数估计有以下特性:

(1)小样本时,TSLS 法所得到的参数估计量是有偏的;

(2)大样本时,TSLS 法所得到的参数估计量具有一致性;

(3)尽管 TSLS 法是针对过度识别而提出的,但对于恰好识别情况仍然可以使用,并

且估计的结果与间接最小二乘法(ILS)估计结果一致。但在过度识别条件下,用 TSLS 法

只能提供每个参数的唯一估计值,而用 ILS 法则能提供多个估计值。

二段最小二乘法较为简便,易于操作,当模型中结构方程较多时尤其方便。而且二段最

小二乘法具有一致性特征,对可以识别的模型都适用,只要样本足够大,是估计联立方程模

型的常用方法。

第四节 案例分析

一、研究目的和模型设定
依据凯恩斯宏观经济调控原理,建立简化的四川宏观经济调控模型。经理论分析,采用

基于三部门的凯恩斯总需求决定模型,在不考虑在不考虑进出口的条件下,通过消费者、企

业、政府的经济活动,分析总收入的变动对消费和投资的影响。设理论模型如下:

Y𝑡𝑡 = 𝐶𝐶𝑡𝑡 + 𝐼𝐼𝑡𝑡 + 𝑡𝑡

C𝑡𝑡 = 𝛼𝛼0 + 𝛼𝛼1 𝑌𝑌𝑡𝑡 + 𝛼𝛼2 Y𝑡𝑡−1 + 𝜇𝜇1𝑡𝑡

I𝑡𝑡 = 𝛽𝛽0 + 𝛽𝛽1 𝑌𝑌𝑡𝑡 + 𝛽𝛽2 Y𝑡𝑡−1 + 𝜇𝜇2𝑡𝑡

式中, 𝑌𝑌𝑡𝑡 为总收入(地区生产总值 GDP);𝐶𝐶𝑡𝑡(或 COM)为消费、𝐼𝐼𝑡𝑡(或 INV)为投资;𝑌𝑌𝑡𝑡−1 为

收入的滞后一期;𝐺𝐺𝑡𝑡 (或 GOV)为政府支出;内生变量为𝑌𝑌𝑡𝑡 、𝐶𝐶𝑡𝑡 、𝐼𝐼𝑡𝑡 ;前定变量为𝑌𝑌𝑡𝑡−1 、𝐺𝐺𝑡𝑡 ,

即 M=3,K=2。

二、模型识别
根据上述理论方程,其结构型的标准形式为

− 𝐶𝐶𝑡𝑡 − 𝐼𝐼𝑡𝑡 + Y𝑡𝑡 − 𝑡𝑡 =0 (11.77)

−𝛼𝛼0 + C𝑡𝑡 − 𝛼𝛼1 𝑌𝑌𝑡𝑡 − 𝛼𝛼2 Y𝑡𝑡−1 = 𝜇𝜇1𝑡𝑡 (11.78)

−𝛽𝛽0 + I𝑡𝑡 − 𝛽𝛽1 𝑌𝑌𝑡𝑡 − 𝛽𝛽2 Y𝑡𝑡−1 = 𝜇𝜇2𝑡𝑡 (11.79)

标准形式系数矩阵(B, Γ)为

0 −1 −1 1 0 −1
(B, Γ) = �−𝛼𝛼0 1 0 −𝛼𝛼1 −𝛼𝛼2 0�
−𝛽𝛽0 0 1 −𝛽𝛽1 −𝛽𝛽2 0

由于第一个方程为恒定式,所以不需要对其识别性进行判断。下面判断消费函数和投资函数

的识别性。

1.消费函数的识别性

首先,用阶条件判断。这时m2 = 2; 𝑘𝑘2 = 1,因为K − 𝑘𝑘2 = 2 − 1 = 1并且m2 − 1 = 2 −

1 = 1,所以K − 𝑘𝑘2 = m2 − 1,表明消费函数有可能为恰好识别。

其次,用秩条件判断。在(B, Γ)中划去消费函数所在的第二行和非零系数所在的第一、

二、四、五列,得

(B0 , Γ0 ) = �−1 1�
1 0
显然,Rank(B0 , Γ0 ) = 2,则由秩条件,表明消费函数是可识别。再根据阶条件,消费函数

是恰好识别。

2.投资函数的识别性

由于投资函数与消费函数的结构相近,判断过程与消费函数完全一样,故投资函数的阶
条件和秩条件的判断予以省略。结论是投资函数也为恰好识别。

综合上述各方程的判断结果,得出该模型为恰好识别。

三、宏观经济模型的估计
由于消费函数和投资函数均为恰好识别,因此,可用间接最小二乘估计法(ILS)估计

参数。选取消费、投资,用地区生产总值 GDP 代表收入、并用财政支出作为政府支出的替代

变量。这些变量取自 1978~2016 年四川省宏观经济的历史数据,见表 11.2。


表 11.2 1978-2016 年四川省宏观经济的历史数据 (单位:亿元)
年份 消费 C 投资 I 收入(GDP)Y 政府支出 G

1978 114.13 47.49 184.61 22.43


1979 122.13 58.26 205.76 24.81
1980 137.32 64.42 229.31 26.94
1981 157.70 56.56 242.32 27.77
1982 176.87 67.01 275.23 31.18
1983 198.86 77.77 311.00 34.09
1984 220.28 98.87 358.06 38.60
1985 256.39 119.50 421.15 44.68
1986 283.92 125.70 458.23 48.39
1987 329.30 146.33 530.86 55.09
1988 407.52 182.86 659.69 68.94
1989 475.73 192.48 744.98 76.44
1990 553.97 238.68 890.95 98.08
1991 604.40 290.22 1,016.31 121.43
1992 665.99 374.14 1,177.27 136.67
1993 799.77 514.03 1,486.08 171.23
1994 1,073.20 713.66 2,001.41 217.31
1995 1,308.99 927.71 2,504.95 271.63
1996 1,542.96 1,108.46 2,985.15 336.70
1997 1,689.39 1,253.44 3,320.11 376.21
1998 1,758.19 1,425.80 3,580.30 395.62
1999 1,826.99 1,466.29 3,711.61 420.21
2000 2,021.66 1,521.43 3,928.20 523.47
2001 2,161.96 1,693.10 4,293.49 616.80
2002 2,337.76 1,925.31 4,725.01 676.51
2003 2,579.30 2,248.78 5,333.09 751.17
2004 2,954.34 2,728.10 6,379.63 851.30
2005 3,366.47 3,326.22 7,385.10 901.22
2006 3,686.82 4,203.05 8,690.24 1,138.06
2007 4,285.21 5,242.55 10,562.39 1,386.35
2008 4,937.87 6,574.63 12,601.23 1,602.30
2009 5,601.30 7,720.13 14,151.28 1,611.20
2010 6,638.53 9,219.92 17,185.48 1,971.00
2011 7,967.50 11,067.68 21,026.68 2,456.90
2012 9,095.30 12,496.00 23,872.80 2,831.40
2013 10,102.47 13,494.59 26,260.80 3,120.61
2014 11,174.20 14,426.45 28,536.66 3,355.74
2015 12,073.44 14,806.21 30,053.10 3,701.52
2016 13,183.40 16,165.27 32,934.54 4,054.52

资料来源:四川省统计年鉴

1.恰好识别模型的 ILS 估计。

根据 ILS 法,首先将结构型模型转变为简化型模型,则宏观经济模型的简化型为

Y𝑡𝑡 = 𝜋𝜋00 + 𝜋𝜋01 𝑌𝑌𝑡𝑡−1 + 𝜋𝜋02 𝑡𝑡 + 𝜈𝜈1

C𝑡𝑡 = 𝜋𝜋10 + 𝜋𝜋11 𝑌𝑌𝑡𝑡−1 + 𝜋𝜋12 𝑡𝑡 + 𝜈𝜈2

I𝑡𝑡 = 𝜋𝜋20 + 𝜋𝜋21 𝑌𝑌𝑡𝑡−1 + 𝜋𝜋22 𝑡𝑡 + 𝜈𝜈3

其中结构型模型的系数与简化型模型系数的关系为
𝛼𝛼0 +𝛽𝛽0 𝛼𝛼2 +𝛽𝛽2 1
𝜋𝜋00 = ,𝜋𝜋01 = ,𝜋𝜋02 =
1−𝛼𝛼1 −𝛽𝛽1 1−𝛼𝛼1 −𝛽𝛽1 1−𝛼𝛼1 −𝛽𝛽1

𝛼𝛼0 +𝛽𝛽0 𝛼𝛼2 +𝛽𝛽2 𝛼𝛼1


𝜋𝜋10 = 𝛼𝛼0 + 𝛼𝛼1 ,𝜋𝜋11 = 𝛼𝛼2 + 𝛼𝛼1 ,𝜋𝜋12 =
1−𝛼𝛼1 −𝛽𝛽1 1−𝛼𝛼1 −𝛽𝛽1 1−𝛼𝛼1 −𝛽𝛽1

𝛼𝛼0 +𝛽𝛽0 𝛼𝛼2 +𝛽𝛽2 𝛽𝛽1


𝜋𝜋20 = 𝛽𝛽0 + 𝛽𝛽1 ,𝜋𝜋21 = 𝛽𝛽2 + 𝛽𝛽1 ,𝜋𝜋22 =
1−𝛼𝛼1 −𝛽𝛽1 1−𝛼𝛼1 −𝛽𝛽1 1−𝛼𝛼1 −𝛽𝛽1

其次,用 OLS 法估计简化型模型的参数。进入 EViews 软件,确定时间范围;编辑输入

数据;选择估计方程菜单。则估计简化型样本回归函数的过程是:按路径:Qucik/Estimate

Eguation/ Equation Spesfication,进入”Equation Spesfication”对话框。

在”Equation Spesfication”对话框里,分别键入:”GDP C GOV”、“COM C GOV”、“INV

C GOV”,其中,GDP 表示 Y,COM 表示 C,INV 表示 I,GOV 表示 G。得到三个简化型方程的估

计结果,写出简化型模型的估计式:

�𝑡𝑡 = 38.748 + 0.456𝑌𝑌𝑡𝑡−1 + 4.874


Y 𝑡𝑡

C� 𝑡𝑡 = 247.8 + 0.151𝑌𝑌𝑡𝑡−1 + 2.062 𝑡𝑡

Î𝑡𝑡 = −202.31 + 0.221𝑌𝑌𝑡𝑡−1 + 2.617 𝑡𝑡

即简化型系数的估计值分别为

𝜋𝜋�00 = 38.748 𝜋𝜋�01 = 0.456 𝜋𝜋�02 = 4.874

𝜋𝜋�10 = 247.8 𝜋𝜋�11 = 0.151 𝜋𝜋�12 = 2.062

𝜋𝜋�20 = −202.31 𝜋𝜋�21 = 0.221 𝜋𝜋�22 = 2.617

最后,因为模型是恰好识别,则由结构型模型系数与简化型模型系数之间的关系,可惟

一地解出结构型模型系数的估计。解得的结构型模型的参数估计值为
𝛼𝛼�0 = 231.41 𝛼𝛼�1 = 0.423 𝛼𝛼�2 = −0.042

𝛽𝛽̂0 = −223.118 𝛽𝛽̂1 = 0.537 𝛽𝛽̂2 = −0.0239

从而结构模型的估计式为

Y𝑡𝑡 = 𝐶𝐶𝑡𝑡 + 𝐼𝐼𝑡𝑡 + 𝑡𝑡

C𝑡𝑡 = 231.41 + 0.423𝑌𝑌𝑡𝑡 −0.042Y𝑡𝑡−1 + 𝑒𝑒1

I𝑡𝑡 = −223.118 + 0.537𝑌𝑌𝑡𝑡 −0.0239Y𝑡𝑡−1 + 𝑒𝑒2

2.过度识别模型的 TSLS 估计

考虑在宏观经济活动中,当期消费行为还要受到上一期消费的影响,当期的投资行为也

要受到上一期投资的影响,因此,在上述宏观经济模型里再引入C𝑡𝑡 和I𝑡𝑡 的滞后一期变量C𝑡𝑡−1 和

I𝑡𝑡−1 。这时宏观经济模型可写为

Y𝑡𝑡 = 𝐶𝐶𝑡𝑡 + 𝐼𝐼𝑡𝑡 + 𝑡𝑡

C𝑡𝑡 = 𝛼𝛼0 + 𝛼𝛼1 𝑌𝑌𝑡𝑡 + 𝛼𝛼2 Y𝑡𝑡−1 + α3 C𝑡𝑡−1 + 𝜇𝜇1𝑡𝑡

I𝑡𝑡 = 𝛽𝛽0 + 𝛽𝛽1 𝑌𝑌𝑡𝑡 + 𝛽𝛽2 Y𝑡𝑡−1 + β3 I𝑡𝑡−1 + 𝜇𝜇2𝑡𝑡

用阶条件和秩条件对上述模型进行识别判断(具体的判断过程从略),结论是消费函数和投资

函数均是过度识别。需要运用二段最小二乘法对方程组的参数进行估计。

首先,估计消费函数。进入 EViews 软件,确定时间范围;编辑输入数据。然后按路径:

Qucik/Estimate equation/Equation specification/Method/TSLS,进入估计方程对话框,

将 method 按钮点开,这时会出现估计方法选择的下拉菜单,从中选“TSLS”,即两阶段最

小二乘法,见图 11.2。

图 11.2 选择两阶段最小二乘法的窗口

当 TSLS 法选定后,便会出现“Equation Specification”对话框,见图 11.3。


图 11.3 两阶段最小二乘法输入变量的窗口

“Equation Specification”对话框有两个窗口,第一个窗口是用于写要估计的方程;

第二个窗口是用于写该方程组中所有的前定变量,EViews8 要求将截距项也看成前定变量,

是可选项。具体书写格式如下:第一个窗口写:
“COM C GDP COM(-1)”;第二个窗口写:
“GOV

COM(-1) INV(-1)”,选中“include a constant”


。其中,COM(-1),INV(-1)分别表示消费

变量 C 和投资变量 I 的滞后一期。然后按“确定”,便显示出估计结果,见图 11.4。

图 11.4 消费函数的估计结果

根据图 11.4 得出消费函数的 TSLS 估计式为

C𝑡𝑡 = 42.876 + 0.252356𝑌𝑌𝑡𝑡 − 0.1983Y𝑡𝑡−1 + 0.9001C𝑡𝑡−1 + 𝑒𝑒1𝑡𝑡

其次,估计投资函数。与估计消费函数过程一样,得到如下估计结果,见图 11.5。
图 11.5 投资函数的估计结果

由图 11.5 得出投资函数的估计式

I𝑡𝑡 = −24.85 + 0.6174𝑌𝑌𝑡𝑡 − 0.5763Y𝑡𝑡−1 + 0.8895I𝑡𝑡−1 + 𝑒𝑒2𝑡𝑡

最后,得到该联立方程组模型的估计式为

Y𝑡𝑡 = 𝐶𝐶𝑡𝑡 + 𝐼𝐼𝑡𝑡 + 𝑡𝑡

C𝑡𝑡 = 42.88 + 0.2524𝑌𝑌𝑡𝑡 − 0.198Y𝑡𝑡−1 + 0.90C𝑡𝑡−1 + 𝑒𝑒1𝑡𝑡

I𝑡𝑡 = −24.85 + 0.6174𝑌𝑌𝑡𝑡 − 0.5763Y𝑡𝑡−1 + 0.8895I𝑡𝑡−1 + 𝑒𝑒2𝑡𝑡

本章小结
1.联立方程模型是指用若干个相互关联的单一方程,同时表示一个经济系统中经济变量

相互联立依存性的模型,即用一个联立方程组去表现多个变量间互为因果的联立关系。联立

方程组中每一个单一方程中包含一个或多个相互关联的内生变量,每一个方程的被解释变量

都是内生变量,解释变量则可以是内生变量,也可以是外生变量。通常内生变量的个数应与

模型中方程的个数一致。

2.联立方程模型中,从变量的性质看,一些变量是由模型体现的经济系统本身所决定的,

称为内生变量,内生变量的取值是模型求解的结果,由于受模型中随机扰动项的影响,内生

变量是随机变量。另一些变量是在模型体现的经济系统之外给定的,在模型中是非随机的,

称为外生变量。外生变量数值的变化能够影响内生变量的变化,而内生变量却不能反过来影

响外生变量。

3.联立方程模型中由于内生变量作为解释变量与随机误差项相关,用 OLS 法估计的参数

有偏且不一致而引起的偏倚性,称为联立方程偏倚。

4.联立方程模型描述经济变量之间现实经济结构关系的模型,称为结构型模型。结构
型模型表现变量间直接的经济联系,将某内生变量直接表示为内生变量和前定变量的函数。

把每个内生变量都只表示为前定变量及随机扰动项函数的联立方程模型,称为简化型模型。

简化型模型能直接用于对内生变量的预测。

5.联立方程模型的识别可以从多方面去理解,可从方程是否具有确定的统计形式去认识,

也可以从方程中是否排除了必要的变量去理解。但对联立方程识别最直观的理解,是看能否

从简化型模型参数估计值中合理求解出结构型模型参数的估计值。由简化型模型的参数求解

结构型模型的参数时,能惟一求解,结构方程是恰好识别;能求解但解不惟一,结构方程过

度识别;无法求解,则结构方程是不可识别。

6.判断模型可识别性的方法有模型识别的阶条件和秩条件。两种方法可结合运用。

7.联立方程模型的估计方法有多种。递归型联立方程模型 OLS 法估计。恰好识别的联立

方程模型可用间接最小二乘法估计。过度识别和恰好识别的联立方程模型可用二段最小二乘

法估计。不可识别的联立方程模型无法估计。

8.运用 EViews 软件实现对联立方程模型的估计和检验。

9.主要公式见表 11.3。

表 11.3 主要公式表

名称 公式
结构型模型的 β11Y1t + β12Y2 t + L + β1M YMt + γ 11 X 1t + γ 12 X 2 t + L + γ 1k X kt = u1t
一般形式
β 21Y1t + β 22Y2 t + L + β 2 M YMt + γ 21 X 1t + γ 22 X 2 t + L + γ 2 k X kt =u2 t
M
β M 1Y1t + β M 2Y2 t + L + β MM YMt + γ M 1 X 1t + γ M 2 X 2 t + L + γ Mk X kt =
uMt
结构型模型的 BY + ΓX =U
矩阵形式
简化型模型的 Y = ΠX + V
矩阵形式
模型识别的阶 当 K − ki = mi − 1 时,则第 i 方程是恰好识别;
条件
当 K − ki > mi − 1 时,则第 i 方程是过度识别;
(必要条件)
当 K − ki < mi − 1 时,则第 i 方程是不可识别。
识别的秩条件 当且仅当一个方程所排斥(不包含)的变量的参数矩阵 ( B0 , Γ0 ) 的秩 Rank
(充分必要条
( B0 , Γ0 ) =M-1 时,方程可以识别,Rank ( B0 , Γ0 ) ≠ M-1,方程不可识别;
件)
当只有一个 M − 1 阶非零行列式时,该方程是恰好识别;
当不止一个 M − 1 阶非零行列式时,该方程是过度识别;
当不存在 M − 1 阶非零行列式时,该方程是不可识别。
若 Rank (B0 , Γ0 ) <M-1,则该方程不可识别。
思考题
11.1 除了单一方程模型以外,为什么还要建立联立方程模型?

11.2 联立方程模型有那些种类?各类联立方程模型的特点是什么?

11.3 什么是联立方程偏倚?为什么会产生联立方程偏倚?

11.4 写出结构型模型的一般形式和结构参数矩阵。

11.5 为什么不能直接用普通最小二乘法对联立方程模型的参数进行估计?

11.6 识别的阶条件与秩条件的含义是什么?为什么在识别的过程中要将阶条件与秩

条件结合运用?

11.7 在哪种情况下,可直接用最小二乘法估计联立方程模型的参数?

11.8 间接最小二乘法的条件、步骤、参数估计的特性是什么?

11.9 两阶段最小二乘法的条件、步骤、参数估计的特性是什么?

11.10 联立方程的估计方法有几种类型?试解释各自的含义及使用条件。

11.11 说明间接最小二乘法与两阶段最小二乘法的原理及步骤;在什么条件下,两种方

法的估计结果是等价的

11.12 为什么要讨论联立方程的识别问题?模型的识别性有几种类型,解释各自的含义。

11.13 如何对不可识别的方程进行简单的修改使之可以识别?

11.14 说明间接最小二乘法、工具变量法、与两阶段最小二乘法的原理及步骤,并比较

三者之间的关系。

练习题
11.1 考虑以下凯恩斯收入决定模型:

Ct =β10 + β11Yt + u1t


It =β20 + β21Yt + β22Yt −1 + u 2t
Yt = Ct + It + Gt

其中,C=消费支出,I=投资指出,Y=收入,G=政府支出; Gt 和Yt −1 是前定变量。

(1)导出模型的简化型方程并判定上述方程中哪些是可识别的(恰好或过度)。

(2)你将用什么方法估计过度可识别方程和恰好可识别方程中的参数。

11.2 考虑如下结果:

OLS: Wˆt =0.276 + 0.258Pt + 0.046 Pt −1 + 4.959Vt R 2 = 0.924


OLS: Pˆt =2.693 + 0.232Wt − 0.544 X t + 0.247 M t + 0.064 M t −1 R 2 = 0.982

TSLS: Wˆt =0.272 + 0.257 Pt + 0.046 Pt −1 + 4.966Vt R 2 = 0.920

TSLS: Pˆt =2.686 + 0.233Wt − 0.544 X t + 0.246 M t + 0.064 M t −1 R 2 = 0.981

其中Wt 、 Pt 、 M t 和 X t 分别是收益,价格,进口价格以及劳动生产力的百分率变化(所有百

分率变化,均相对于上一年而言),而Vt 代表未填补的职位空缺率(相对于职工总人数的百

分率)。

试根据上述资料对“由于 OLS 和 TSLS 结果基本相同,故 TSLS 是无意义的。”这一说

法加以评论。

11.3 考虑如下的货币供求模型:

货币需求: M t =
d
β 0 + β1Yt + β 2 Rt + β 3 Pt + u1t

货币供给: M t = α 0 + α1Yt + u 2t
s

其中,M=货币,Y=收入,R=利率,P=价格,u1t , u 2t 为误差项;Y 、R 和 P 是前定变量。

(1) 需求函数可识别吗?

(2) 供给函数可识别吗?

(3) 你会用什么方法去估计可识别的方程中的参数?为什么?

(4) 假设我们把供给函数加以修改,多加进两个解释变量 Yt −1 和 M t −1 ,会出现什么识

别问题?你还会用你在(3)中用的方法吗?为什么?

11.4 如果将中国关于价格、消费、工资的模型设定为

Wt = α 1 + α 2 I t + u1t
C t = β1 + β 2 I t + β 3Wt + u 2t
Pt = γ 1 + γ 2 I t + γ 3Wt + γ 4 C t + u 3t

式中,I 为固定资产投资,W 为国有企业职工年平均工资,C 为居民消费水平指数,P 为价格

指数,C、P 均以上一年为 100%,并且已取得 1992 年—2016 年的有关数据(见表 11.4)。

表 11.4 样本数据
固定资产投资总额 I 国有企业在岗职工 居民消费水平
年份 价格指数 P
(亿元) 平均工资 W(元) 指数 C
1992 8080.1 2930 113.3 106.4
1993 13072.3 3593 108.4 114.7
1994 17042.1 4708 104.6 124.1
1995 20019.3 5553 107.8 117.1
1996 22913.5 6207 109.4 108.3
1997 24941.1 6679 104.5 102.8
1998 28406.2 7579 105.9 99.2
1999 29854.7 8443 108.3 98.6
2000 32917.7 9441 108.6 100.4
2001 37213.5 11045 106.1 100.7
2002 43499.9 12701 107.0 99.2
2003 55566.6 14358 107.1 101.2
2004 70477.4 16445 108.1 103.9
2005 88773.6 18978 108.2 101.8
2006 109998.2 21706 109.8 101.5
2007 137323.9 26100 110.9 104.8
2008 172828.4 30287 109.0 105.9
2009 224598.8 34130 110.3 99.3
2010 251683.8 38359 108.2 103.3
2011 311485.1 43483 109.5 105.4
2012 374694.7 48357.0 109.1 102.6
2013 446294.1 52657.0 107.3 102.6
2014 512020.7 57296.0 107.7 102.0
2015 561999.8 65296.0 107.5 101.4
2016 606465.7 72538.0 107.3 102.0
资料来源:国家统计局网站
(1)该方程组是否可识别?
(2)选用适当的方法估计模型的未知参数?
11.5 设有如下供需模型:

需求函数: Y1t =α 0 + α1Y2t + α 2 Pt + µ1t

供给函数: Y2t =β 0 + β1Y1t + β 2 Pt + β3 Pt −1 + µ2t

式中, Y1t 为需求量; Y2t 为供给量; Pt 为价格指数。

(1)确定模型的内生变量与外生变量。

(2)分别讨论𝛽𝛽1 = 0,𝛽𝛽2 = 0和𝛽𝛽3 = 0的情况下模型的识别状态。

11.6 表 11.5 给出中国 1992—2016 年国内生产总值(Y)、货币供应量(M2)


、政府支出

(G)和固定资产投资(I)的统计数据,
表 11.5 我国 1992-2016 宏观经济数据 (单位:亿元)
国内生产总值 货币和准货币 固定资产投资 政府支出
年 份
(Y) (M2) (I) (G)
1992 27194.5 25402.2 8080.1 3742.2
1993 35673.2 34879.8 13072.3 4642.3
1994 48637.5 46923.5 17042.1 5792.6
1995 61339.9 60750.5 20019.3 6823.7
1996 71813.6 76094.9 22913.5 7937.6
1997 79715 90995.3 24941.1 9233.6
1998 85195.5 104498.5 28406.2 10798.2
1999 90564.4 119897.9 29854.7 13187.7
2000 100280.1 134610.3 32917.7 15886.5
2001 110863.1 158301.9 37213.5 18902.6
2002 121717.4 185007 43499.9 22053.2
2003 137422 221222.8 55566.6 24650
2004 161840.2 254107 70477.4 28486.9
2005 187318.9 298755.7 88773.6 33930.3
2006 219438.5 345577.9 109998.2 40422.7
2007 270232.3 403442.2 137323.9 49781.4
2008 319515.5 475166.6 172828.4 62592.7
2009 349081.4 610224.5 224598.8 76299.9
2010 413030.3 725851.8 251683.8 89874.2
2011 489300.6 851590.9 311485.1 109247.8
2012 540367.4 974148.8 374694.7 125953
2013 595244.4 1106525 446294.1 140212.1
2014 643974 1228374.8 512020.7 151785.6
2015 689052.1 1392278.1 561999.8 175877.8
2016 744127.2 1550066.7 606465.7 187755.2
资料来源:国家统计局网站

试建立中国的收入—货币供应模型

Yt =α 0 + α1M t + α 2 I t + α 3Gt + ε1t

M t =β 0 + β1Yt + β 2 M t −1 + ε 2t

(1)判断模型的识别性。

(2)分别用最小二乘法和二段最小二乘法估计模型。
第十二章 实证项目的计量经济研究
——课程论文分析

计量经济学的基本理论和方法是从对实际经济问题的计量研究中提出来的,这些理论方

法之所以具有生命力,就在于能够用于对实际经济问题的分析。运用计量经济学的基本理论

和方法对实际经济管理问题作具体的计量研究,是学习计量经济学的根本目的,也是计量经

济学重要的教学环节。计量经济学的应用领域十分广泛,研究的方法也多种多样,不可能在

本书中一一列举,但是如何运用计量经济方法去作实证项目研究,还是有某些规律可循的。

在学习计量经济理论与方法的同时,以课程论文的形式对实证项目作一些具体的计量经

济研究,并将其作为计量经济学教学的组成部分,这对于提高学生的素质和能力非常有效。

本章将以计量经济学课程论文为例,对实证项目的计量经济研究的构成要素、基本步骤等提

出建议,对一般原则和常用方法、实证项目选题、文献综述与评价、计量经济建模分析技术、

数据搜集与预处理、课程论文写作等展开讨论。应当强调的是,对实际经济问题计量研究的

方式不存在万能的统一模式,只有具体实践才是学习实证项目计量经济研究的惟一方法。

第一节 实证项目研究的选题

一、问题的提出
计量经济实证研究首要的问题是选题, 选题是确定“做什么和如何开始”的问题。选题

应从实际需要出发,这取决于研究项目的要求和目的。计量经济实证研究要对所分析的经济

问题得出数量上的结论,需要事先对所研究的目标和内在的经济联系有相当的认识,也就是

说要有一定的理论准备和调查研究。作为计量经济学的初学者,选题时可以采用不同的思路:

或是结合已经学习过的经济或管理类的课程,选择需要作实证分析的题目;或是选择经济学

或管理学中值得从数量上加以实证估计和检验的问题;或是虽然别人已经作过理论上的研

究,但缺乏数量上的概念和界线,而又有条件作数量分析的问题。这些都可能成为读者进行

计量经济实证分析选题的目标。

选题是一个不断探索、逐步深化认识,逐步清晰思路的过程,一般可从两个层面去考

虑:首先应确定自己感兴趣的研究领域,例如,
“关于中国利率的研究”
;然后是在所感兴趣

的研究领域中选定具体题目,例如“关于提高住房贷款利率对北京房地产市场的影响分析”。

这是两个不同层面的选题,前者只是在金融问题中的利率研究方面确定一个领域,而后者则

1
是具体化地明确一个要研究的具体问题。选题要有意义,所研究的应是理论上或实践中需要

解决的问题。不能为了研究而研究的“无病呻吟”,也不能只是对已有研究成果的简单重复,

要力图有所创新或者有新意。

具体的研究题目从性质上通常分为两种类型,一类是关于理论验证方面的研究,另一

类是关于实证分析方面的研究,或者是两者的结合。对理论的验证,主要是指对某些已有的

观点、理论、命题等,采用定量分析的手段进行具体验证,看这些理论是否符合观测到的现

实。这里强调的是定量分析的验证,而不是对理论本身的定性分析。例如,在经济学或金融

学的相关课程中,曾学习过有关经济代理行为以及经济变量之间关系的理论、消费的收入决

定理论、投资的决定理论;或者诸如“奥肯定律”以及 MV = TP 的数量式等。选择题目时

就要分析,在这些理论关系中是否存在需要用定量分析手段进行验证的问题?哪些理论是值

得进行定量验证的,以及在定量验证过程中对哪些理论有进一步完善的可能。实证分析研究

主要指运用计量经济分析方法来阐释自己的观点,或者去发现新的结论。例如,关于中国农

村经济问题的讨论中,存在着不同的观点和不同的研究方法,可以运用某地区农村经济的相

关数据进行计量经济研究,并将其结果与已有的观点和方法进行比较分析。

二、研究题目的选择
课程论文的选题具有多样性和灵活性,如下的基本方面可在选题过程中供参考:

(1)选题要有意义,力争有新意(或有所创新)。要尽量选择在经济和社会领域中受到广

泛关注的问题,研究的题目要具体化,不宜空洞。

(2)要明确研究的范围。研究的范围可以是宏观经济领域,例如国民经济的运行、经济

政策的传导机制及评价等;可以是中观方面的,例如,国民经济某个行业的影响度或关联性

分析等;也可以是微观方面的,例如对某企业的管理、财务分析,或对一所大学的学生管理

工作的研究。研究范围的大小,决定了收集数据的范围大小和难易程度。

(3)所选题目的大小要适中。应当充分考虑研究的条件和现实可能性,包括理论把握的

程度、数据获得的难易、计量分析方法的条件、完成项目研究的人力和时间的条件,等等。

(4) 要充分考虑数据来源的可能性。没有变量数据来源的模型是不可能进行具体计量研

究的。

三、文献资料的利用、综述与评价
在选题过程中除了自己作深入研究以外,要充分借鉴他人的研究成果。有效地通过文献

信息借鉴他人的成果,才能“站在巨人的肩膀上”;分析别人已经做了什么研究,已经得出

了什么结论,还有什么问题没有解决,便于发现自己应该研究的问题和可能的创新之处;明

2
确哪些是别人的东西,哪些是自己的结论,避免重复别人已经完成的工作,也是尊重别人劳

动与成果的表现。

目前,可供利用的图书资料和文献很多,例如可利用 Journal of Economic Literature(JEL)

采用的分类系统和一些优秀期刊的信息。Journal of Economic Literature 是国内外大多数大学

图书馆必定的季刊杂志,主要提供经过分类的上一季度出版的书籍和期刊文章清单,对每一

篇论文确认一组编号并归类于经济学的某一子领域,按照题目进行编排,甚至包括文章的摘

要,仔细阅读这些摘要,有助于对题目有更多的了解。

(Applied Economics)、
国外的一些杂志,例如《应用经济学》 《应用计量经济学》
(Journal

of Applied Econometrics)、《牛津经济学和统计学评论》(Oxford Bulletin of Economics and

Statistics)、
《国际货币基金成员报告》(International Monetary Fund Staff Papers )等期刊,都具

有极强的应用性导向,比较适合于作为选题的参考。如果在选题的初期只考虑了一个大概范

围,那么这些专业杂志可能有助于缩小论文选题的范围。

利用互联网进行查询,通过搜索可以查询到与关键词或主题相关的内容。从专业化的

角度看,网上经济文献分类体系是很好的关于经济学和其他社会科学分类的搜索引擎。

对收集到的相关文献应注意进行整理和研究。文献综述通常应包括文献的回顾性综述和

文献的评价两个部分。

文献的回顾性综述包括对经济问题研究的综述和对数量分析方法的综述。对经济问题研

究的综述,应侧重于理论研究与实证分析的发展沿革、主要研究流派的观点与论点,包括所

研究经济问题的理论基础、研究对象变化的客观经济规律、主要影响因素的经济机理、计量

模型设定与分析结果的合理性,等等。对数量分析方法的综述,应当特别关注建立计量经济

学模型的基本思路、被解释变量和解释变量的确定、所用数据的类型、数据来源以及测度方

法、估计和假设检验的前提条件与方法,等等。

文献综述是为自己的研究服务的,不能只是文献的简单罗列,不是为了综述而综述,在

综述中要重在对文献的评价。对文献的评价通常可从理论和方法论两个方面展开。从理论方

面,主要是对理论的前提、模型论证推理的逻辑性与合理性等方面进行评价。从方法论方面,

主要考证方法的假设条件、应用范围、应用对象以及实证衡量标准等。对相关文献的研究成

果指出可以借鉴之处和存在的不足,发现尚未涉足的研究领域和问题,给出自己的判定和评

价,努力揭示出自己应该研究的问题和可能的创新之处。对文献的评价具有相当难度,需要

综合运用所学知识和社会实践经验,对相关文献的评价是一种基本的训练。

3
第二节 模型设定与数据处理

一、建模的基本思路
模型设定的本质是在设定的总体回归函数。总体回归函数所体现的实际是经济现象或经

济变量之间的某种客观规律性。作为经济总体运行的客观规律,总体回归函数是客观存在的,

但是在实际的经济研究中总体回归函数通常是未知的,只能根据经济理论和研究者的实践经

验去设定。在计量经济学研究中,“计量”的根本目的是去揭示客观存在的经济数量规律,

也就是要努力寻求更为真实的总体回归函数。模型设定不能太随意,随意设定模型就是随意

去认定客观经济规律,要十分慎重。常用的建模思路,主要有结构模型方法和动态建模方法。

第一章中已经介绍了一般的建模步骤,这是被称为“结构模型方法论”的经典计量经济

学主导的建模思路。其基本要点是:从先验经济理论出发,在理论模型中加上一个满足古典

假设的误差项,然后采用某种统计方法,如普通最小二乘法,进行估计和检验。如果模型通

不过检验,则通过增加变量、删除变量、更换变量、改变函数形式等方式修改模型,重新进

行估计和检验,直到模型通过各种检验为止。这种从少数方程和变量的简单模型入手,经过

不断修改和补充,直至得到一个更为一般的模型,又被称为从“特殊到一般”的建模方法

(simple-to-general approach)。从建模思路上看,这是一种以先验经济理论为建立模型的出

发点、重点关注模型参数的估计、并将参数估计值与其理论预期值是否一致作为判断标准,

以进行不同层次的检验和修正的思路,也称为“理论驱动型”建模思路,在建模中得到普遍

应用。

动态建模方法是将计量经济模型研究的重心从模型估计和检验,转向模型设定方法的探

讨,从统计理论和经济理论两个方面,强调逻辑上的一致性。从统计理论角度,分析设定的

计量经济模型是否与实证数据具有一致性;从经济理论角度,看设定的计量经济模型是否与

经济理论保持了一致性。因此,模型设定过程中的一致性问题是计量经济学研究的中心环节。

动态计量经济学的建模过程,是一个“从一般到特殊”的动态建模过程。首先,建立一个包

含所有信息的最一般模型,以保证随机扰动项为独立同分布的正态变量;其次,对模型参数

加以变化使其向经济理论靠近,并依据各种类型的检验结果,将模型简化为变量和参数都较

少的节俭模型;然后,再对模型进行严格检验;最后,求出模型中内含的长期稳态解,用于

检验经济理论、评价政策和预测未来等。这里需要强调的是,动态建模有着双重含义:一是

对数据分布信息的动态挖掘,二是建模过程中有个不断反思与改进的过程。

4
二、模型设定的要求
模型的建立有理论问题,更为重要的是实践问题。关于建模的依据、变量的选择、模型

形式的确定等在第一章和第九章已经讨论过,只有根据这些原则经过反复调整、反复检验才

能得到较为理想的模型。

一般说来,判别模型优良总有一定的标准,可供参考的标准主要有以下几个方面:

(1)模型应当与数据所表现的现实相一致,这是建模的基本准则。

(2)模型应当与经济理论相一致,当存在若干相矛盾的理论时,一个模型至少应与一种理

论相一致。

(3)模型必须有外生变量构成其回归变量,并且模型中含有明确的因果关系。

(4)模型中的参数应当具有相对稳定性,这是模型能用于预测和政策分析的必备条件,即

估计出的模型参数必须可靠,并具有时不变性,即使将来新数据的协方差与原估算时用的样

本数据的协方差不同了,参数的估计值也应不受影响。

(5)模型必须具有对数据的代表性和优良的拟合性,即由模型算出的内生变量估计值与实

际观测值之差,只是随机误差。所谓随机是指误差值无法由历史数据预测出来,否则就一定

存在强于现有模型的设定形式。例如,随机误差出现序列相关,除了采用某些变通的估计方

法处理序列相关问题以外,还应把序列相关视为模型设定有误的征兆,通常采用扩充滞后回

归变量、重新设定模型的方法来解决。

(6)模型应当具有尽可能大的包容性。当一个模型能够完全解释另一个模型的结论时就称

前者包容后者,包容性是衡量模型优劣的一条重要标准。一个成功的模型,应当不仅仅能反

映数据中所含的规律性,而且还应能解释其他运用同样数据所建立的对立模型的长处与不

足。包容性较强的计量经济模型一般能较好地揭示更普遍的经济规律。

(7)模型的简洁性。从实践上考虑,模型越简洁其自由度也就越大;从认识论上考虑,模

型越复杂人们全盘把握它的困难程度就越大,而且,复杂的设计常常能掩盖设计方案中的纰

漏。简洁性准则迫使模型设计者采取科学的诚实态度。

能满足上述标准的模型,可称为与理论和数据保持一致性的模型。总而言之,计量经济

模型的设定过程,是一个综合考虑经济理论、样本数据、模型特征、使用要求等因素,依据

上述标准进行科学创新的过程。

三、模型变量与函数形式的设定
设定计量经济模型首先要确定模型中的变量。正如第一章已经讨论的,模型变量的选择,

要根据模型的研究目的,要以经济理论为指导,通常不可能把所有的因素都列入模型,而只

5
能抓住主要影响因素和主要特征,而不得不舍弃某些因素。因此根据研究的需要,对变量有

取舍的问题,为避免出现对变量的设定误差,对模型中变量是否恰当需要加以检验。

回归模型的设定除了选择模型中的变量以外,另一重要方面是要使所设定的变量间函数

形式能够体现变量间的基本关系。模型函数形式的设定是对总体回归函数的一种描述,所谓

模型函数形式的设定,是指根据对变量间相互关系的已有认识,把被解释变量 Y 的条件期

望设定为解释变量 X 的某种函数。总体条件期望函数 E (Y | X i ) = f ( X i ) ,可以设定为各种

具体的函数形式,设定的函数形式要尽量体现变量间的基本经济关系。函数形式设定不能太

随意,也不是越复杂越好,过于复杂的模型其经济意义可能不清晰。在计量经济学的实践中,

通常把总体回归函数的具体函数形式设定为初等函数,应当注意的是不同函数形式中参数的

经济意义有较大差异。常用的函数形式如表 12.1 所示。

表 12.1 不同函数形式及参数的意义

边际效应 弹性系数
设定 函数形式 参数 β 2 的意义
( dY dX ) (dY Y ) (dX X )

X dY
线性函数 Y= β1 + β 2 X β2 β2
Y dX

β2 β2 dY
线性对数 Y= β1 + β 2 ln X dX
X Y X

倒数 ( X)
Y= β1 + β 2 1 −
β2
X 2

β2
XY
−X 2
dY
dX
多项式(二 X dY
Y=β1 + β 2 X + β3 X 2 β 2 + 2β3 X ( β 2 + β3 X ) − 2β3 X
次函数) Y dX

X dY
交互作用 Y=β1 + β 2 X + β3 XZ β 2 + β3 Z ( β 2 + β3 Z ) − β3 Z
Y dX
dY
对数线性 lnY= β1 + β 2 X β 2Y β2 X Y
dX

dY
1 β 2Y β2 Y
对数倒数 lnY= β1 + β 2   − − −X
X X2 X dX
X
对数多项
dY
式(对数二 lnY =β1 + β 2 X + β3 X 2 Y ( β 2 + 2β3 X ) X ( β 2 + 2β3 X ) Y − 2β X
3
dX
次函数)

6
双对数(对 dY
Y Y
lnY= β1 + β 2 ln X β2 β2
数对数) X dX
X

 Y  dY
β 2Y (1 − Y ) β 2 X (1 − Y )  1  Y
对数曲线 ln  = β1 + β 2 X  
1−Y   1 − Y  dX

表 12.1 中被解释变量与解释变量的关系许多都是非线性的,其中有的虽然变量间为非

线性的,但对参数而言却是线性的,可直接按对于参数为线性的回归模型去估计与检验;有

的通过初等函数变换就可得到对参数为线性的回归模型。例如:

(1)双对数模型

如果设定的非线性模型为

Yi = β1 X β 2 eu i (12.1)

可通过取自然对数得

ln Yi = ln β1 + β 2 ln X i + ui (12.2)

变换后的模型被解释变量和解释变量都是对数形式,斜率系数 β 2 衡量的是被解释变量

Y 关于解释变量 X 的弹性,即当 X 每变动百分之一时,Y 的均值变动的百分比。

(2)半对数模型

如果设定的非线性模型为

ln Yi = α1 + α 2 X i + ui (12.3)

或者

Yi = β1 + β 2 ln X i + vi (12.4)

其中斜率系数 α 2 衡量的是当变量 X 的绝对量每发生单位变动时,引起被解释变量 Y 平

均值的相对变动比率。斜率系数 β 2 衡量的是当变量 X 变动 1%时,Y 的均值变动的绝对量。

(3)倒数变换模型

如果设定的非线性模型为

Yi = β1 + β 2 (1 X i ) + ui (12.5)

这种模型表示随着 X 的递增 Y 将呈现非线性的递减,但最终以 β1 为渐近线。

对于上述可变换为对参数线性的非线性模型,可以方便地用线性回归的方法去估计和检

7
验模型。除此以外,还有一些通过初等函数不能变换为对参数为线性的回归模型,这类模型

参数的估计面临一些更为复杂的问题,需要探索专门的方法,例如在满足一定的条件下,可

借助于泰勒级数展开来近似线性化,但这已经超出了本书的范围。

四、数据的收集与处理
1、数据来源

最基本的数据主要来自于各种统计年鉴、月报、季报等,如《中国统计年鉴》及各地区

或各部门编制的年鉴、报告等。一些信息类的报刊也经常提供经济数据。

现在许多年鉴等数据已经通过网络对公众提供,这里仅列举出中国国内最常用的一些网

上数据来源:

(1)中国经济信息网(简称中经网,网址:http://www.cei.gov.cn)

(2)中国经济统计数据库(WEB 版):(http://db.cei.gov.cn )是一个综合、有序的庞

大经济数据库群,内容涵盖宏观经济、产业经济、经济专题、区域经济、行业经济、以及世

界经济等各个领域,是一个拥有 15 万指标量,面向社会各界用户提供权威、全面、及时的

经济类数据信息的基础资料库。

(3)国家统计局统计数据网页:http://www.stats.gov.cn/tjsj/

(4)中国人民银行统计数据网页:http://www.pbc.gov.cn/diaochatongji/tongjishuju/

(5)中国证券监督管理委员会统计数据网页:http://www.csrc.gov.cn/cn/statinfo/

当所研究的问题无法从公众信息渠道获得时,则需要通过专门组织的调查去获取数据,

这当然会面对很多困难。

从各种渠道获取的数据,不能不加分析的拿来就用,一定要注意数据的意义是否与自己

研究中所选变量的定义相符合,应当认真分析这些数据的内涵、数据包含的范围、数据的计

算方法、数据所说明的问题、与其他数据的关系等。如果数据与模型中变量的要求或定义不

一致,则应当对数据作必要的加工或调整,或者应当重新寻求符合模型要求的数据。同时,

以价值量表现的数据,通常应剔除价格因素的影响,或是采用可比价格的数据,以消除价格

因素的效应。

2、数据类型

经济数据的类型有多种,不同的数据类型有其自身的性质,需要采用有针对性的估计方

法。在实证项目计量研究中,常用的数据类型包括横截面数据;时间序列数据;混合横截面

数据;面板数据;虚拟变量数据等。

(1)横截面数据

8
横截面数据是变量在固定时间得到的数据,在经济学和其他社会科学领域中得以广泛

应用,特别是在对不同类型经济活动作比较研究时,更适于使用截面数据。在经济学中,横

截面数据分析主要与应用经济领域密切相关,例如地方公共财政、产业组织理论、城市经济

学、劳动经济学、人口与健康经济学等。在检验微观经济假设或评价微观经济政策时,有关

个人、家庭、企业、城市等的横截面数据是至关重要的。

(2)时间序列数据

时间序列数据是变量按时间得到的数据,其重要特征是与时间有相关性。特别是在研究

经济活动发展变化的规律性时,适于使用时间序列数据。应当注意,大多数的经济或其他社

会科学的时间序列数据都存在着近期的相关性,例如,本期 GDP 与上期 GDP 之间在增长趋

势上总是有着相关性,对上期 GDP 增长稳定性的一些了解,会提示本期 GDP 增长趋势的一

定范围。考虑到时间序列数据的时间相关性,要设定时间序列数据模型事先有许多工作要做,

包括平稳性检验、协整分析等,以便更好地解释和利用经济时间序列数据的相互依赖性。

(3)混合横截面数据与面板数据

混合横截面数据(pooled cross section data)是指既有横截面数据特点又有时间序列数

据特征的数据集。面板数据(panel data)是对一组固定调查对象的多次观测得到的数据,

即由横截面上个体在不同时间的重复观测而形成的数据。

(4)虚拟变量数据

正如第八章所讨论过的,虚拟变量数据是由若干人工变量数据组成,包括两水平数据

(0 和 1)、多水平数据(1,2,3,4)等。虚拟变量数据可为解释变量数据,也可为被解释

变量数据。不同的虚拟变量数据有着不同的特征和不同的分析方法。

3、数据处理

在实际使用数据估计模型之前,需要对数据作预处理,对数据进行一些检查和分析,初

步把握样本数据的一些统计特征,包括描述性统计、平稳性检验、协整分析和因果关系分析

等,其目的是对这些数据的统计特征有所了解,便于计量经济学建模分析。

(1)数据的描述性统计

描述性统计主要分为图解分析、基本统计量和若干相关性的分析。

图解分析是指对数据的观测值绘制图形,从图中可以得到一些有价值的信息,例如识

别数据的非正常值;识别被解释变量和解释变量之间的依存关系等。若为时间序列图形,则

可以了解到变量的时间路径和基本增长率;若为被解释变量和解释变量之间散布图,则可查

看是否存在非线性关系,以初步选择条件期望方程的具体形式。应当指出的是,图解分析虽

9
然直观,但也可能会产生误导,原因在于图解分析只是建立在样本数据的基础上,图中的形

状并不能保证两个变量之间依存关系的真实性。例如,若图形显示两个变量为非线性关系,

但这种非线性的关系可能并不真实,因为图形的非线性可能是由于第三个变量的变动而引起

的。也就是说,没有在其它变量保持不变的条件下来观测两个变量之间的图形。因此,图解

法只是对变量进行初步了解,而更重要的是根据相关理论去设定总体回归函数,并进行相应

的模型设定检验。

数据的基本统计量,包括最小值、最大值、均值、标准差、峰度、偏态、变异系数、

相关系数等。这些统计量在计量经济分析中常有其特定的作用,例如,变异系数描述了变量

均值与标准差的比例,若将变异系数较小的变量作为解释变量,这些解释变量的变化不大,

可能会表现出非显著性的特征;又如,峰度、偏态等对分布函数或密度函数的描述有着特殊

的图示作用。再如,在灵敏度分析中通常会采用解释变量的一个标准差变化会引起被解释变

量多少个标准差的变化等。

相关系数矩阵通常被用以分析模型中变量的相关程度。理想情形是被解释变量与某一

解释变量之间的相关系数的数值较高,而两个解释变量之间的相关系数的数值较低。但也应

注意,虽然解释变量之间相关系数较高会形成多重共线,而较小的相关系数并不意味着一定

不产生多重共线性问题,若解释变量间的相关系数较高时,应事前予以注意。

(2)时间序列数据的处理

如果经济变量采用的数据是时间序列数据,为了避免“伪回归”,应该按第十章的要求

对时间序列变量的平稳性进行单位根检验。如果检验结果表明变量是平稳的,才可以用最小

二乘法去估计模型。如果经检验表明时间序列变量为非平稳,则应进行协整分析,若它们之

间存在协整关系,即两者的线性组合存在平稳关系,说明它们之间存在一个长期稳定的比例

关系。需特别强调,对变量的平稳性检验和对变量之间的协整检验,是利用时间序列变量建

立计量经济模型的先决条件。

在时间序列变量平稳性检验的基础上,还可以运用 Granger 因果检验等方法,对变量间

的因果关系进行检验,进一步验证所建模型对变量间因果关系的设定是否合理。

第三节 计量经济分析

一、模型的估计
设定的模型确定以后,即可用收集的数据去估计模型中的参数。估计方法的选择,要考

虑假定前提,不是越复杂越好。不能盲目追求方法的新颖,应更注重方法对所研究问题的适

10
用性及所运用的条件。在本书讨论的范围内所用的估计方法主要是最小二乘法,事实上 OLS

不仅简便易用,而且在很多情形下都是既简便又适用的估计方法。模型中参数的估计与对模

型的检验通常是个反复的过程,如果模型估计和检验的结果表明模型完全满足古典假定的要

求,模型也通过各项检验,则参数的估计值就是计量的结果。如果经检验发现某些古典假定

不能满足,则应按前几章所讨论的方法对模型加以适当调整,或采用其他估计方法,如加权

最小二乘(WLS)、广义差分、工具变量等方法去估计模型中的参数。

二、 模型的检验
计量经济模型的检验主要包括经济意义的检验、统计推断检验、计量经济学检验、模型

预测检验。此外还有模型的诊断性检验,主要包括对变量的检验、残差检验和稳定性检验。

对变量的检验包括参数约束、遗漏变量、包含无关变量的检验。残差检验包括正态性、ARCH、

White 等检验。模型的诊断性检验中,除了第九章介绍的对设定误差的几种检验以外,有的

检验已超出了本书的范围,这里只对与其他检验有交叉的内容,不加区分地进行讨论。

对计量经济模型的检验,首先要检验所估计的模型参数的数值和符号是否符合特定的经

济意义。如果所估计的参数与经济理论或实际经验的结论不符合,应当分析模型设定是否有

问题,分析是否违反了基本假定。在确认模型、数据、假定、估计方法均无问题的情况下,

应当反思经济理论和经验是否不完备,或许还会发现理论与经验有某些值得创新之处。

对模型的统计推断检验,主要是可决系数的分析、t 检验、F 检验,通过检验分析模型

和各个变量是否显著。若模型或某些变量不显著,则应认真分析其原因,特别是要分析是否

2
违反了某种基本假定条件。估计模型并分析 F 统计量、 R 等可以捕获对被解释变量中变动

百分比的解释信息,t 统计量可能表明所选变量显著性的信息,回归系数的符号可能提供估

计值的经济背景合理与否的信息。关于统计检验中 t 检验和 F 检验的顺序,建议在多元回归

模型中,先进行 F 检验,然后再进行 t 检验 ①。F 检验是对模型整体回归显著性的检验,若

检验结果接受 H0,则检验结束,提示需要重新设置解释变量;若检验结果拒绝 H0,则应进

行 t 检验,以检验每个解释变量回归系数的显著性。在 F 检验和 t 检验过程中,还应注意正

确使用各自的临界值表。在计量经济建模中,F 检验应是右单侧检验,而 t 检验一般是双侧

检验,检验中要注意正确计算各自的自由度,以免错用临界值。具体使用临界值时,一定要

注意所用临界值对概率的定义,防止用错。

模型的计量经济学检验,主要是对多重共线性、异方差性、自相关,以及设定误差的


张晓峒 应用数量经济学,北京:机械工业出版社,2009 年,127~131

11
检验。在对模型的检验中,除了例行的计量经济检验外,要特别注意解释变量与随机扰动项

相关关系的检验,因为在选定了 OLS 作为估计方法后,解释变量与随机扰动项的相关关系

将使参数的 OLS 估计具有不一致性。对解释变量与随机扰动项是否相关的检验,可从模型

设定误差检验入手,因为如第九章所讨论的,各种模型设定误差的最终表现,均为随机扰动

项与解释变量相关。此外,还可检验解释变量的测量误差和联立方程偏倚是否严重,因为解

释变量的测量误差和联立方程偏倚也表现为解释变量与随机扰动项的相关性。通常,若测量

误差和联立方程偏倚问题不严重,则表明解释变量与随机扰动项的相关程度较弱,不会导致

参数估计量较为严重的不一致性。

此外,模型的计量经济学检验中还应考虑对总体回归函数设定的检验,分析设定的条

件期望方程的具体函数形式是否恰当,某些变量是否应该表述为对数形式?某些变量是否只

取水平值还是需要取其平方值?定性因素的引入方式?虚拟变量的选择是否足够?交互效

应的数量分析是否需要?等等。

在模型的计量经济学检验中,对于不同数据类型的模型,通常残差统计检验所关注的

重点有所差异。一般说来,对横截面数据应当着重考证异方差性是否存在;对时间序列数据

应当特别考证自相关性是否存在。但这并不意味着截面数据不会产生自相关,也不表明时间

序列数据不会生产异方差。应当警惕在某些情况下时间序列数据的异方差性,甚至可能比截

面数据更为严重。对时间序列数据的进一步应用需要格外小心。例如,关于方程的估计,所

采用的样本数据是水平值还差分值?若为水平值,是否需要时间趋势变量?或者采用数据的

差分形式是否更为合适?时间序列数据是否需要考虑季节性因素?从动态角度考虑,在分布

滞后模型中滞后期应当如何选择?

显然,在模型检验中不存在什么“通行的模式”
,因为在模型检验的每个阶段都需要进

行大量地判断,并且不同的人所使用的检验方法也不尽相同。鉴于此,某些一般性的建议和

指导原则,可能对于完成实证分析是很有益的。首先,要避免在没有对模型进行更多分析之

前就仓促地给出结论。建议先依据一些经济理论框架,或对一些基本经济行为的理解去分析

模型;其次,运用本书各章介绍的方法对所建模型进行一连串的诊断性检验,以确保所得结

论对模型设定的改变不是太敏感。例如,检验是否应当在模型中加入省略变量、检验是否非

线性、检验是否存在滞后被解释变量等。最后,在若干类似的模型中,运用所选择统计量的

数值来判断某个模型是否优于其它的模型。

三、模型的调整
模型的调整是指对模型检验提出的问题如何予以解决,包括多重共线性、异方差性、自

12
相关性以及模型设定误差、测量误差等。多重共线性、异方差性、自相关性等的弥补措施在

本书相关章节中已进行了详尽地讨论,在实证分析中只是如何灵活运用的问题。例如,若是

发现时间序列数据的模型中存在自相关,则或是重新建立模型,或是采用科克伦-奥克特等

方法进行校正弥补;若是发现在横截面数据模型中存在异方差性,则可采用加权最小二乘法

进行参数估计;若是发现解释变量与随机扰动项之间存在相关性,则应采用工具变量法或二

段最小二乘法估计参数,以避免参数估计的不一致性。

值得注意的是,模型的检验与调整并不是截然分离的,这里只是为了论证方便,人为地

将其分为了两个阶段去说明。模型的估计、检验和调整通常相辅相成,要进行若干次的重复,

即所谓的重新估计、重新检验和重新调整,至到模型满意为止。

四、模型计量结果的分析
经过检验证明所估计的模型是符合要求的,最后应对模型所提供的数量信息作具体的分

析。根据建立模型的目的,可能是经济结构分析、经济预测、政策评价、理论验证,其中经

济结构分析是经济预测、政策评价和理论验证的基础。所谓经济结构分析主要指模型中变量

间的数量规律性,这种数量关系是由所估计的参数体现的,所以应对所估计的参数的数值与

符号的经济意义作具体研究和评价。对实证分析结果的解释力度做出说明,主要体现在对回

归系数的符号、大小以及检验结果的解释方式上。除了一般性的解释,例如回归系数的符号、

大小和统计显著性等外,还可从灵敏度分析、弹性分析等多个角度对回归系数的经济意义进

行说明,也可从不同估计方法差异性比较的角度进行解释。注意,当各解释变量的测度单位

不同时,不能依据各解释变量回归估计系数的大小进行相对重要性的直接比较,而应在将模

型中全部变量标准化的基础上,方可进行各回归系数重要性的比较。

五、研究结果的报告
实证项目的计量经济研究的结论得到以后,应形成研究报告(或课程论文)。研究报告

并没有固定的格式,这里对通常可以包括的内容提供一些建议:

(1)引言

引言包含对所研究问题或研究基本目标的陈述,并说明所研究项目的理论意义或应用价

值所在,以及本项目研究中所得主要结论的简单描述。文献综述和评论可以作为引言的组成

部分,也可单独形成独立的章节。

(2)理论分析与研究思路

主要对所要研究的问题作简要的理论描述,一般没有必要对经济理论进行完整陈述,只

需说明理论上对所研究问题有什么结论,对所提出的有关概念、范畴给出明确的界定和解释。

13
并且从理论上对计量分析的前提条件、基本思路和预计达到的目标作简要说明。此部分的作

用之一,还在于为具体模型形式的设定和解释变量的选择从理论方面提供依据。

(3)计量经济模型与估计方法

对所建的计量经济学模型进行系统全面地论述。主要包括两个方面的内容:一是关于模

型的描述,对整个建模思路进行说明,特别是研究的主要对象(被解释变量)的确定、影响

因素的分析及解释变量的选择、模型函数形式的假设,等等。二是关于推断方法的描述,主

要是所选择的估计和假设检验的方法,指出所用方法与他人所使用的方法有何差别等。

(4)数据及处理

说明数据的来源及对数据所作的加工处理。如果采用了代用数据,应说明代用的理由和

处理方式。对数据进行的描述性统计分析、平稳性检验、协整分析等初步挖掘分析进行说明,

这有利于对所设定的模型形式进行改进和完善。

(5)结果分析

对实证项目计量经济研究结果的分析,包括以规范格式报告回归分析的结果,对估计和

假设检验结果经济意义的解释,关于模型解释力度的讨论等,应当对估计和检验的每个阶段

进行详细的说明。特别应对所得结果的特征与建模前的若干假设和期望值进行比较分析,若

出现了意料之外的结果,则应给出相应的解释。模型的估计、检验和反复调整的所有步骤和

结果都应当有所记录,包括中间的失败经历。

(6)结论

主要是对实证项目研究的结论和观点等进行总结,或者根据计量分析结果提出政策建

议。另外,在结论部分应当包含本项研究的局限性和进一步工作的展望。 ①


在与本书配套的“爱课程”网站上(网址:http://www.icourses.cn/coursestatic/course_4310.html,选“教学
单元/第十五章课程论文”),提供了一些学生完成的计量经济学课程论文的举例,可以供读者参考和讨
论。

14

You might also like