首页 i第九章 设定误差与测量误差

i第九章 设定误差与测量误差

举报
开通vip

i第九章 设定误差与测量误差*第九章设定误差与测量误差计量经济学*引子“绝对收入”消费理论是研究中国城镇居民消费的合理模型吗?为了研究中国城镇居民消费水平,有人依据“绝对收入”消费理论,认为模型可设定为:依据1980-2012年中国城镇居民人均年消费支出Y、城镇居民人均可支配收入X2,模型估计的结果为:*但也有人认为,中国城镇居民的消费不只是决定于当年的可支配收入,“绝对收入”消费理论不一定很适用于中国的城镇居民消费支出的实际,应考虑“相对收入”消...

i第九章 设定误差与测量误差
*第九章设定误差与测量误差计量经济学*引子“绝对收入”消费理论是研究中国城镇居民消费的合理模型吗?为了研究中国城镇居民消费水平,有人依据“绝对收入”消费理论,认为模型可设定为:依据1980-2012年中国城镇居民人均年消费支出Y、城镇居民人均可支配收入X2,模型估计的结果为:*但也有人认为,中国城镇居民的消费不只是决定于当年的可支配收入,“绝对收入”消费理论不一定很适用于中国的城镇居民消费支出的实际,应考虑“相对收入”消费理论以及财富效应的影响,再加入一些其他解释变量。然而上述依据“绝对收入”消费理论模型的可决系数、t检验、F检验都显著,应当如何验证究竟哪种消费理论更加适合于说明中国城镇居民的消费呢?*对模型的设定是计量经济研究的重要环节。前面各章除了对随机扰动项分布的基本假定以外,还强调:假定设定的模型对变量和函数形式的设定是正确地描述被解释变量与解释变量之间的真实关系,假定模型中的变量没有测量误差。但是在实际的建模实践中,对模型的设定不一定能够完全满足这样的要求,从而会使模型出现设定误差。*第九章设定误差与测量误差本章主要讨论:●设定误差●设定误差的检验●测量误差*第一节设定误差本节基本内容:●设定误差及类型●变量设定误差的后果*一、设定误差及类型计量经济模型是研究者对经济变量间因果关系的设想,实际是对总体回归函数的某种设定。所设定的模型如果是个”好”的模型,就能够比较好的 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 现被解释变量的基本特征和变化规律,反之如果模型设定是错误的,对被解释变量的基本特征和变化规律的刻画就会出现偏误。这种由模型设定而导致的偏误,在计量经济学中被统称为设定误差。从误差来源看,设定误差主要包括:①变量的设定误差,包括相关变量的遗漏(欠拟合)、无关变量的误选(过拟合);②模型函数形式的设定误差;③变量数据的测量误差;④随机扰动项设定误差。 *设定误差的类型若所设定的回归模型是“正确”的,主要任务是对所选模型参数的估计和假设检验。但是如果对计量模型的各种诊断或检验仍不能令人满意,这时就应把注意力集中到模型的设定方面,考虑所建模型是否遗漏了重要的变量?是否包含了多余的变量?所选模型的函数形式是否正确?随机扰动项的设定是否合理?关于被解释变量和解释变量的数据收集是否有误差?等等。本节主要讨论的两类变量设定误差:(1)相关变量的遗漏(欠拟合);(2)无关变量的误选(过拟合)。*1.相关变量的遗漏(OmittingRelevantVariables)例如,如果“正确”的模型为 而我们将模型设定为 即设定模型时漏掉了一个相关的解释变量。 这类错误称为遗漏相关变量(“欠拟合”)。*2.无关变量的误选(IncludingIrrevelantVariables)例如,如果“真实模型”为: 但我们却将模型设定为 即设定模型时,多选了一个无关解释变量。这类错误称为无关变量的误选(“过拟合”)。*●数据来源渠道可能不畅。例如,数据很难取得被迫将具有重要的经济意义变量排斥在模型之外。●不知道变量应当以什么确切的函数形式出现在回归模型中。●事先并不知道所研究的实证数据中所隐含的真实模型究竟是什么。设定误差在建模中较容易出现。设定误差的存在可能会对模型形成不良的后果。设定误差的原因*二、变量设定误差的后果当模型设定出现误差时,模型估计结果也会与“实际”有偏误;偏误的性质与程度与模型设定误差的类型密切相关。从实质上看,变量设定误差的主要后果,是一个或多个解释变量与随机扰动项之间存在着相关性,进而影响参数估计的统计特性。*1.遗漏相关变量(欠拟合)偏误采用遗漏了重要解释变量的模型进行估计而带来的偏误,称为遗漏相关变量偏误。设正确的模型为: 正确模型离差形式为:*却对方程进行回归,得: 取期望 *遗漏变量设定误差的后果由此可以看出,的遗漏将产生如下后果。两边取概率极限,有:*1.如果漏掉的与相关,则分别在小样本下求期望、在大样本下求概率极限,有:2.如果与不相关,则的估计满足无偏性与一致性;但这时的估计却是有偏的。即OLS估计量在小样本下有偏,在大样本下非一致。**如果与相关,显然有如果与不相关,也有4.遗漏变量,式中的随机扰动项的方差估计量将是有偏的,即:5.与方差相关的检验,包括假设检验、区间估计,在关于参数的统计显著性方面,都容易导出错误的结论。*(1)若 但实际情形并不完全如此。 可以注意到残差平方和RSS的计算 因此,有可能:*(2)若不相关,有 似乎分别有: 若这两个等式成立,意味着尽管变量,在理论上 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 是有关的变量,但从所选模型中略去似乎也不会导致什么危害。这种认识实际也不正确。*因为 的有偏估计,即使不相关,也有 致使假设检验程序很有可能是可疑的。 必须清楚,一旦根据相关理论把模型建立起来, 再从中删除变量时,一定需要充分地谨慎。*2.包含无关变量偏误定义:模型中包括了不重要的解释变量,即采用误选了无关解释变量的模型进行估计而带来的偏误,称为包含无关变量偏误设正确模型但却估计了如果,则(2)与(1)相同,因此,可将(1)式视为以为约束的(2)式的特殊形式。采用OLS法对(2)进行估计,有:*将(1)式的离差形式代入,整理得:期望和方差:*无关变量的设定误差的后果1.可以证明,(2)式参数的OLS估计量是无偏,且为一致性的。即: 同理,可证明:*2.不是有效估计量: 此结论对也成立。 3.随机误差项的方差的估计仍为无偏估计。 4.通常的区间估计和假设检验程序依然有效,但方差增大,接受错误假设的概率会较高。*(1)遗漏相关变量将导致参数估计量和假设检验有偏且不一致;(2)误选无关变量虽参数估计量具无偏性、一致性,又会损失有效性。(3)注重检验的无偏性、一致性宁愿误选无关变量也不愿遗漏相关变量;(4)注重估计量的有效性,宁愿删除相关变量。通常误选无关变量不如遗漏相关变量的后果严重。因此,模型的设定实际是对偏误与有效进行权衡,偏爱哪一方取决于模型的研究目的。若建模目的只是为了进行预测,最小均方误差则可能是兼顾有效性和无偏性的良好准则。遗漏相关变量和误选无关变量的比较*第二节设定误差的检验本节基本内容:●DW检验●拉格朗日乘数检验●一般性检验*对变量设定误差进行检验必须在经济理论指导下进行,不可抛弃经济理论而进行假设检验。对于是否误选无关变量的检验,只要针对无关变量系数的期望值为零的假设,用t检验或F检验,对无关变量系数作显著性检验即可。对于遗漏变量设定误差的检验有多种方法,例如DW检验、拉格朗日乘数检验、豪斯曼检验、RESET一般性检验等。这里只讨论设定误差的一些最常用的检验方法。*基本 思想 教师资格思想品德鉴定表下载浅论红楼梦的主题思想员工思想动态调查问卷论语教育思想学生思想教育讲话稿 : 遗漏的相关变量应包含在随机扰动项中,那么回归所得的残差序列就会呈现单侧的正(负)相关性,因此可从自相关性的角度检验相关变量的遗漏。 从遗漏变量的模型看,可以认为遗漏变量模型是无遗漏变量模型的一个特例:被遗漏变量的系数为0。一、DW检验*,DW检验的具体步骤1.对回归模型运用OLS法得残差序列2.设定按遗漏解释变量的递增次序对残差序列,进行排序,对排序后的残差序列,计算d统计量:*3.查Durbin-Watson表,若显示存在正自相关,则拒绝原假设,受约束回归模型不成立,存在模型设定误差,否则接受原假设,受约束回归模型成立,模型无设定误差。*对下表的数据设定总生产成本函数,准备使用如下三个备选模型:有(1)为真实模型,试用DW法检验模型设定误差。* 总成本() 产出() 1 193 1 2 226 2 3 240 3 4 244 4 5 257 5 6 260 6 7 274 7 8 297 8 9 350 9 10 420 10****3.模型(3):有=0.716,当时,=0.879,=1.320,显然存在正的自相关,拒绝,表明存在遗漏变量;*二、拉格朗日乘数(LM)检验基本思想:●模型中遗漏的相关变量包含在随机扰动项中,因此随机扰动项或回归所得的残差序列应与遗漏的相关变量呈现出某种依存关系。●因此,可以进行残差序列关于相关变量的回归。在一定显著水平下,若相关变量对残差序列的影响具有统计显著性,则认为存在遗漏变量形成的设定偏误;若相关变量的影响不具有统计显著性,则认为没有遗漏变量形成的设定误差。*具体步骤1.对存在遗漏变量设定偏误的模型(受约束回归模型)进行回归,得残差序列;2.用残差序列对全部的解释变量(包括遗漏变量)进行回归,得可决系数;3.设定:受约束回归模型:无约束回归模型。在大样本情况下,构造检验统计量,渐近地遵从(约束个数)4.进行显著性检验的判断:若(约束个数),则拒绝,认为受约束模型不成立,存在遗漏变量;否则,接受,认为受约束模型成立,无遗漏变量。三、一般性检验(RESET)一般性检验(regressionerrorspecificationtest,RESET)是拉姆齐(Ramsey)于1969年提出的一种检验方法。基本思想:如果事先知道遗漏了哪个变量,只需将此变量引入模型,估计并检验其参数是否显著不为零即可,可是问 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 是并不知道遗漏了哪个变量,这时可寻找一个替代变量Z来进行上述检验。* RESET检验中,替代变量Z通常选用所设定模型被解释变量拟合值Ŷ若干次幂的线性组合。 若模型估计所得的残差包含着遗漏的相关变量,那么这个残差可用被解释变量拟合值Ŷ的线性组合近似表示; 若这个线性组合的影响是显著的,则认为原模型的设定有误。 由于可引入若干个替代变量去判断是否有多个变量被遗漏,所以该方法被称为一般性设定偏误检验。*RESET检验的基本步骤第1步:对模型进行回归,用OLS法估计*分别得到Yi的拟合值和残差ei。若残差ei与拟合值之间存在某种函数关系,则可用拟合值若干次幂的线性组合充当工具变量;第2步:用被解释变量Yi的拟合值的线性组合,测度残差中是否包含着遗漏的相关变量。具体做法为,在第1步的模型中增加一个包含拟合值的函数。这个函数通常选择为拟合值的平方、立方和四次方的线性组合。*例如,对进行估计。第3步:构造原假设:。然后用F统计量进行检验。F检验统计量为:本例中,F统计量为:若F统计值大于F临界值,则拒绝原假设,表明存在某种形式的设定误差问题。 usenerlove.dta,clear quireglntclnqlnpllnpklnpf linktest//连接检验 estatovtest//Ramsey’RESET检验 genlnq2=lnq^2 reglntclnqlnq2lnpllnpklnpf linktest estatovtest*第四节 案例 全员育人导师制案例信息技术应用案例心得信息技术教学案例综合实践活动案例我余额宝案例 分析以本章引子中所提出的问题为例,分析“绝对收入”消费理论和“相对收入”以及财富效应等消费理论在中国城镇居民消费水平中的适用性。有人依据“绝对收入”消费理论,认为模型可设定为其中,lnY是城镇居民人均年消费性支出的对数值;lnX2是城镇居民人均年消费性支出的对数值。*也有人认为,“绝对收入”消费理论不一定很适用于中国的城镇居民消费支出的实际,应考虑“相对收入”消费理论以及财富效应的影响。因此,主张考虑将“前一期城镇家庭人均可支配收入”和财富因素的影响也纳入模型中,将模型设定为:其中,lnX3是表征储蓄财富的变量。本案例中是用可以获得的“城乡居民储蓄存款年底余额”作为城镇居民家庭储蓄财富的代表。从中国统计年鉴中可以获得1980年-2012年中国城镇居民人均年消费支出、城镇居民人均可支配收入、城乡居民储蓄存款年底余额等数据如下:* 年份 城镇居民人均年消费支出Y 城镇居民人均可支配收入X2 城乡居民储蓄存款年底余额X3 1980 412.4 477.6 395.8 1981 456.8 500.4 523.7 1982 471 535.3 675.4 1983 505.9 564.6 892.5 1984 559.4 652.1 1214.7 1985 673.2 739.1 1622.6 1986 799 900.9 2238.5 1987 884.4 1002.1 3081.4 1988 1104 1180.2 3822.2 1989 1211 1373.9 5196.4 1990 1278.89 1510.16 7119.6 1991 1453.8 1700.6 9244.9 1992 1671.7 2026.6 11757.3 1993 2110.8 2577.4 15203.5 1994 2851.3 3496.2 21518.8 1995 3537.57 4282.95 29662.3 1996 3919.5 4838.9 38520.8 1997 4185.6 5160.3 46279.8 1998 4331.6 5425.1 53407.5 1999 4615.9 5854 59621.8 2000 4998 6279.98 64332.4 2001 5309.01 6859.6 73762.4 2002 6029.92 7702.8 86910.7 2003 6510.94 8472.2 103617.7 2004 7182.1 9421.6 119555.4 2005 7942.88 10493 141051 2006 8696.55 11759.5 161587.3 2007 9997.47 13785.8 172534.2 2008 11242.85 15780.8 217885.4 2009 12264.55 17174.7 260771.7 2010 13471.45 19109.44 303302.49 2011 15160.89 21809.78 343635.9 2012 16674.32 24565 399551.04*依据表中1980年-2012年的数据,生成新变量lnY和lnX,对模型(1)进行回归,有如下回归结果:1.是否有遗漏变量的检验*回归结果的残差图为:显然,图中显示可能存在自相关,建模时遗漏了重要的相关变量可能是重要的原因。*(1)DW检验模型估计结果的DW=0.9480,表明存在正的自相关。由于遗漏变量了lnX2t-1和lnX3已经是按从小到大的顺序排列,因此,无需重新计算d统计量。对n=33和k’=1,α=0.05的DW统计量的临界值为dL=1.383,dU=1.508。由于DW=0.9480<dL=1.383,,表明式(1)模型显著存在遗漏变量。为了检验城镇居民人均可支配收入的滞后值lnX2t-1和居民家庭储蓄财富lnX3t这2个变量是否为被遗漏的重要变量,按照LM检验步骤,对于式(1)的受约束模型,首先生成其残差序列ei(用EE表示),再用EE对全部解释变量(包括遗漏变量)进行回归,结果如下:*(2)LM检验对于H0:受约束回归模型,查表χ20.025(2)=7.37776,由表中可决系数数据计算,nR2=32∗0.277619=8.8838,显然,nR2=8.8838>7.37776,应拒绝H0:受约束回归模型,即式(1)不合理,可判断存在重要的遗漏变量。**(3)一般性检验在对式(1)回归的基础上,得到R2=0.9994,点击“Forecast”命令,计算Yt的预测值再对下式进行回归:结果为:**由于:查表得F0.05(2,29)=3.32,由F=15.1816>3.32,则拒绝原假设H0:δj=0(j=1,2),表明存在某种形式的遗漏变量设定误差问题。*2.对模型设定的调整为纠正遗漏变量的设定误差,在解释变量中补充lnX2t-1和lnX3t两个解释变量,对模型回归结果如下:*其中,lnX2t-1系数的t检验表明在统计意义上不显著,有可能是冗余变量。若在模型的解释变量中剔除lnX2t-1,再进行如下的校正:回归结果为*(1)DW检验查表得n=33和k’=2,5%的d-统计量的临界值为dL=1.321和dU=1.577。结果提示,DW=1.6144>1.577,DW检验表明不存在正自相关,模型不存在显著的遗漏变量。(2)LM检验残差序列(用EE表示)关于解释变量(包括变量lnX2t-1)的回归,结果为:**由表中的可决系数得到nR2=32∗0.008581=0.274592<χ20.025(1)=5.02389表明应接受H0:受约束回归模型,认为不包括lnX2t-1的受约束模型成立,进而表明变量lnX2t-1的确是冗余变量,不是重要的遗漏变量。(3)一般性检验在对式(3)回归的基础上,得到R2=0.999651。进行如下的回归:回归结果如下:**查表得F0.05(2,28)=3.34,F0.01(2,28)=5.45。由F=3.7674<F0.01(2,28)=5.45,则在α=0.01下,不能拒绝原假设H0:δj=0(j=1,2),表明式(3)的回归不存在某种形式的遗漏变量设定误差问题。经变量设定检验说明,对于研究中国城镇居民消费水平,相对更为合理的模型应当是经多种方法检验无遗漏变量的式(3)。这表明“相对收入”消费理论以及财富效应消费理论对中国城镇居民消费水平更为适用。需要指出的是,在上述建模过程中,主要是从教学的目的出发进行遗漏、冗余变量的讨论,没有考虑通货膨胀因素,也没有考虑时序数据的特殊问题。而在实证分析中,还应对这类问题进行讨论。**第九章小结1.计量经济学模型中的古典假设不是无条件的假设,而是有条件的假设。一是所设定的条件期望方程没有方程设定误差;二是所设定的回归模型没有模型设定误差。2.方程设定误差主要指:(1)真实变量的遗漏;(2)无关变量的引入;(3)解释变量、被解释变量中存在观测误差。此外还有错误函数形式的误设和随机扰动项的非正确设定等。*3.当模型中遗漏了真实的变量时,模型的参数估计是有偏且不一致;参数估计的方差估计不正确,随机扰动项方差的估计也是不正确的,将使得假设检验、区间估计失效。4.当模型包含无关变量,后果不如遗漏变量那么严重,模型的参数估计仍然是无偏且一致的,随机扰动项的方差将被正确估计,但所估计的方差将趋之于过大,从而使得参数估计的有效性降低,参数估计较为不准确,区间估计的精度下降。*5.检验方程设定误差的常用方法有:(1)DW检验;(2)LM检验;(3)Husman检验;(4)RESET检验。6.测量误差分为被解释变量测量误差和解释变量测量误差。测量误差使参数的OLS估计有偏且不一致,常常低估真正的回归参数。*主要公式表*第九章结束了!
本文档为【i第九章 设定误差与测量误差】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_270070
暂无简介~
格式:ppt
大小:2MB
软件:PowerPoint
页数:0
分类:建筑/施工
上传时间:2020-09-18
浏览量:12