首页 256一元线性回归的预测及实例

256一元线性回归的预测及实例

举报
开通vip

256一元线性回归的预测及实例1§2.5一元线性回归分析的应用:预测问题一、条件均值E(Y|X=X0)或个值Y0的预测值的点估计二、总体条件均值与个值预测值的置信区间估计2对于一元线性回归模型给定样本以外的解释变量的观测值X0,可以得到被解释变量的预测值Ŷ0,可以此作为其条件均值E(Y|X=X0)或个别值Y0的一个点估计。注意:严格地说,这只是被解释变量的预测值的估计值,而不是预测值。原因:(1)参数估计量不确定;(样本不同,参数估计量不同)(2)随机项干扰项的影响3Ŷ0是条件均值E(Y|X=X0)的一个无偏估计对总体回归函数E(Y|X=X0)...

256一元线性回归的预测及实例
1§2.5一元线性回归分析的应用:预测问题一、条件均值E(Y|X=X0)或个值Y0的预测值的点估计二、总体条件均值与个值预测值的置信区间估计2对于一元线性回归模型给定样本以外的解释变量的观测值X0,可以得到被解释变量的预测值Ŷ0,可以此作为其条件均值E(Y|X=X0)或个别值Y0的一个点估计。注意:严格地说,这只是被解释变量的预测值的估计值,而不是预测值。原因:(1)参数估计量不确定;(样本不同,参数估计量不同)(2)随机项干扰项的影响3Ŷ0是条件均值E(Y|X=X0)的一个无偏估计对总体回归函数E(Y|X=X0)=0+1X,X=X0时E(Y|X=X0)=0+1X0于是可见,Ŷ0是条件均值E(Y|X=X0)的无偏估计。4对总体回归模型Y=0+1X+,当X=X0时于是Ŷ0是个值Y0的一个无偏估计5举例若根据10个样本数据所建立的家庭可支配收入-消费支出模型为,求家庭可支配收入为6000元时家庭消费支出均值和个值的预测值。解:可得家庭平均消费支出的均值和个值的预测值为将家庭可支配收入代入样本回归函数6总体条件均值预测值的区间估计1、总体均值预测值的区间估计区间估计思想:构造一个已知概率的统计量(如t分布的统计量)该统计量包含Y0的总体均值,该统计量的其它参数都能由样本估计出来,再将该统计量取值的置信区间转化为Y0总体均值的置信区间问题:给定显著性水平,如何构造总体均值的1的置信区间?7如何构造统计量?已知于是可以证明因此也服从正态分布和Why?Why?Why?248进而可证故其中Why?Why?9即置信区间的构造过程:等价于易得:进而于是,在1-的置信度下,总体均值E(Y|X0)的置信区间为10举例根据10个样本所建立的家庭可支配收入-消费支出关系模型为,已知=2150,xi2=7425000,yi2=,490020,xiyi=,5769300。请构造家庭可支配收入为6000元时家庭平均消费支出的置信度为95%的置信区间解:根据回归函数,可得:查t分布 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf P371,可得:易得:而11解续:进而,可求得:E(Y|6000)预测值95%的置信区间为即12已知总体个值预测值的区间估计问题:给定显著性水平,如何构造总体个值的1的置信区间则也服从正态分布可证得:因此有:Why?2913其中对于给定的显著性水平由此可得,个别值的置信度为的预测置信区间为Why?或14举例解:根据回归函数,可得:查t分布表P371,可得:易得:而根据10个样本所建立的家庭可支配收入-消费支出关系模型为,已知=2150,xi2=7425000,yi2=,490020,xiyi=,5769300。请构造家庭可支配收入为6000元时家庭消费支出个值的置信度为95%的置信区间15解续:进而,可求得:X0=6000时个别家庭预测值95%的置信区间为即16习题提示:根据10个样本所建立的家庭可支配收入-消费支出关系模型为,已知=2150,xi2=7425000,yi2=,490020,xiyi=,5769300。请构造家庭可支配收入为6000元时家庭消费支出个值和均值的置信度为99%的置信区间17总体均值、个别值的预测置信域预测值的置信域的特征将每个X值的总体均值(个值)95%的置信区间的端点连起来,则得到总体均值(个值)的置信带(域)183.样本容量越大、拟合优度越高,预测置信区间越小2.当解释变量X的取值为X的均值时,预测置信区间的宽度最小,而当X的取值偏离X均值的距离越大,预测置信区间的宽度越大。1.被解释变量总体均值的预测置信区间窄于个别值的预测置信区间why?why?why?预测值的置信域的特征这种变化说明历史的样本回归线的预测能力随着X取值越来越远离均值而显著下降19§2.6实例:时间序列问题一、中国居民人均消费模型二、时间序列问题20一、中国居民人均消费模型例2.6.1(P53)考察中国城镇居民2006年收入与消费支出的关系,下表给出了中国内地31个省区以当年价测算的数据。X:家庭年人均可支配收入;Y:家庭年人均消费支出教材P54页数据出错,X与Y应交换21该组数据是截面数据;1、建立模型拟建立如下一元回归模型Y=0+1X+采用Eviews软件进行回归分析的结果见下表22可写出如下回归分析结果:232、模型检验拟合优度检验:R2=0.9714表明:城镇居民人均消费支出变化的97.14%可由人均可支配收入的变化来解释。242、模型检验变量的显著性检验参数显著性检验的T值:C:268.9497X:0.022760对应的P值:0.30390.0000表明:在5%的显著性水平下,城镇居民的家庭人均可支配收入对家庭人均消费支出有显著的影响。并且斜率项:0<0.714554<1,符合绝对收入假说253、预测X=20000(元)预测值的点估计:如何由上面得到的回归方程预测2006年人均可支配收入在20000元这一档的中国城镇家庭消费支出?26人均可支配收入X的样本均值与样本方差:E(X)=11363.69Var(X)=982.042=10853528在95%的置信度下,E(Y0)的预测区间为:=14572.6429.3或:(14143.3,15001.9)同样地,在95%的置信度下,Y0的预测区间为:=14572.6943.2或(13629.3,15515.8)E(Y0)的区间估计:27一、中国居民总量消费函数:时间序列数据模型例2.6.2(P56)根据1978年-2006年居民实际消费支出Y及实际可支配收入X的时间序列数据,建立Y与X的一元线性回归模型28时间序列数据回归分析的问题时间序列完全可以进行类似于截面数据的回归分析。然而,在现实经济问题中,对时间序列数据作回归,即使两个变量间没有任何的实际联系,也往往会得到较高的可决系数。因为许多经济变量的时间序列往往具有相同的变动趋势,因此具有较高的可决系数。而高可决系数说明Y的变化中可由X的变化解释的部分很大。这就会导致人们误以为X对Y的影响很大。而实际情况并非如此。这种现象被称为“伪回归”或“虚假回归”—把完全没有关系的两个东西硬是扯上因果关系。(详见第八章)29学习要求1.理解:Ŷ0是条件均值E(Y|X=X0)或个别值Y0的一个点估计。2.掌握如何构造条件均值E(Y|X=X0)或个别值Y0的一个区间估计关键掌握以下两个统计量:3.什么是伪回归?30第二章小结31回归分析是什么?与相关关系的区别?回归分析主要包含什么内容?研究一个变量与另一个(一些)变量的统计依赖(因果)关系的计算 方法 快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载 和理论。参数估计、模型和参数的检验、模型应用相关分析:研究变量的相关程度回归分析:研究变量的因果关系基本概念32总体回归函数是什么?线性模型的形式(确定、随机)样本回归函数是什么?在解释变量的给定值下,被解释变量总体均值(期望值)的轨迹在解释变量的给定值下,被解释变量样本均值的轨迹。是对总体回归函数的估计。线性模型的离差和非离差形式(确定、随机)33线性模型参数的最小二乘估计原理正规方程参数估计值OLS估计量的性质(5个)取值最小一元线性模型的估计34基本假定零均值、同方差、序列不相关确定的X方差为正数:对解释变量X的假定(2)对随机干扰项的假定(3)与解释变量不相关:服从正态分布:对模型的假定(1)模型正确35最小二乘估计量i是BLUE(高斯-马尔可夫定理)^掌握线性性和无偏性证明Yi、Yi、0、1都服从正态分布^^^var(0)^var(1)^36最大似然估计(ML)原理参数i估计值(与最小二乘估计量相同)对2的最大似然估计量37矩估计(MM)原理参数i估计值E(i)=0Cov(Xi,i)=E(Xii)=038参数的区间估计如何构造?怎样才能缩小置信区间?(1)增大样本容量(2)提高模型的拟合优度(3)解释变量的值越分散越好39拟合优度检验可决系数的定义?根据:TSS=ESS+RSS,定义:TSS,ESS,RSS的自由度?一元线性模型的检验统计检验变量显著性检验40预测均值和个值预测值的点估计均值预测值的区间估计个预测值的区间估计一元线性模型的检验41计量分析软件运用EViews软件对的线性回归模型进行估计、检验和预测。42练习(1)(1)对回归分析的陈述,错误的陈述是()A.回归分析是因果关系分析。B.回归分析的目的是通过解释变量的已知或设定值,去估计或预测被解释变量的总体均值;C.回归分析是研究一个变量关于另一个(些)变量的依赖关系的计算方法和理论;D.回归分析是非确定变量之间的相关分析。(2)对总体回归函数,正确的描述是()A.在解释变量给定值下,被解释变量总体个值的轨迹;B.在解释变量给定值下,被解释变量总体均值的轨迹;C.在解释变量给定值下,被解释变量样本均值的轨迹;D.在解释变量给定之下,被解释变量样本个值的轨迹;DB43(3)以下说法,错误的是()A.最小二乘估计法对任何数据所得到的估计量都是BLUE的。B.矩估计法的估计原理是随机变量的样本原点矩依概率收敛于总体原点矩C.最大似然估计的原理是估计出来的参数要使得样本出现的概率最大;D.对一元线性回归模型,用OLS、MM和ML法得到的估计参数和相同。A44练习(2)根据23年的数据,得到中国人均GDP(GDPP)与人均消费(CONSP)关系的OLS结果如下:(1)计算(1)、(2)、(3)3处数值,并给出计算步骤(2)根据Eviews结果表,写出样本回归函数表达式(3)请说明变量GDPP参数的检验结果和经济意义。45现代投资分析的特征线涉及如下回归方程:rt=0+1rmt+ut其中,r表示股票或债券的收益率,rm表示有价证券的收益率(用指数表示),t表示时间。在投资分析中,1表示债券的安全系数,用来度量市场的风险程度,即市场的发展对公司的财产有何影响。依据1956-1976年间240个月的数据,可得到IBM(r)股票收益的回归方程如下:rt=0.7264+1.0598rmt+utse:(0.3001)(0.0728)R2=0.4710^(1)解释回归参数的意义。(2)如何解释R2?(3)安全系数1>1的证券称为不稳定证券,建立适当的原假设及备择假设,检验IBM的股票是否是易变股票(=5%)练习(3)46(1)解释回归参数的意义。答:回归方程的截距0.7264表明当rm为0时的股票或债券的收益率,它本身没有经济意义。回归方程的斜率1.0598表明当有价证券的收益率每上升(或下降)1个点将使IBM股票收益率上升(或下降)1.0598个点。(2)如何解释R2?答:R2为可决系数,是度量回归方程拟合优度的指标。它表明该回归方程中IBM股票的收益率47.1%的的变化是由有价证券收益率rm的变化引起的。R2=0.471也表明回归方程对数据的拟合效果不是很好。rt=0.7264+1.0598rmt+utse:(0.3001)(0.0728)R2=0.471047(3)安全系数1>1的证券称为不稳定证券,以11为原假设,检验IBM的股票是否是不稳定股票(=5%)答:建立原假设:11,备择假设:1>1。n=240,查t分布表可得t0.05(240-2)>t0.05()=1.645t=(11)/S1=(1.0591)/0.0728=0.8214<1.645<t0.05(240-2)故接受原假设,拒绝备择假设。说明此期间IBM的股票是稳定证券。rt=0.7264+1.0598rmt+utse:(0.3001)(0.0728)R2=0.4710^^
本文档为【256一元线性回归的预测及实例】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
海洋之子
暂无简介~
格式:ppt
大小:444KB
软件:PowerPoint
页数:47
分类:建造师考试
上传时间:2022-02-09
浏览量:4