首页 数学建模简明教程(党林立)章 (8)

数学建模简明教程(党林立)章 (8)

举报
开通vip

数学建模简明教程(党林立)章 (8)第八章统计回归模型8.1一元线性回归模型8.2多元线性回归模型8.3非线性回归模型  回归分析(RegressionAnalysis)方法是数理统计中最常见的一类方法.该方法利用大量统计数据,建立自变量与因变量之间因果关系的回归方程数学模型.这类模型广泛应用于社会、经济、医学等领域的定量分析和估值、预测.    对于自变量x的每一个值,因变量是一个随机变量y,若x对y的影响是线性的,则可表示为y=β0+β1x+ε,称为一元线性回归模型,其中β0,β1为待定回归系数,ε为随机误差,ε~N(0,σ2).  一元线性回...

数学建模简明教程(党林立)章 (8)
第八章统计回归模型8.1一元线性回归模型8.2多元线性回归模型8.3非线性回归模型  回归分析(RegressionAnalysis)方法是数理统计中最常见的一类方法.该方法利用大量统计数据,建立自变量与因变量之间因果关系的回归方程数学模型.这类模型广泛应用于社会、经济、医学等领域的定量分析和估值、预测.    对于自变量x的每一个值,因变量是一个随机变量y,若x对y的影响是线性的,则可 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 示为y=β0+β1x+ε,称为一元线性回归模型,其中β0,β1为待定回归系数,ε为随机误差,ε~N(0,σ2).  一元线性回归分析的主要任务是:用试验值(样本值)对β0、β1和σ作点估计;对回归系数β0、β1作假设检验;在x=x0处对y做出预测,给出y的区间估计.8.1一元线性回归模型  1.回归系数的最小二乘估计  对于一组观测值(xi,yi)(i=1,2,…,n),利用最小二乘法可得到回归系数.  设记最小二乘法就是选择β0和β1的估计、,使得记则有直线为数据点(xi,yi)(i=1,2,…,n)的回归直线(方程),对于给出的x,可由此方程对y进行预测.  2.σ2的无偏估计  一元线性回归模型中的参数σ2的无偏估计值为:由数据点xi(i=1,2,…,n)可计算因变量y的理论值,观测数据yi(i=1,2,…,n)对数据均值的偏差-可表示为:  式(8.1.1)的第一项是残差,表示随机误差引起的因变量的变化;第二项表示自变量在x=xi时引起的因变量相对于平均值的变化.  对式(8.1.1)两边平方并求和,有:式(8.1.2)记为S=Q+U,称S为总偏差平方和,Q为残差平方和,U为回归平方和.定义,称为决定系数,R称为相关系数(0F1-α(1,n-2)时,拒绝H0,否则就接受H0.  2)t检验法  当H0成立时,故时,拒绝H0,否则就接受H0.  5.预测  用y0的回归值作为y0的预测值,y0的置信水平为1-α的预测区间为.其中,特别地,当n很大且x0在附近取值时,y的置信水平为1-α的预测区间近似为:例1血压与年龄问题:为了研究血压随年龄的增长而升高的关系,调查了30个成年人的血压(收缩压,单位mmHg)如下表,利用这些数据给出血压与年龄的关系,并预测不同年龄人群的血压.  解记血压(因变量)为y,年龄(自变量)为x,画出30个数据点的散点图.直观地,y与x大致呈线性关系,记为y=β0+β1x.  利用一元线性回归模型,由MATLAB计算出结果如下:血压随年龄的变化关系为y=96.86+0.953x,决定系数为0.7123,显示血压与年龄有较强的线性关系.  利用上述回归方程,可预测不同年龄人群的血压规律,如表8-1所示.  表8-1  由表8-1的预测可知,对于50岁的人来说,我们有95%的把握认为其血压(收缩压)在区间[124.5,163.2].    若与因变量y有关联的自变量不止一个,则可建立多元线性回归模型.设影响变量y的主要因素有m个,记为x=(x1,x2,…,xm),则y=β0+β1x1+β2x2+…+βmxm+ε(8.2.1)8.2多元线性回归模型根据n个独立观测数据yi,xi1,…,xim(i=1,2,…,n;n>m),得记则式(8.2.2)可表示为矩阵形式Y=Xβ+ε,利用最小二乘法准则可确定参数,其参数β为:并称为回归平面方程,为经验回归系数.  多元线性回归模型讨论的主要问题是:用试验值(样本值)对未知参数β和σ2作点估计和假设检验,从而建立y与x1,x2,…,xm之间的数量关系;在x1=x01,x2=x02,…,xm=x0m处对y的值作预测与控制,即对y作区间估计.  1.多元线性回归中的检验  首先假设H0:β0=β1=…=βn=0.  1)F检验  当H0成立时,其中,(回归平方和);(残差平方和).  如果F>F1-α(k,n-m-1),则拒绝H0,认为y与x1,x2,…,xm之间显著地有线性关系;否则就接受H0,认为y与x1,x2,…,xm之间的线性关系不显著.  2)R检验  定义为y与x1,x2,…,xm的多元相关系数或复相关系数.由于故用F和用R检验是等效的.  2.多元线性回归中的预测  1)点预测  求出回归方程,对于给定自变量的值,用来预测y*=β0+β1x*1+…+βmx*m+ε.称为y*的点预测.  2)区间估计  y的1-α的预测区间(置信区间)为,其中例1城市公交客运量的回归预测问题.  据相关分析,城市公共交通年客运量y与城市职工人数x1、居民零售额x2、职工年收入x3统计相关.现有北京市1968~1980年的统计数据如表8-2所示,试对2000年该市的城市公交客运量做出预测.    表8-2续表解建立多元线性回归模型,由MATLAB计算回归方程为,表明公共交通年客运量y与城市职工人数x1、居民零售额x2、职工年收入x3具有很高的线性关联性.  根据有关规划,2000年该城市职工人数x1=4.5(百万人),居民零售额x2=15.0(10亿元),职工年收入x3=5.7(10亿元),则预测北京市公共交通年客运量y=58.067(亿次).    在客观现象中,预报量y与自变量x之间存在的关系式往往不是线性的.我们可依据假设或经验,构造特定的函数如多项式、指数函数、三角函数等描述其关系,但其参数的确定和检验目前还无统一方法.下面以Y与x具有多项式关系为例加以说明.8.3非线性回归模型  设变量x,Y多项式关系的回归模型为:Y=β0+β1x+β2x2+…+βpxp+ε其中p是已知的,βi(i=1,2,…,p)是未知参数,ε服从正态分布N(0,σ2).则Y=β0+β1x+β2x2+…+βkxk称为回归多项式.  若令xi=xi(i=1,2,…,k),则多项式回归模型可变为多元线性回归模型.  例1药物疗效的 评价 LEC评价法下载LEC评价法下载评价量规免费下载学院评价表文档下载学院评价表文档下载 与预测问题.  现在得到了美国艾滋病医疗试验机构ACTG公布的两组数据.ACTG320(见建模竞赛题2006)是同时服用zidovudine(齐多夫定)、lamivudine(拉美夫定)和indinavir(茚地那韦)3种药物的300多名病人每隔几周测试的CD4和HIV的浓度(每毫升血液里的数量).利用给定的数据,预测继续治疗的效果,或者确定最佳治疗终止时间(继续治疗指在测试终止后继续服药,如果认为继续服药效果不好,则可选择提前终止治疗).  解数据的完善与规范化:由于病人测试的时间间断性,不同病人的测试间隔、次数不同,以及部分数据缺失,无法对样本数据进行直接处理,需先对数据进行完善与规范化预处理.  先对个别缺失数据严重(测试不足30周)的样本进行删除,最终得到有效样本333个.  考虑到病人体内HIV和CD4两个指标变化的连续性,利用已测周数据对未知周数据进行线性插值,得到所有病人整数周的两个指标数据.  (1)线性插值方法:  如果在不相邻的两周M1和M2内,测量得到CD4的含量为C1和C2,HIV的含量为H1和H2,则在M1和M2之间插入M2-M1个周的数据,即在M1+N(0
本文档为【数学建模简明教程(党林立)章 (8)】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
知识大咖
工程测量教师
格式:ppt
大小:1MB
软件:PowerPoint
页数:54
分类:理学
上传时间:2022-02-23
浏览量:1