首页 一元线性回归标准案例学习教案人教课标版实用学习教案

一元线性回归标准案例学习教案人教课标版实用学习教案

举报
开通vip

一元线性回归标准案例学习教案人教课标版实用学习教案精品文档精品文档精品文档《一元线性回归案例》教案一、教学内容与教学对象分析学生将在必修课程学习统计的基础上,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。二、学习目标、知识与技能通过本节的学习,了解回归分析的基本思想,会对两个变量进行回归分析,明确建立回归模型的基本步骤,并对具体问题进行回归分析,解决实际应用问题。、过程与方法本节的学习,应该让学生通过实际问题去理解回归分析的必要性,明确回归分析的基本思想,从散点图中点的分布上我们发现直...

一元线性回归标准案例学习教案人教课标版实用学习教案
精品文档精品文档精品文档《一元线性回归案例》教案一、教学内容与教学对象 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 学生将在必修课程学习统计的基础上,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。二、学习目标、知识与技能通过本节的学习,了解回归分析的基本思想,会对两个变量进行回归分析,明确建立回归模型的基本步骤,并对具体问题进行回归分析,解决实际应用问题。、过程与方法本节的学习,应该让学生通过实际问题去理解回归分析的必要性,明确回归分析的基本思想,从散点图中点的分布上我们发现直接求回归直线方程存在明显的不足,从中引导学生去发现解决问题的新思路—进行回归分析,进而介绍残差分析的方法和利用的平方来表示解释变量对于预报变量变化的贡献率,从中选择较为合理的回归方程,最后是建立回归模型基本步骤。、情感、态度与价值观通过本节课的学习,首先让显示了解回归分析的必要性和回归分析的基本思想,明确回归分析的基本方法和基本步骤,培养我们利用整体的观点和互相联系的观点,来分析问题,进一步加强数学的应用意识,培养学生学好数学、用好数学的信心。加强与现实生活的联系,以科学的态度评价两个变量的相关系。教学中适当地增加学生合作与交流的机会,多从实际生活中找出例子,使学生在学习的同时。体会与他人合作的重要性,理解处理问题的方法与结论的联系,形成实事求是的严谨的治学态度和锲而不舍的求学精神。培养学生运用所学知识,解决实际问题的能力。三、教学重点、难点教学重点:熟练掌握回归分析的步骤;各相关指数、建立回归模型的步骤;通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法。教学难点:求回归系数,;相关指数的计算、残差分析;了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较。四、教学策略:教学方法:诱思探究教学法学习方法:自主探究、观察发现、合作交流、归纳总结。教学手段:多媒体辅助教学五、教学过程:(一)、复习引入:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。(二)、新课:探究:对于一组具有线性相关关系的数据:x1,y1),(x2,y2),,(xn,yn),我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:aybx()n(xix)(yiy)bi1nx)2(xii1其中x1nxi,y1nniniyi,(x,y)成为样本点的中心.11注:回归直线过样本中心.你能推导出这两个计算公式吗?从我们已经学过的知识知道,截距a和斜率b分别是使Q(,)n(yibxia)2i1取到最小值时,的值.由于n]2Q(,)[yixi(yx)(yx)i1nx)]2{[yixi(y2[yixi(yx)][(yi1nx)]2n[yixi(y2[yixi(yx)](yi1i1注意到n()x)][(yx)]2}x)n[(yx)]2[yixi(yx)](yx)i1n(yx)[yixi(yx)]i1nn(yx)[yixin(yx)]i1i1(yx)[nynxn(yx)]0.nx)]2)2Q(,)[yixi(yn(yxi12nx)2nny)2n(y)2(xi2(xix)(yiy)(yixi1i1i1nnn(xix)(yiy)[(xix)(yiy)]2nn(yx)2(xix)2[i1]2i1(yiy)2nni122i1(xix)(xix)i1i1在上式中,后两项和,无关,而前两项为非负数,因此要使取得最小值,当且仅当前两项的值均为,即有nxiyinxyx.i1,ynxi2nx2i1这正是我们所要推导的公式.下面我们从另一个角度来推导的公式.人教版选修习题1.4A组第题:用测量工具测量某物体的长度,由于工具的精度以及测量技术的原因,测得个数据a1,a2,,an.证明:用这个数据的平均值1nxaini1表示这个物体的长度,能使这个数据的方差1nai)2f(x)(xni1最小.思考:这个结果说明了什么?通过这个问题,你能说明最小二乘法的基本原理吗?证明:由于f(x)1n(xai)2,所以ni1f'(x)2n(xai),ni1令f'(x)0,得x1nai。ni11n是函数f(x)的极小值点,也是最小值点.可以得到,xaini11n这个结果说明,用个数据的平均值ai表示这个物体的长度是合理的,这就是最小二ni1乘法的基本原理.由最小二乘法的基本原理即得定理设xR,xx1x2nxn,则1[(xx1)21[(xx1)2(x(xx2)2(xxn)2]x2)2(xxn)2]s2(*)nn当且仅当xxx1x2xn时取等号.n(*)式说明,xx1x2xn是任何一个实数x与x1,x2,,xn的差的平方的平均数n中最小的数.从而说明了方差具有最小性下面借助(*)式求Q(y1bx1(y1bx1)(y2bx2)(ynny1y2ynbx1x2nn,也即定义标准差的合理性.a)2(y2bx2a)2(ynbxna)2的最小值.bxn)xnybx,由(*)式知,Q[a(y1bx1)]2[a(y2bx2)]2[a(ynbxn)]2[(ybx)(ybx)]2[(ybx)(y2bx)]2112[(xx)b(yy)]2[(x2x)b(yy)]2112nx)2b2nny)2(xi2(xix)(yiy)b(yii1i1i1nn(xix)(yiy)n(xix)2[bi1n]2(yiy)2i12i1(xix)i1nn(xix)(yiy)n(xix)2[bi1n]2(yiy)2i12i1(xix)i1ny)]2n[(xix)(yi(yiy)2i1ni12(xix)i1nnn(xix)2(yiy)2[(xix)(yiy)]2i1i1ni1x)2i1(xinn[(ybx)(ybx)]2nn[(xnx)b(yny)]2ny)]2[(xix)(yii1nx)2i1(xiny)]2[(xix)(yii1nx)2i1(xi(xix)(yiy)xiyinxy当且仅当aybx,且bi1i1时,Q达到最小值nn(xix)2xi22nxi1i1nx)2ny)2ny)]2(xi(yi[(xix)(yii1i1i1.nx)2(xii1nn(xix)(yiy)xiyinxybi1i1,,a是由此得到,nnx)2xi2其中b是回归直线的斜率(xinx2i1i1aybx.截距.借助||a||b|||ab||a|变量间的相关关系中回归直线方程|b|和配方法,我们给出了人教版必修的第二章统计第三节ybxa的一个合理的解释.、回归分析的基本步骤:()()()画出两个变量的散点图求回归直线方程.用回归直线方程进行预报..下面我们通过案例,进一步学习回归分析的基本思想及其应用.、举例:例.从某大学中随机选取名女大学生,其身高和体重数据如表编号身高体重求根据女大学生的身高预报体重的回归方程,并预报一名身高为解:由于问题中要求根据身高预报体重,因此选取身高为自变量作散点图(图.一)的女大学生的体重.,体重为因变量.从图.一中可以看出,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用线性回归方程来近似刻画它们之间的关系.根据探究中的公式()和(?),可以得到b0.849,a?85.712.于是得到回归方程y0849x85.712.因此,对于身高172的女大学生,由回归方程可以预报其体重为y084917285.71260.316().?0.849是斜率的估计值,说明身高每增加个单位时,体重就增加位,这表明体重b与身高具有正的线性相关关系.如何描述它们之间线性相关关系的强弱?在必修中,我们介绍了用相关系数;来衡量两个变量之间线性相关关系的方法.本相关系数的具体计算公式为nxixyiyri1nnx)2y)2(xi(yii1i1当>时,表明两个变量正相关;当<时,表明两个变量负相关.的绝对值越接近,表明两个变量的线性相关性越强;的绝对值接近于时,表明两个变量之间几乎不存在线性相关关系.通常,当的绝对值大于.时认为两个变量有很强的线性相关关系.在本例中,可以计算出..这表明体重与身高有很强的线性相关关系,从而也表明我们建立的回归模型是有意义的.显然,身高172cm的女大学生的体重不一定是.kg,但一般可以认为她的体重接近于..图.一中的样本点和回归直线的相互位置说明了这一点.由于所有的样本点不共线,而只是散布在某一条直线的附近,所以身高和体重的关系可用下面的线性回归模型来表示:ybxae,()这里和为模型的未知参数,是与ybxa之间的误差.通常为随机变量,称为随机误差,它的均值(),方差()D(e)2>.这样线性回归模型的完整表达式为:ybxae,()E(e)0,D(e)2.在线性回归模型()中,随机误差的方差护越小,通过回归直线ybxa()预报真实值的精度越高.随机误差是引起预报值y与真实值之间的误差的原因之一,大小取决于随机误差的方差.另一方面,由于公式()和()中a和b为截距和斜率的估计值,它们与真实值和之间也存在误差,这种误差是引起预报值y与真实值之间误差的另一个原因.思考:产生随机误差项的原因是什么?一个人的体重值除了受身高的影响外,还受许多其他因素的影响.例如饮食习惯、是否喜欢运动、度量误差等.事实上,我们无法知道身高和体重之间的确切关系是什么,这里只是利用线性回归方程来近似这种关系.这种近似以及上面提到的影响因素都是产生随机误差的原因.因为随机误差是随机变量,所以可以通过这个随机变量的数字特征来刻画它的一些总体特征.均值是反映随机变量取值平均水平的数字特征,方差是反映随机变量集中于均值程度的数字特征,而随机误差的均值为,因此可以用方差2来衡量随机误差的大小.为了衡量预报的精度,需要估计护的值.一个自然的想法是通过样本方差来估计总体方差.如何得到随机变量e的样本呢?由于模型()或()中的e隐含在预报变量中,我们无法精确地把它从中分离出来,因此也就无法得到随机变量e的样本.解决问题的途径是通过样本的估计值来估计2.根据截距和斜率的估计公式()和(),可以建立回归方程ybxa,因此y是()中y的估计量.由于随机误差eyy,所以eyy是e的估计量.对于样本点(x1,y1),(x2,y2),,(xn,yn)而言,相应于它们的随机误差为eiyiyiyibxia,i1,2,,n,其估计值为eiyiyiyibxia,i1,2,,n,ei称为相应于点(xi,yi)的残差().类比样本方差估计总体方差的思想,可以用21n21n2i1eiQ(a,b)(n2)n2作为2其中a和b由公式()()给出,(a,b)称为残差平方和().可以的估计量,用2衡量回归方程的预报精度.通常,2越小,预报精度越高.在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.然后,可以通过残差e1,e2,,en来判断模型拟合的效果,判断原始数据中是否存在可疑数据.这方面的分析工作称为残差分析.表一列出了女大学生身高和体重的原始数据以及相应的残差数据.编号身高体重残差e我们可以利用图形来分析残差特性作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.图.一是以样本编号为横坐标的残差图.从图.一中可以看出,第个样本点和第个样本点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的错误.如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因.另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.另外,我们还可以用相关指数R2来刻画回归的效果,其计算公式是:nyi)22(yiR1i1ny)2(yii1显然,R2取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率.R2越接近于,表示回归的效果越好(因为R2越接近于,表示解释变量和预报变量的线性相关性越强).如果对某组数据可能采取几种不同的回归方程进行回归分析,也可以通过比较几个R2,选择R2大的模型作为这组数据的模型.在例中,R2.,表明“女大学生的身高解释了%的体重变化”,或者说“女大学生的体重差异有%是由身高引起的”.用身高预报体重时,需要注意下列问题:.回归方程只适用于我们所研究的样本的总体.例如,不能用女大学生的身高和体重之间的回归方程,描述女运动员的身高和体重之间的关系.同样,不能用生长在南方多雨地区的树木的高与直径之间的回归方程,描述北方干旱地区的树木的高与直径之间的关系..我们所建立的回归方程一般都有时间性.例如,不能用世纪年代的身高体重数据所建立的回归方程,描述现在的身高和体重之间的关系..样本取值的范围会影响回归方程的适用范围.例如,我们的回归方程是由女大学生身高和体重数据建立的,那么用它来描述一个人幼儿时期的身高和体重之间的关系就不恰当(即在回归方程中,解释变量的样本的取值范围为[155cm,170cm〕,而用这个方程计算-70cm时的值,显然不合适.).不能期望回归方程得到的预报值就是预报变量的精确值.事实上,它是预报变量的可能取值的平均值.一般地,建立回归模型的基本步骤为:()确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;()画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);()由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程);()按一定规则估计回归方程中的参数(如最小二乘法);()得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性等等),若存在异常,则检查数据是否有误,或模型是否合适等.例.现收集了一只红铃虫的产卵数和温度之间的组观测数据列于下表:温度产卵数个()试建立与之间的回归方程;并预测温度为时产卵数目。()你所建立的模型中温度在多大程度上解释了产卵数的变化?探究: 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 (学生实施):()选择变量,画散点图。()通过计算器求得线性回归方程y()进行回归分析和预测:≈预测当气温为时,产卵数为个。这个线性回归模型中温度解释了产卵数的变化。困惑:随着自变量的增加,因变量也随之增加,气温为时,估计产卵数应该低于个,但是从推算的结果来看个比个却多了个,是什么原因造成的呢?方案:()找到变量,将转化成;()利用计算器计算出和的线性回归方程:()转换回和的模型:()()计算相关指数≈这个回归模型中温度解释了产卵数的变化。预测:当气温为时,产卵数为个。困惑:比还多个,是否还有更适合的模型呢?方案:()作变换,将yc110c2x转化成(线性模型)。()利用计算器计算出和的线性回归方程:()转换回和的模型:y100.118x1.672()计算相关指数≈这个回归模型中温度解释了产卵数的变化。预测:当气温为时,产卵数为个。解:根据收集的数据作散点图(图.一).在散点图中,样本点并没有分布在某个带状区域内,因此两个变量不呈线性相关关系,所以不能直接利用线性回归方程来建立两个变量之间的关系.根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线yc1ec2x的周围,其中c1和c2是待定参数.现在,问题变为如何估计待定参数c1和c2.我们可以通过对数变换把指数关系变为线性关系.令zlny,则变换后样本点应该分布在直线zbxa(alnc1,blnc1)的周围.这样,就可以利用线性回归模型来建立和之间的非线性回归方程了.由表一的数据可以得到变换后的样本数据表一,图一给出了表一中数据的散点图.从图一中可以看出,变换后的样本点分布在一条直线的附近,因此可以用线性回归方程来拟合.由表一中的数据得到线性回归方程z0.272x3.849.因此红铃虫的产卵数对温度的非线性回归方程为(1)ye0.272x3.849.()另一方面,可以认为图.一中样本点集中在某二次曲线yc3x2c4的附近,其中c3和c4为待定参数.因此可以对温度变量做变换,即令tx2,然后建立与之间的线性回归方程,从而得到与之间的非线性回归方程.表一是红铃虫的产卵数和对应的温度的平方,图.一是相应的散点图.从图一中可以看出,与的散点图并不分布在一条直线的周围,因此不宜用线性回归方程来拟合它,即不宜用二次曲线yc3x2c4来拟合和之间的关系.这个结论还可以通过残差分析得到,下面介绍具体方法.为比较两个不同模型的残差,需要建立两个相应的回归方程.前面我们已经建立了关于的指数回归方程,下面建立关于的二次回归方程.用线性回归模型拟合表一中的数据,得到关于的线性回归方程(2)y0.367t202.543,,拟合的效果越好.由表即关于的二次回归方程为y(2)202.543.()0.367x2可以通过残差来比较两个回归方程()和()的拟合效果.用表示表一中第行第列的数据,则回归方程()和()的残差计算公式分别为(1)(1)e0.272x3.849,ieiyiyiyi1,2,,7;(2)(2)yi0.367x2eiyiyi202.543,i1,2,,7.表一给出了原始数据及相应的两个回归方程的残差.从表中的数据可以看出模型()的残差的绝对值显然比模型()的残差的绝对值小,因此模型()的拟合效果比模型()的拟合效果好.(1)ei(2)ei在一般情况下,比较两个模型的残差比较困难.原因是在某些样本点上一个模型的残差的绝对值比另一个模型的小,而另一些样本点的情况则相反.这时可以通过比较两个模型的残差平方和的大小来判断模型的拟合效果.残差平方和越小的模型一容易算出模型()和()的残差平方和分别为(1)(2)Q1550.538,Q15448.431.因此模型()的拟合效果远远优于模型().类似地,还可以用尸来比较两个模型的拟合效果,越大,拟合的效果越好.由表一容易算出模型()和()的分别约为.和.,因此模型()的效果好于模型()的效果.对于给定的样本点(x1,y1),(x2,y2),,(xn,yn),两个含有未知参数的模型y(1)(2)f(x,a)和yg(x,b),其中和都是未知参数.可以按如下的步骤来比较它们的拟合效果:(1)(2)()分别建立对应于两个模型的回归方程别是参数和的估计值;yf(x,a)与yg(x,b),,其中a和b分(1)n(1))2与Q(2)n(2))2()分别计算两个回归方程的残差平方和Q(yiyi(yiyi;i1i1(1)(2)(1)(2)(1)f(x,a)的()若QQ,则yf(x,a)的效果比yg(x,b)的好;反之,y(2)g(x,b)的好.效果不如y例:(提示后做练习、作业)研究某灌溉渠道水的流速与水深之间的关系,测得一组数据如下:水深流速()求对的回归直线方程;()预测水深为。95m时水的流速是多少?解:依题意,把温度作为解释变量,产卵个数作为预报变量,作散点图,由观察知两个变量不呈线性相关关系。但样本点分布在某一条指数函数周围.令,,则此时可用线性回归来拟合因此红铃虫的产卵数对温度的非线性回归方程为.、从上节课的例提出的问题引入线性回归模型:解释变量预报变量随机误差、()相关指数:相关系数(公式),>正相关.<负相关绝对值接近于相关性强接绝对值近于相关性几乎无n22总偏差平方和:yiy13??残差ei=yi-yin24残差平方和yi?1yi5回归平方和=总偏差平方和-残差平方和n2?6回归效果的相关指数R2yiyi11n2yiy1残差分析通过残差判断模型拟合效果判断原始数据是否存在可疑数据、回忆建立模型的基本步骤①例问题背景分析画散点图。②观察散点图,分析解释变量与预报变量更可能是什么函数关系。③学生讨论后建立自己的模型④引导学生探究如果不是线性回归模型如何估计参数。能否利用回归模型通过探究体会有些不是线性的模型通过变换可以转化为线性模型⑤对数据进行变换后,对数据(新)建立线性模型⑥转化为原来的变量模型,并通过计算相关指数比较几个不同模型的拟合效果⑦总结建模的思想。鼓励学生大胆创新。⑧布置课后作业:习题、、复习与巩固:练习:某班名学生的数学和化学成绩如下表所示,对与进行回归分析,并预报某学生数学成绩为分时,他的化学成绩。数学化学解略。练习:某医院用光电比色计检验尿汞时,得尿汞含量()与消光系数的结果如下:尿汞含量消光系数()求回归方程。()求相关指数。解:略。(三)课堂小结.知识梳理:规律小结:()回归直线方程;()样本相关系数;()样本残差分析;()样本指数;()建立回归模型的基本步骤。(四)作业:见〈〈一日一练〉〉(五)课后反思:本节内容对回归分析的探讨过程很精彩,学生讨论很热烈,激发了学生的学习热情。但对残差分析学生只能欣赏它的过程,计算量太大,思维的跳跃性太强!人生最大的幸福,莫过于连一分钟都无法休息零碎的时间实在可以成就大事业珍惜时间可以使生命变的更有价值时间象奔腾澎湃的急湍,它一去无返,毫不流连一个人越知道时间的价值,就越感到失时的痛苦得到时间,就是得到一切用经济学的眼光来看,时间就是一种财富时间一点一滴凋谢,犹如蜡烛漫漫燃尽我总是感觉到时间的巨轮在我背后奔驰,日益迫近夜晚给老人带来平静,给年轻人带来希望不浪费时间,每时每刻都做些有用的事,戒掉一切不必要的行为时间乃是万物中最宝贵的东西,但如果浪费了,那就是最大的浪费我的产业多么美,多么广,多么宽,时间是我的财产,我的田地是时间时间就是性命,无端的空耗别人的时间,知识是取之不尽,用之不竭的。只有最大限度地挖掘它,才能体会到学习的乐趣。新想法常常瞬息即逝,必须集中精力,牢记在心,及时捕获。每天早晨睁开眼睛,深吸一口气,给自己一个微笑,然后说:“在这美妙的一天,我又要获得多少知识啊!”不要为这个世界而惊叹,要让这个世界为你而惊叹!如果说学习有捷径可走,那也一定是勤奋。学习犹如农民耕作,汗水滋润了种子,汗水浇灌了幼苗,没有人瞬间奉送给你一个丰收。藏 关于书的成语关于读书的排比句社区图书漂流公约怎么写关于读书的小报汉书pdf 再多,倘若不读,只是一种癖好;读书再多,倘若不用,只能成为空谈。学习好似一片沃土,只要辛勤耕耘,定会有累累的硕果;如若懒于劳作,当别人跳起丰收之舞时,你已是后悔莫及了。不渴望能够一跃千里,只希望每天能够前进一步,学习的成功与失败原因是多方面的,要首先从自己身上找原因,才能受到鼓舞,找出努力的方向
本文档为【一元线性回归标准案例学习教案人教课标版实用学习教案】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
等雪的鱼
暂无简介~
格式:doc
大小:209KB
软件:Word
页数:15
分类:
上传时间:2022-02-14
浏览量:10