首页 概率论与数理统计第八章

概率论与数理统计第八章

举报
开通vip

概率论与数理统计第八章§8.2单因素方差分析§8.3双因素方差分析§8.4相关关系与回归关系的基本概念§8.1方差分析的概念与基本思想§8.5一元线性回归模型的建立与检验§8.6预测控制与残差分析第八章方差分析与回归分析数理统计§8.7可线性化的一元非线性回归前言第六章和第七章主要讲述了一个正态总体和两个正态总体的有关参数估计和假设检验问题.然而,在生产实际和科学研究中,往往要进行三个或三个以上正态总体的有关参数估计和均值比较问题,所用的统计方法称为方差分析(analysisofvariance).另外,许多实际问题需要了解处于同一研究...

概率论与数理统计第八章
§8.2单因素方差分析§8.3双因素方差分析§8.4相关关系与回归关系的基本概念§8.1方差分析的概念与基本思想§8.5一元线性回归模型的建立与检验§8.6预测控制与残差分析第八章方差分析与回归分析数理统计§8.7可线性化的一元非线性回归前言第六章和第七章主要讲述了一个正态总体和两个正态总体的有关参数估计和假设检验问题.然而,在生产实际和科学研究中,往往要进行三个或三个以上正态总体的有关参数估计和均值比较问题,所用的统计 方法 快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载 称为方差分析(analysisofvariance).另外,许多实际问题需要了解处于同一研究对象一些变量之间的关系,如输入变量与试验指标之间或试验指标之间往往存在着统计因果关系,研究这种关系的统计分析方法称为回归分析(analysisofregression).回归分析的任务是找出反映这种关系的模型,建立相应的经验方程,用于预测、优化和控制.方差分析和线性回归分析在统计模型上都可以统一在一个理论模型——线性模型之中,其参数估计的主要方法是最小二乘法.本章只是初步的介绍线性统计模型的统计思想和方法.©概率统计教研室2012问题的引入例8.1为了比较四种单层皱纹海运集装箱的抗压强度,从每种集装箱中各随机选取6个进行最大抗压试验,获得试验数据如表8.1所示,假设集装箱的抗压强度服从正态分布.试问不同种类的海用集装箱的抗压强度是否有显著差别?若有差异,哪一种抗压强度最高?§8.1方差分析的概念与基本思想表8.1.1四种集装箱最大抗压强度试验数据表(单位:磅)集装箱类型最大抗压强度平均抗压强度1655.5788.3734.3721.6679.4699.4713.082789.2772.5786.9686.1732.1774.8756.933737.1639.0696.3671.7712.2727.1697.234535.1628.7542.4559.0586.9520.0562.02每种集装箱的平均抗压强度代表了该种集装箱的抗压水平,从表中数据可以看出,四种集装箱的平均抗压强度从大到小依次为第2种、第1种、第3种以及第4种,然而,仅凭平均值的差异进行比较是不够的,因为同一种集装箱的抗压强度之间也有差异。如何进行四种集装箱的抗压强度差异性检验?就是四个正态总体均值差异的检验问题。©概率统计教研室2012例8.2设有五种治疗某种疾病的 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 ,其中前四种为常规方案,第五种为新方案,为了比较它们的疗效,将30个病人随机分成5组,每组6人,同组的病人施行同一种治疗方案,表8.2 记录 混凝土 养护记录下载土方回填监理旁站记录免费下载集备记录下载集备记录下载集备记录下载 了病人从开始治疗到痊愈所需的天数.假设病人从开始治疗到痊愈所需的天数服从正态分布.试问不同种类的治疗方案疗效是否有显著差别?若有差异,哪一种治疗方案所需天数最少?表8.1.2五种治疗方案治愈病人所需天数(单位:天)治疗方案治愈所需天数平均治愈所需天数17466355.1729457766.3334663565.00468771087.6756445324.00每种治疗方案的平均治愈所需天数长短代表了该种治疗方案的优劣水平,从表中数据可以看出,五种治疗方案的平均治愈所需天数从短到长依次为第5种、第3种、第1种、第2种以及第4种,然而,仅凭平均治愈所需天数的差异进行比较也是不够的,因为同一种治疗方案的平均治愈所需天数之间也有差异,例如,平均治愈所需天数最短的第5种中治愈所需最长天数6天,而平均治愈所需天数最长的第4种中治愈所需最短天数也为6天.如何进行五种治疗方案的平均治愈所需天数差异性检验?就是五个正态总体均值差异的检验问题。©概率统计教研室2012例8.3一位老师想要检查3种不同的教学方法的效果,为此随机的选取了水平相当的15位学生.把他们分为3组,每组5人,每一组用一种方法教学,一段时间以后,这位老师给这15位学生进行统考,统考成绩见下表.假设学生的考试成绩服从正态分布。试问不同的教学方法的效果是否有显著差别?若有差异,哪一种教学方法的效果最好?教学方法学生统考成绩平均成绩A1756271587367.80A2818568929083.20A3737960758173.60©概率统计教研室2012诸如此类的问题还可以举出很多。抛开其具体的实际背景不论,它们都可以概括和抽象为同一类型数理统计问题:由试验数据对三个或三个以上正态总体的有关参数估计和均值比较,如下图所示。从数理统计角度来看,其实质是判断这些试验数据是否来自同一总体;从实际应用来看就是判断三组或三组以上试验数据产生的背景条件是否一样。以上问题可以归结为同一类数理统计问题:三个或三个以上正态总体的有关参数估计和均值比较问题,其实质是判断这些样本是否来自同一总体?能否使用两个正态总体均值差的两两T检验,例如,对例1来说作四组均值比较,分别进行六次T检验来解决问题呢?答案是不可以。原因:统计学的结论都是在一定的概率意义下接受或者拒绝的,存在犯错误的可能,若要用6次T检验来考察4种集装箱的抗压强度是否存在差异,按照T检验的思想,假设抗压强度相同,对于某一次比较,犯第一类错误的概率为,那末连续6次的两两比较,犯第一类错误的概率就是,如果取,那末在连续6次检验中,犯第一类错误的概率将上升为0.2649。因此,多个均值比较时不宜采用检验作两两比较。如果沿用一个总体、两个总体均值检验中通过构造含有所检验样本均值的统计量分布的方法,来建立多总体均值的检验方法,一般说来是困难的。这里暂且不考虑是否能够建立这样的统计量的分布,即使可以建立含有所以样本均值的统计量分布,要满足解决一般实际问题的需要,就需要给出含有各种均值个数的统计量分布。不难想象,这样的统计量将随均值个数的增加而变得形式复杂,从而使其应用受到影响,更何况还不一定能够建立这种含有多样本均值的统计量的分布。三个或三个以上总体均值比较的问题,英国统计学家费希尔R.A.Fisher于1924年在罗桑斯特试验站(RothamstedExperimentalStation)的一系列研究成果给予很好的解答,提出所谓的方差分析法(AnalysisofVariance,简写为ANOVA)的理论基础,将样本的总变异分解为由研究因素所造成的部分和由随机误差所造成的部分,通过构造服从分布的检验统计量,比较来自于不同部分的变异对上述问题作出统计推断。©概率统计教研室20121.试验指标(Experimentalindicators)用于反映试验效果的试验对象特征称为试验指标。这里所提到的试验指标都是定量的。2.因素(Factors)及其水平(Level)把影响一个试验的指标变化的原因称为因素,因素的不同等级称为水平。单因素试验:在试验中仅考察一个因素的试验。多因素试验:在试验中考察两个或两个以上的因素的试验.这类试验一般可用因素的数目来命名,如二因素试验、三因素试验等.3.处理(Treatment)在一个试验中,把所考察因素的不同水平的组合称为处理,即实施试验的条件。二.方差分析中的术语在单因素试验中,因素的每一个水平称为一个处理,试验因素有几个水平,就相应的有几个处理.在多因素试验中,每个因素可设置若干个水平,各因素不同水平的组合称为处理.处理的数目为各因素水平的乘积.【例8.4】表8.4所示为棉花品种、播期、密度三因素试验的处理设计,其目的是了解不同类型棉花在不同播期和密度下的生产力.表8.4棉花三因素试验处理设计A品种B播期C密度(株/667m2)处理号A1(陆地棉)B1(谷雨)C1(3500)1C2(7000)2C3(10500)3B2(立夏)C1(3500)4C2(7000)5C3(10500)6A2(草棉)B1(谷雨)C1(3500)7C2(7000)8C3(10500)9B2(立夏)C1(3500)10C2(7000)11C3(10500)124.随机误差(RandomError)影响试验指标的原因:可控因素;随机因素.可控因素:试验中所考虑且加以控制的因素.随机因素:试验中未考虑或者未控制的因素(通常作为试验环境,在一个严格控制的试验中,对所有试验单元应该保持一致,但往往由于不可控制因素的影响做不到).处理效应(组间误差):可控因素的不同水平对试验指标的影响,用该因素的不同水平之间的差异来估计.随机误差:随机因素所造成的试验指标的变异称为随机误差,随机误差是指接受某个处理的试验单元的指标的观察值与其理论值之间的差异.在实际中,通过接受同一处理的不同试验单元的变异来估计.注意:在任何一个试验中随机误差是不可避免的,只能通过严格控制试验条件等手段,减少随机误差,使处理效应能更好的表现出来。三、方差分析的基本思想以例8.1为例来说明方差分析的基本思想。由例8.1的试验以及对工业生产所具有的常识可以知道,不同类型的集装箱其试验指标—抗压强度存在差异,并且同一类型的不同集装箱其抗压强度也会有差异。这两种差异产生的原因,前者主要是由于不同类型的集装箱由于其生产条件、原材料、技术 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 等等人为可控或者可辨识的因素的不同造成抗压强度的差异,这就是组间误差,可以通过表8.1中平均抗压强度来估计,后者是除类型外的各种人为不可控的随机因素作用造成的指标的差异,这就是随机误差,可以通过同一类型的不同集装箱的抗压强度之间的差异来度量。那么,如何判断不同种类的海用集装箱的抗压强度是否有差异?若有差异,哪一种抗压强度最高?R.A.Fisher创立的方差分析是解决该类问题的有力工具,其直观想法是:对试验数据所显示的差异进行分解,区分出组间误差和随机误差,利用数理统计的相关原理建立适当的统计量,将组间误差与随机误差进行比较,如果组间误差比随机误差大得多,就认为试验数据的差异主要是由集装箱的类型不同所造成的,即不同类型的集装箱其抗压强度有显著差别,否则就认为试验数据的差异主要是由随机误差引起的,即不同类型的集装箱其抗压强度无显著差异。四、方差分析的基本假定1.不同因素对试验指标值的影响作用是加性效应,即试验指标值的变化是各种因素所起作用的累加;2.试验指标服从正态分布;3.试验数据是随机的,并且可控因素不同水平的试验数据方差齐性。§8.2单因素方差分析单因素方差分析:分析单因素对试验指标影响的统计方法称为单因素方差分析.单因素试验按处理的重复次数相等与不相等分为单因素等重复试验与单因素不等重复试验,相应的就有单因素等重复试验的方差分析与单因素不等重复试验的方差分析.1.数据结构一、单因素等重复试验的方差分析表8.5单因素等重复试验资料表因素A试验数据和平均和©概率统计教研室20122.单因素方差分析的统计模型©概率统计教研室2012这里仅讨论固定效应模型。在固定效应模型下,方差分析要解决的问题转化为下列假设检验问题:3.参数估计©概率统计教研室20124.离差平方和与自由度分解总离差平方和A离差平方和e离差平方和总自由度A自由度e自由度©概率统计教研室2012©概率统计教研室20125.方差分析的假设检验原理©概率统计教研室2012方差分析结论为拒绝原假设H0,意味着控制因素A对试验指标的有影响;方差分析结论为不能拒绝H0,意味着现有试验数据不能证明控制因素A对试验指标的有影响.方差来源平方和自由度均方F组间(因素A)SSAa-1SSA/(a-1)MSA/MSe组内(随机误差)SSea(r-1)SSe/a(r-1)总和SSTar-1©概率统计教研室20126.离差平方和的数学期望©概率统计教研室2012©概率统计教研室2012例8.5试对例8.1的试验数据进行方差分析。解:建立统计假设表8.7例8.1的方差分析表变异来源dfSSMSFA集装箱间(A)3127252.99042417.66325.210**F0.05=3.10F0.01=4.94随机误差(e)2033651.5801682.579总和23160904.570例题8.1在饲料养鸡增肥研究中,某饲料研究所提出三种配方:A1以鱼粉为添加料,A2以槐树粉为添加料,A3以苜蓿粉添加料。为比较三种饲料的效果,特选24只相似的雏鸡随机分为三组,每组用一种饲料喂养,60天后测其体重,获数据如下表,试以此数据判定不同饲料是否有差异?饲料A鸡重/g-1000A17396012129281943763610024A210792-101099074122158534222560355A3932980212232294835412531620984113350517791363方差分析表方差来源平方和自由度均方F临界值组间9660.0824830.043.59*3.47组内28215.96211343.62总和37876.0423例8.2以A1,A2,A3,A4四种药剂处理水稻种子,其中A1为对照,每处理各得4个苗高观察值(cm),试由此试验数据判定药剂处理对水稻苗高有无影响。药剂苗高观察值总和Ti平均数A1182120137218A2202426229223A3101517145614A42827293211629T=336=21因此误差平方和可以采用简单的办法计算SSe=SST-SSB=602-504=98进而可得均方:查附表在f1=3,f2=12时,F0.05=3.49,F0.01=5.95实得F>F0.01或P<0.01,说明药剂处理有统计意义。作业:P379习题8:5.6、多重比较法拒绝H0,接受H1,表示总体均数不全相等(至少有两个差异显著)哪些均数两两之间相等?哪些均数两两之间不等?————>需要进一步作多重比较。方差分析结果不拒绝H0:表示拒绝总体均数相等的证据不足,————>分析终止。(1).最小显著差数法(Leastsignificantdifference,简称LSD法)§8.2单因素方差分析©概率统计教研室2012例8.7对例8.1的试验数据利用LSD法进行多重比较。解:建立统计假设©概率统计教研室2012将四种类型的集装箱抗压强度的均数由大到小排序,并将它们的差数算出来,再用LSD检验,其结果如下表所示.例8.7LSD法多重比较表处理Ai均值差数A2756.933194.916**59.700*43.850A1713.083151.066**15.850A3697.233135.216**A4562.017(2)最小显著极差法(LSR法)©概率统计教研室2012LSR法用的检验统计量有Duncan于1955年提出的新复极差法(SSR法)和Tukey于1949年提出的q法.©概率统计教研室2012©概率统计教研室2012例8.8对例8.1的试验数据利用SSR法和q法进行多重比较。解:建立统计假设SSR(k,fe)q(k,fe)k234k234SSR0.052.953.103.18q0.052.953.583.96SSR0.014.024.224.33q0.014.024.645.02LSR0.0549.40151.91353.252LSR0.0549.40159.95166.314LSR0.0167.31970.66872.51LSR0.0167.31977.70184.065©概率统计教研室2012例8.8LSR法多重比较表注意:在保护H0方面,一般来讲,LSR法比LSD法有效,即显著的少了,不显著的多了;q法与SSR法比较,q法更有效。可以说SSR法宽严适中,在实际应用较多中。集装箱型号SSR法q法A2756.933194.916*59.700*43.850194.916**59.70043.850A1713.083151.066**15.850151.066**15.850A3697.233135.216**135.216**A4562.01700©概率统计教研室20123.多重比较法选择(1)试验事先确定比较的标准,凡是与对照相比较,或与预定要比较的对象比较,可选用最小显著差数法LSDa法;(2)根据否定一个正确的H0与接受一个不正确的H0的相对重风险大小来决定。参考以下观点:根据试验的侧重点选择.三种方法显著性的尺度是不相同的,LSD法最低,基于q法的LSD法次之,基于SSR法的LSD法最高,也即对变异的灵敏性LSD法最高,基于q法的LSD法次之,基于SSR法的LSD法最差.故对于试验结论事关重大或有严格要求时用基于q法的LSD法,一般试验可采用基于SSR法的LSD法HSD法.©概率统计教研室20123.多重比较结果的字母表示法首先,将各处理的均值按由大到小,自上而下排列;其次,在最大均值后对应标记英文字母a,并将该均值与排在它下面的均值由上往下比较,直道出现差异显著的均值为止,凡差异不显著的均值后都对应写上a,差异显著均值后对应写上b;再次,将后面对应标有b的均值与排在它上比它大的均值比较,直道出现差异显著的均值为止,凡差异不显著的均值后都对应写上b;最后,将后面标有b的最大均值与排在它下面的还未标记字母的均值自上往下比较,直道出现第一个差异显著的均值为止,凡差异不显著的均值后都对应写上b,差异显著均值后对应写上c,如此重复,直至最小均值后面标上字母.检验水平0.05下,字母用小写,检验水平0.01下,字母用大写.©概率统计教研室20121.单因素等重复试验数据的格式二、单因素不等重复试验的方差分析因素-水平试验数据和平均©概率统计教研室20122.离差平方和与自由度分解计算©概率统计教研室20122.离差平方和与自由度分解计算©概率统计教研室2012方差分析结论为拒绝原假设H0,意味着控制因素A对试验指标的有影响;方差分析结论为接受H0,意味着现有试验数据不能证明控制因素A对试验指标的有影响.方差来源平方和自由度均方F组间(因素A)SSAa-1SSA/(a-1)MSA/MSe组内(随机误差)SSen-aSSe/(n-a)总和SSTn-1©概率统计教研室20123.离差平方和的数学期望©概率统计教研室2012©概率统计教研室2012例8.6为了比较三种饲料的增重效果,选取24头条件基本一致的小猪,每一头小猪只喂一种饲料,下表列出了每种饲料所喂养的小猪在试验期间的增重(kg),试分析饲料对小猪增重的差异显著性.解:建立统计假设饲料号小猪头数rixij(kg)1824.022.524.020.022.023.022.022.52719.019.520.023.519.021.016.53916.016.015.020.514.017.514.515.519.0©概率统计教研室2012例8.6的方差分析表变异来源dfSSMSF临界值饲料间2156.50578.25321.580**F0.01(2,21)=5.78误差2176.1513.626总变异23232.656©概率统计教研室2012例8.5的方差分析表变异来源dfSSMSFA临界值集装箱间(A)3127252.99042417.66325.210**F0.05=3.10F0.01=4.94随机误差(e)2033651.5801682.579总和23160904.570©概率统计教研室2012©概率统计教研室2012例8.9对例8.6的试验数据利用SSR法和q法进行多重比较。解:建立统计假设©概率统计教研室2012例8.8LSR法多重比较表结果表明:三种饲料所喂养的小猪在试验期间的增重有差异,但第一种与第二种的差异未达到极显著水平,而第三种与第一种及第二种的差异达到极显著。饲料号(kg/头)SSR法q法122.56.0**2.7*6.0**2.7*219.83.3**3.3**316.5§8.3双因素方差分析在生产实际或科学研究中,考虑两个可控因素对试验指标作用的试验称为双因素试验,分析双因素对试验指标作用的统计方法称为双因素方差分析。设可控因素为试验指标为,因素在试验中取个不同的水平,即:,其中为因素的第个水平,因素在试验中取个不同的水平,即:,该试验的处理共有个.双因素试验如果每个处理都只做一次,称为双因素无重复试验,如果每个处理都做两次或两次以上,则称为双因素有重复试验,双因素有重复试验按每个处理重复数是否相等又分为双因素等重复与双因素不等重复试验两种。本节主要讨论双因素无重复试验与双因素等重复试验的方差分析.一、双因素无重复试验的方差分析1.数据结构因素B数据因素A2.统计模型要求满足可加性,正态性与方差同质性.该模型称为双因素不考虑交互作用方差分析的统计模型。在方差分析统计模型下,方差分析要解决的问题转化为下列假设检验问题:若记,,其意义分别为与试验指标的理论值,于是上面的检验假设等价于其备择假设分别为:存在使,以及存在使,或者存在使以及存在使.若备择假设被接受需要进行多重比较。3.参数估计所以有关系式(8.3.13)的解释为:因为双因素无重复试验没有真正意义上的重复,故只能认为试验没有误差,因而把单次测量值作为真实值(理论值)。同时,由(8.3.12)可得,该试验实际上是把交互作用当作误差,或者说把交互作用与真正意义上的误差合并作为误差处理,因而,当存在交互作用时,两因素无重复试验的分析不会精确。(8.3.13)(8.3.12)4.离差平方和分解(8.3.14)关系式(8.3.14)式两边同时除以得:(8.3.15)与单因素方差分析讨论类似,可以证明,无论,是否成立,总有,,(8.3.16)当成立时(8.3.17)当成立时(8.3.18)当,都成立时(8.3.19),因此,当,成立时,关系式(8.3.16)-(8.3.19)都成立。由柯赫伦定理知,,相互独立。5.假设检验表8.15双因素无重复试验方差分析表方差来源平方和自由度均方F临界值或Sig因素ASSAa-1SSA/(r-1)MSA/MSeMSB/MSe因素BSSBb-1SSB/(b-1)误差SSe(a-1)(b-1)SSe/(a-1)(b-1)总和SSTab-1表8.16小麦品比试验的产量结果(单位:kg)【例8.6】有一小麦品种试验,参试品种有8个:,其中A6为对照品种,在3个地区种植,每个地区小区计产面积为22.2平方米,其产量结果(单位:kg)列于表8.16。解:建立统计假设品种间产量差异不显著;品种间产量差异显著。小区间产量差异不显著;小区间产量差异显著。品种A地区BB1B2B3A110.911.312.2A210.812.314.0A311.112.510.5A49.110.711.1A511.813.914.8A610.110.611.8A710.011.514.1A89.310.412.4表8.17例8.6的方差分析说明参试品种间差异已达到极显著水平.由于品种对比试验的目的是与对照品种比,因而多重比较可用LSD法.这样两品种均数差的标准差为多重比较结果如表8.18所示变异来源dfSSMSF品种间(A)722.2273.1754.337**F0.01(7,14)=4.28区组间(B)219.9229.96113.605**F0.01(2,14)=6.51误差(e)1410.2510.732总和2352.400表8.18参试品种与对照品种产量的差异显著性分析表明:A5与对照有极显著差异,A2与对照有显著差异,A5相对于对照A6来讲,99%的增产区间为;A2相对于对照A6的95%的增产区间为品种A5A2A7A1A3A6A8A413.5012.3711.8711.4711.3710.8310.7010.302.67**1.54*1.040.640.540-0.13-0.53例8.3对于四种不同种源的油松种子,在三种不同土质的土壤上进行育苗试验,两年后测定苗木高度,所得试验数据如表所示。假定试验数据满足正态、等方差条件试在检验水平0.05下,分析种源、土质对油松苗木高度的影响?因素B数据因素A因素BB1B2B3因素AA144534714448.0A237443511638.7A336473311638.7A445483112441.316219214650040.548.036.541.7作业:P379习题8:6.7.©概率统计教研室2012考虑交互作用的双因素方差分析1.考虑交互作用双因素方差分析的数据结构因素B数据因素AB1…Bj…BbA1x111,…,x11r…x1j1,…,x1jr…x1b1,…,x1brA2x211,…,x21r…x2j1,…,x2jr…x2b1,…,x2br………………Aixi11,…,xi1r…xij1,…,xijr…xib1,…,xibr………………Aaxa11,…,xa1r…xaj1,…,xajr…xab1,…,xabr©概率统计教研室20122.考虑交互作用双因素方差分析的统计模型©概率统计教研室2012在考虑交互作用双因素方差分析的固定效应模型下,方差分析要解决的问题转化为下列假设检验问题:©概率统计教研室20123.参数估计4.离差平方和与自由度分解总离差平方和A离差平方和e离差平方和总自由度A自由度e自由度B离差平方和B自由度AXB离差平方和AXB自由度5.方差分析的假设检验原理考虑交互作用双因素方差分析表6.离差平方和的数学期望类似于单因素离差平方和数学期望的证明,有以下结论:方差来源平方和自由度均方F临界值或Sig因素ASSAa-1SSA/(a-1)MSA/MSeMSB/MSeMSAXB/MSe因素BSSBb-1SSB/(b-1)AXBSSAXB(a-1)(b-1)SSAXB/(a-1)(b-1)误差SSeab(r-1)SSe/ab(r-1)总和SSTabr-1例8.10有一小麦丰产栽培试验,研究不同施肥与不同土壤类型对小麦产量的影响。选用三种施肥方式A1,A2,A3,三种土壤类型B1,B2,B3,设置3次重复进行试验。试验数据如下表(单位:kg).试分析肥料、土壤以及它们的交互作用对产量的影响。解:这是双因素等重复试验数据分析,建立统计假设H10:施肥间产量差异不显著;H11:施肥间产量差异显著。H20:土壤间产量差异不显著;H21:土壤间产量差异显著。H30:互作引起的差异不显著;H31:互作引起的差异显著。施肥方式(A)土壤类型(B)B1B2B3A121.419.617.621.218.816.620.116.417.5A212.013.013.314.213.714.012.112.013.9A312.814.212.013.813.614.613.713.714.0经计算得其方差分析结果如下表所示。方差分析的结果表明,施肥方式对小麦产量有极显著的影响,土壤类型对小麦产量的影响不显著,土壤与肥料的交互作用对小麦的产量有极显著的影响。对交互作用的影响进行多重比较,结果表明:采用施肥方式A1于土壤类型B1有更突出的增产效果。变异来源自由度离差平方和均方F值临界值施肥方式间2178.10789.05397.228**F0.05(2,18)=3.55土壤类型间23.8071.9032.078F0.01(2,18)=6.01交互作用419.5474.8875.335**F0.05(4,18)=2.93误差(e)1816.4870.916F0.01(4,18)=4.58总和26217.947回归分析的基本概念相关关系与回归关系1.相关关系系统中变量之间的关系因果关系相关关系回归分析相关分析如人的血压Y与年龄X之间的关系,一般来说,年龄越大血压越高,但年龄相同的两个人的血压不一定相等;又如某农作物的亩产量Y与施肥量X之间有一定的关系,但施肥量相同,亩产量却不一定相同.这样的例子在实际中举不甚举.相关关系是两个随机变量之间的平行关系,它们要么互为因果,要么具有共同的因。2.回归关系在相关关系中,如果关心的是容易测定或控制变量X对变量Y的决定作用大小,将X看成一个普通变量,这时就称变量X与Y之间遵从回归关系.3.回归模型与回归方程如果普通变量x与随机变量Y具有回归关系,则Y除过受变量x的作用以外,还受到控制不严格和未知因素的作用.所以,x与Y必满足关系式对于回归模型,显然有回归方程反映了因变量Y随自变量x的变化而变化的平均变化情况.4.回归模型分类5.回归分析研究一个随机变量(应变量)与一个或几个可控变量(自变量或预报因子)之间回归关系,找出回归关系的模型,建立经验回归方程,用于预测、优化和控制,这种统计方法称为回归分析.回归分析主要涉及以下三个基本问题:(1)提供建立具有回归关系的变量之间的数学关系式(称为经验 公式 小学单位换算公式大全免费下载公式下载行测公式大全下载excel公式下载逻辑回归公式下载 )的一般方法;(2)判别所建立的经验公式是否有效,并从影响随机变量的诸变量中判别哪些变量的影响是显著的,哪些是不显著的,优化经验公式;(3)利用所得到的经验公式进行预测、控制和优化.回归分析根据所选模型的性质分为线性回归与非线性回归;根据涉及自变量的个数分为一元回归与多元回归.一元线性回归模型的建立与检验一元线性回归模型一元线性回归方程参数估计及其性质1.最小二乘法(Theleastsquaremethod)2.最小二乘法估计量的统计性质所以,由正态分布的性质有:又由于进而有例8.11为了解我国某地区成年女性身高x与腿长Y之间的关系,在该地区随机选取16名成年女性,测的身高与腿长数据如下表:解:由散点图不难看出腿长Y对身高x的回归关系遵从线性模型,选一元线性回归方程。由样本数据计算得身高x(cm)143145146147149150153154155156157158159160162164腿长y(cm)8885889192939395969897969899100102从而,该地区成年女性腿长Y对身高x的经验回归方程为15.416.317.518.920.021.022.815.817.919.142.4142.6141.3139.6439.7337.3735.3342.4839.3339.92一元线性回归方程的有关检验1.离差平和分解2.回归显著性检验F检验方差来源平方和自由度均方F临界值回归离差平方和U1U/1(n-2)U/QF(1,n-2)剩余离差平方和Qn-2Q/(n-2)总离差平方和LTn-1相关系数检验T检验(a),(f)严格线性关系;(b)正相关关系;(c)负相关关系;(d),(e)线性无关.例8.13试检验例8.12建立的大豆蛋白质含量对脂肪含量的经验回归方程的显著性。解:由例8.12知计算样本相关系数预测、控制与残差分析预测例8.14在某油松林地中,随机抽取10块样地测量其林木平均高与木材蓄积量的资料如下表所示。解:由样本资料计算得林木平均高(m)20222426283032343638木材蓄积(m3)314376436495585615671733755835控制例8.15某大学实验室作混凝土制件强度与水泥用量的关系试验,考察每立方米混凝土水泥用量(单位:kg)对28天后混凝土制件抗压强度(kgf/cm2)的影响,试验数据如下表.由经验知混凝土强度与每立方米混凝土水泥用量具有线性回归关系.以这些试验数据确定使混凝土强度以0.95概率在范围取值,应怎样控制每立方米混凝土水泥用量的范围.水泥用量x150160170180190200210220230240250260制件强度y56.958.361.664.668.171.374.177.480.282.686.489.7残差分析简介(a)说明样本数据方差不齐,随时间坐标增大方差增大;(b)说明模型中应包括线性时间项;(c)说明模型中应包括非线性时间项.(a)说明样本数据满足一元线性回归模型的基本假设;(b),(c),(d)说明样本数据不满足方差齐性条件,且方差随预测值变化而变化;(e),(f)说明样本数据用线性模型拟合不合适.可线性化的一元非线性回归非线性回归常见可线性化非线性回归函数相关指数及非线性回归显著性判断例8.16在某林场随机抽取100株云杉,调查胸径D及树高H,按龄级分组整理得云杉平均胸径与平均树高样本实现如下.平均胸径(cm)1520253035404550平均树高(m)13.517.120.022.124.025.627.028.3x2.70812.99573.21893.40123.55533.68893.80673.9120Y2.60272.83912.99573.09563.17803.24263.29583.3429平均胸径D1520253035404550残差-0.70.30.70.60.40-0.4-0.9所以,幂函数回归关系极显著,可用于预测.
本文档为【概率论与数理统计第八章】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
旋律
几年的财务工作经验,现认财务主管一职!精通各种财务管理软件
格式:ppt
大小:2MB
软件:PowerPoint
页数:0
分类:
上传时间:2018-05-13
浏览量:6