首页 生物统计学第九章单因素方差分析

生物统计学第九章单因素方差分析

举报
开通vip

生物统计学第九章单因素方差分析第九章单因素方差分析One-factoranalysisofvariance用6种培养液培养红苜蓿,每一种培养液做5次重复,测定5盆苜蓿的含氮量,结果如下表(单位:mg)。问用6种不同培养液培养的红苜蓿含氮量差异是否显著?盆号培养方法ⅠⅡⅢⅣⅤⅥ1234519.432.627.032.133.017.724.827.925.224.317.019.49.111.915.820.721.020.518.818.614.314.411.811.614.217.319.419.116.920.8方差分析analysiso...

生物统计学第九章单因素方差分析
第九章单因素方差分析One-factoranalysisofvariance用6种培养液培养红苜蓿,每一种培养液做5次重复,测定5盆苜蓿的含氮量,结果如下 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf (单位:mg)。问用6种不同培养液培养的红苜蓿含氮量差异是否显著?盆号培养方法ⅠⅡⅢⅣⅤⅥ1234519.432.627.032.133.017.724.827.925.224.317.019.49.111.915.820.721.020.518.818.614.314.411.811.614.217.319.419.116.920.8方差分析analysisofvariance-ANOVA 由英国统计学家R.A.Fisher于1923年提出。方差分析是一种特殊的假设检验,是用来判断多组数据之间平均数差异显著性的。  它不同于t检验之处在于:它把所有数据放在一起,一次比较就对所有各组间是否有差异做出判断,如果没有显著性差异,则认为各组平均数相同;如果发现有差异,再进一步比较是哪组数据与其它数据不同。 方差分析中常用基本概念(一)试验指标experimentalindex为衡量试验结果的好坏或处理效应的高低,在试验中具体测定的性状或观测的项目。(二)试验因素experimentalfactor试验中所研究的影响试验指标的因素叫试验因素,常用大写字母A、B、C、…等表示。 单因素试验与两因素或多因素试验。 固定因素与随机因素:是否可控制。(三)因素水平leveloffactor  试验因素所处的某些特定状态或数量等级称为因素水平,简称水平。比如:不同的温度;溶液不同浓度等。(四)重复repeat 在试验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;某一处理实施的试验单位数称为该处理的重复数。本章主要内容第一节单因素方差分析的基本原理第二节  单因素方差分析的基本步骤教学重点: 单因素方差分析的方法教学要求:1.掌握方差分析的概念、作用、基本原理与步骤2.掌握单因素试验资料的方差分析方法第一节 单因素方差分析的基本原理一、线性模型二、固定线性模型三、随机线性模型四、多重比较五、基本假定(一)线性模型linearstatisticalmodel 假设某单因素试验有a个处理,每个处理有n次重复,共有na个观测值。这类试验资料的数据模式如表9-1所示。一、线性模型表9-1单因素方差分析的典型数据模式合计  X1X2X3…Xi…Xa 1  χ11χ21χ31χi1χa1  2χ12χ22χ32χi2χa23χ13χ23χ33χi3χa3………………jχ1jχ2jχ3jχijχajnχ1nχ2nχ3nχinχan合计平均数总体均数处理效应符号文字表述an因素水平数每一水平的重复数第i水平的第j次观察值第i水平所有观察值的和第i水平均值全部观察值的和总平均值第i水平上的子样方差各处理总和、平均数、大总和、总平均数是计算的一级数据,在本章我们采用了黑点符号体系法表示,要注意熟悉和掌握。可以分解为表示第i个处理观测值总体的平均数。为了看出各处理的影响大小,将再进行分解,其中μ表示全试验观测值的总体平均数(overallmean),  是第i个处理的效应(treatmenteffect),表示处理i对试验结果产生的影响。     是试验误差,相互独立,且服从正态分布N(0,σ2)。 该式称为单因素试验的线性统计模型或数学模型。(二) 方差分析的基本思路  将a个处理的观测值作为一个整体看待,把观察值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度,进而获得不同变异来源的总体方差估计值;通过计算这些估计值的适当比值,就能检验各 样本 保单样本pdf木马病毒样本下载上虞风机样本下载直线导轨样本下载电脑病毒样本下载 所属总体均值是否相等。方差分析实质上是关于观测值变异原因的数量分析。二 固定模型fixedmodel  因素固定、效应也固定,反应到线性模型中即为常数.可要求。1.假设 固定模型的零假设为:备择假设为:  故an个观察值的总变异可分解为处理间的变异和处理内的变异两部分。 全部观察值的总变异可以用总均方来度量,处理间变异和处理内变异分别用处理间均方和处理内均方来度量。2.平方和与自由度的剖分总平方和的拆分三种平方和的简便计算公式如下:① 等重复时:② 不等重复时: 在计算总平方和时,资料中的各个观察值要受这一条件约束,总自由度等于资料中观察值的总个数减一,即an-1。总自由度记为dfT,则dfT=an-1。在计算处理间平方和时,各处理均数要受这一条件的约束,故处理间自由度为处理数减1,即a-1。处理间自由度记为dft,则dft=a-1。总自由度的拆分 在计算处理内平方和时,要受a个条件的约束,即,i=1,2,...a。故处理内自由度为资料中观察值的总个数减a,即an-a。处理内自由度记为dfe,则dfe=an-a=a(n-1)。因为na-1=(a-1)+(na-a)=(a-1)+a(n-1)所以dfT=dfA+dfe综合以上各式得:总均方的拆分是通过将总均方的分子──称为总离均差平方和,简称为总平方和(SST),剖分成处理间平方和(SSA)与处理内平方和(SSe)两部分;将总均方的分母──称为总自由度,剖分成处理间自由度与处理内自由度两部分来实现的。处理间均方(处理均方,MSA)  处理内均方(误差均方,MSe)各部分平方和除以各自的自由度便得到总均方、处理间均方和处理内均方,分别记为:MST(或ST2)、MSA(或SA2)和MSe(或Se2),即MST=ST2=SST/dfT;MSt=St2=SSt/dft;MSe=Se2=Sse/dfe注意:在方差分析中不涉及总均方的数值,所以一般不必计算;总均方一般不等于处理间均方加处理内均方。3.期望均方expectedmeansquaresEMS  若A是B的无偏估计,则称B是A的数学期望。处理内均方MSe是误差方差2的无偏估计值,即2称为MSe的数学期望。4.统计量当零假设         成立时,处理效应的方差为零,亦即各处理观察值总体均数i(i=1,2,…,a)相等时,处理间均方MSA与处理内均方一样,也是误差方差2的估计值。方差分析就是通过MSA与MSe的比较来推断各处理平均数间差异的大小.F=MSA2/MSe2F具有两个自由度:df1=dfA=a-1;df2=dfe=a(n-1)。查附表7:若F<,即P>0.05,不能否定H0,可认为各处理间差异不显著;若≤F<,即0.01<P≤0.05,否定H0,接受HA,认为各处理间差异显著,标记“*”;若F≥,即P≤0.01,否定H0,接受HA,认为各处理间差异极显著,标记“**”。【例9.1】某试验研究不同药物对腹水癌的治疗效果,将患腹水癌的25只小白鼠随机分为5组,每组5只。其中A1组不用药作为对照,A2、A3为两个不同的用中药组,A4、A5为两个不同的西药组。各组小白鼠的存活天数如表7—2所示。表9—2用不同药物治疗腹水癌小白鼠的结果药物各小鼠存活天数(xij)合计xi.平均A11516151718816561=1319A2454250383921445796=9254A3303529313516025600=5152A4312820253013417956=3670A5403531323016828224=5710合计x..=75712413725105这是一个单因素试验,处理数a=5,重复数n=5。第一步:计算一级数据(见表);第二步:计算SSe、SSA、dfe、dfA矫正项C=x2../an/(5×5)=22921.96总平方和处理间平方和        =248274-2291.96=1905.44处理内平方和SSe=SST-SSA=2183.04-1905.44=277.60=20总自由度dfT=an-1=25-1=24=5×5-1=24处理间自由度dfA=a-1=5-1=4=4处理内自由度dfe=dfT-dfA=24-4=20=处理间均方MSA=SSt/dfA=1905.44/4=476.36处理内均方MSe=SSe/dfe=277.60/20=13.88第三步:提出假设=24零假设为:H0:各处理组小鼠存活天数差异不显著备择假设为:HA:各处理组小鼠存活天数差异显著第四步:计算统计量F=MSA/MSe=476.36/13.88=34.32**第五步:查表  根据df1=dft=4,df2=dfe=20查附表7,得F0.01(4,20)=4.43第六步:做出推断及生物学解释:  F>F0.01(4,20)=4.43,P<0.01。说明五个处理小白鼠存活天数差异极显著,用不同药物治疗小白鼠腹水癌的疗效是不同的。在方差分析中,通常将变异来源、平方和、自由度、均方和F值归纳成一张方差分析表,见表9—3。表9—3表9—2资料的方差分析表变异来源平方和自由度均方F值处理间SSA1905.44dfA4MSA476.3634.22**处理内SSe277.60dfe20MSe13.88总变异SST2183.04dfT24F值应与相应的被检验因素齐行;在表的左下方注出显著水平α。三、随机模型Randommodel因素随机、效应不固定      是试验误差,相互独立且服从正态分布  不再为常数,且服从正态分布1.假设 随机模型的零假设为:备择假设为: 2.总平方和与总自由度的剖分:同固定模型3.数学期望:4.统计量F:注意:在做生物学解释时,固定模型中的结论只适用于检查的那几个因素水平;随机模型中的结论可推广到这一因素的各个水平。四、多重比较(multiplecomparisons)统计上把多个平均数两两间的相互比较称为多重比较。(一)为什么要进行多重比较?F值显著或极显著,否定了无效假Ho,表明试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异。但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些没有显著差异。因而,有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。(二)常用的多重比较方法多重比较的方法甚多,常用的有最小显著差数法和最小显著极差法。1、最小显著差数法(LSD法,Leastsignificantdifference)1.1LSD法的基本原理在处理间F检验显著的前提下,先计算出显著水平为α的最小显著差数LSDα,然后将任意两个处理平均数的差数的绝对值与其比较,作出结论。 最小显著差数由下式计算:式中为在F检验中误差自由度下,显著水平为α的临界t值,均数差异 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 误则下式算得。其中MSe为F检验中的误差均方,n为各处理内的重复数。显著水平取0.05和0.01时,从t值表查出代入,即可求得LSD0.05和LSD0.011.2LSD法多重比较步骤列出平数的多重比较表,比较表中各处理按其平均数从大到小自上而下排列;计算最小显著差数LSD0.05和LSD0.01;将平均数多重比较表中两两平均数的差数与计算出的LSD0.05、LSD0.01比较,作出统计推断。 【例9.1】dfe=20,n=5,MSe=13.88 查t值表得:t0.05(dfe)=t0.05(20)=2.086,t0.01(dfe)=t0.01(20)=2.845所以显著水平为0.05与0.01的最小的显著差数为:表9-4五个处理小鼠平均存活天数多重比较表(LSD法))处理平均数-16.2-26.8-32.0-33.6A542.826.6**16.0**10.8**9.2**A433.617.4**6.8**1.6A332.015.8**5.2*A226.810.6**A116.2将表9-4中的10个差数与LSD0.05、LSD0.01比较:小于LSD0.05者不显著;介于LSD0.05与LSD0.01之间者显著,标记“*”;大于LSD0.01者极显著,标记“**”。检验结果除差数1.6不显著、5.2显著外,其余各差数极显著。表明所用的药物不论中西药对小白鼠腹水癌都有一定疗效,除中药A3与西药A4的疗效差异不显著外,其余药物间的疗效都有显著或极显著差异。说明:实质上就是t检验法:LSD法是将t检验中把所求得的t的绝对值       与临界值 的比较转化为将各对均数差值的绝对值   与最小显著差数   的比较,从而做出统计推断的.2.Duncan法2.1Duncan法的基本原理把平均数的差数看成是平均数的极差,根据极差范围内所包含的处理数(称为秩次距)k的不同而采用不同的检验尺度(最小显著极差R(α,k)),如果两平均数的极差大于或等于R(α,k),则两平均数间差异显著;如果小于R(α,k)差异不显著,这种方法就称为Duncan法。若xi>xj,k=i-j+1,因此,若有a个平均数相互比较,就有a-1种秩次距(a,a-1,a-2,…,2),因而需求得a-1个R(α,k),以作为判断各秩次距(k)平均数的极差是否显著的标准。2.2检验步骤:列出平均数多重比较表;由自由度dfe、秩次距k查“多重比较中的Duncan表”(附表9),计算最小显著极差R0.05,k和R0.01,k;将平均数多重比较表中的各极差与相应的最小显著极差R0.05,k和R0.01,k比较,作出统计推断。对于【例9.1】,已算出=1.67,依dfe=20,k=2,3,4,5,由附表9查临界r0.05(20,k)和r0.01(20,k)值,乘以,求得各最小显著极差。所得结果列于表9-5。dfe秩次距kr0.05r0.01R0.05R0.012022.954.024.96.733.104.225.27.043.184.335.37.253.254.405.47.3表9-5r值与R值处理平均数-16.2-26.8-32.0-33.6A542.826.0**16.0**10.8**9.2**A433.617.4**6.8*1.6nsA332.015.8**5.2*A226.810.6**A116.2表9-6五个处理小鼠平均存活天数多重比较表(Duncan法)五、基本假定① 效应的可加性(additivity)② 分布的正态性(normality)③ 方差的同质性(homogeneity)方差分析的基本步骤1.计算各项平方和与自由度。2.列出方差分析表,进行F检验。3.若F检验显著,则进行多重比较。多重比较的方法有最小显著差数法(LSD法)和Duncan法。第二节 单因素方差分析的基本步骤一、各处理重复数相等的方差分析【例9.2】为了研究小白鼠患白血病后脾组织中DNA含量的变化,测定四组,每组各8只(即a=4,n=8)小白鼠脾组织中DNA的含量;第1组为正常脾,第2组为患自发性白血病的脾;第3组为患移植性白血病AK4的脾;第4组为患移植性白血病9421的脾。测定结果见表9—7。试检验各组DNA含量差异是否显著。    表9—7四组小白鼠脾组织中DNA含量1.计算各项平方和与自由度C=x2../an=398.12/(4×8)=4952.61组别DNA含量(mg/g)xi.xi.2112.313.213.715.215.816.917.315.4119.814.981815.9614352.04210.811.612.312.713.513.514.813.6102.812.851332.2810567.8439.310.311.111.711.712.012.312.490.811.351038.628244.6449.510.310.510.510.510.911.011.584.710.59899.157174.09合计x..=398.15086.0140338.61SSe=SST–SSA=133.40-89.72=43.68dfT=an-1=4×8-1=31dfA=a-1=4-1=3dfe=dfT-dfA=31-3=282.列出方差分析表,进行F检验,见表9—8。表9—8四组小白鼠脾中DNA含量方差分析表变异来源平方和自由度均方F值组间89.72329.9119.17**组内43.68281.56总变异133.4031根据df1=dfA=3,df2=dfe=28查临界F值得:F0.05(3,28)=2.95,F0.01(3,28)=4.57因为F>F0.01(3,28),即P<0.01,表明处理间DNA含量的差异达到1%显著水平。3.多重比较采用Duncan法。各处理平均数多重比较表,见表9—9。因为MSe=1.56,n=8,所以根据dfe=28,秩次距k=2,3,4由附表9查出α=0.05和α=0.01的各临界r值,各r值乘以,即得各最小显著极差。所得结果列于表9-10。表9—9r值及LSR值dfe秩次距kr0.05r0.01R0.05R0.012822.903.911.2821.72833.044.081.34421.80343.134.181.38331.848组别平均数-10.59-11.35-12.85114.984.39**3.63**2.13**212.852.26**1.50*311.350.76410.59平均数表9—10各组DNA含量平均数多重比较表检验结果表明:正常脾中DNA含量极显著高于患有各类白血病脾中DNA含量;患自发性白血病脾中DNA含量极显著高于患移植性白血病9421,显著高于患移植性白血病AK4;第三组第四组之间差异不显著。四组中以正常脾DNA含量最高,第二组次之,第三、四组最低。也就是说各类白血病都将导致小白鼠脾中DNA含量明显降低。组别平均数432114.984.39**3.63**2.13**212.852.26**1.50*311.350.76410.59二、各处理重复数不相等的方差分析这种情况下方差分析步骤与各处理重复数相等的情况相同,只是在有关计算公式上略有差异。设处理数为a;各处理重复数为n1,n2,…,na;试验观察值总数为N=Σni。则【例9.3】五个不同品种猪的育肥试验,后期30天增重(kg)如表7—11所示。试比较品种间增重有无差异。表9—11五个品种猪30天增重品种增重(kg)nixi.xi.2/niB121.519.520.022.018.020.06121.02440.1720.22450.5B216.018.517.015.520.016.06103.01768.1717.21783.5B319.017.520.018.017.0591.51674.4518.31680.25B421.018.519.020.0478.51540.5619.61544.25B515.518.017.016.0466.51105.5616.61109.25合计25460.58528.91=8567.85此例处理数a=5,各处理重复数不等。现对此试验结果进行方差分析:1.计算各项平方和及其自由度2、列出方差分析表,进行F检验表9—12五品种育肥猪增重方差分析表临界F值为F0.05(4,20)=2.87,F0.01(4,20)=4.43,因为5.99>4.43,故P<0.01,表明品种间差异极显著。3.多重比较采用Duncan法,各处理平均数多重比较表见表9—12。变异来源平方和自由度均方F值品种间46.50411.635.99**品种内(误差)38.84201.94总变异85.3424因各处理重复数不等,应先计算出平均重复次数no,此例中:于是,标准误为:  根据dfe=20,秩次距k=2,3,4,5从附表6中查出α=0.05及α=0.01的临界r值,并计算出最小显极差,所得结果列于表9—13。表9—13r值及R值表表9—14五品种育肥猪平均增重多重比较表(Duncan法)dfe秩次距kr0.05r0.01R0.05R0.012022.954.021.862.5333.104.221.952.6643.184.332.002.7353.254.402.052.77秩次处理平均数54321B120.23.6**3.0**1.90.62B419.63.0**2.4*1.33B318.31.71.14B217.20.65B516.6多重比较结果表明:B1、B4品种的平均增重极显著或显著地高于B2、B5品种的平均增重,其余不同品种之间差异不显著。可以认为B1、B4品种增重最快,B2、B5品种增重较差,B3品种居中。秩次处理平均数54321B120.23.6**3.0**1.90.62B419.63.0**2.4*1.33B318.31.71.14B217.20.65B516.6一、等重复时第一步:把每一水平视为一个子样本,先求出该子样本的    平均值 及方差 ;第二步:再把求得的样本平均值  视为一个样本,计算    其样本方差  ;第三步:利用下列公式计算处理间均方MSA和处理内均方MSe组别12…a利用计算器进行计算:二、不等重复时第一步:把每一水平视为一个子样本,先求出该子样本的    方差  ;第二步:把所有数据视为一个样本,计算其样本方差  ;第三步:利用下列公式计算处理间均方MSA和处理内均方MSe方差分析与两样本平均数t-test有何异同?t-test方差分析相同点平均数差异显著性检验平均数差异显著性检验不同点两个平均数的差异检验;利用平均数的差;利用统计量t多个平均数的差异检验;利用平均数的方差;利用统计量F问题解答?
本文档为【生物统计学第九章单因素方差分析】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: ¥14.4 已有0 人下载
最新资料
资料动态
专题动态
机构认证用户
夕夕资料
拥有专业强大的教研实力和完善的师资团队,专注为用户提供合同简历、论文写作、PPT设计、计划书、策划案、各类模板等,同时素材和资料部分来自网络,仅供参考.
格式:ppt
大小:635KB
软件:PowerPoint
页数:0
分类:高中其他
上传时间:2021-06-15
浏览量:13