首页 概率论与数理统计教程(茆诗松)第6章

概率论与数理统计教程(茆诗松)第6章

举报
开通vip

概率论与数理统计教程(茆诗松)第6章第六章参数估计§6.1点估计的几种方法§6.2点估计的评价标准§6.3最小方差无偏估计§6.4贝叶斯估计§6.5区间估计一般常用表示参数,参数所有可能取值组成的集合称为参数空间,常用表示。参数估计问题就是根据样本对上述各种未知参数作出估计。参数估计的形式有两种:点估计与区间估计。设x1,x2,…,xn是来自总体X的一个样本,我们用一个统计量的取值作为的估计值,称为的点估计(量),简称估计。在这里如何构造统计量并没有明确的规定,只要它满足一定的合理性即可。这就涉及到两个问题:其一是如何给出估计,即估计的方法...

概率论与数理统计教程(茆诗松)第6章
第六章参数估计§6.1点估计的几种方法§6.2点估计的评价 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 §6.3最小方差无偏估计§6.4贝叶斯估计§6.5区间估计一般常用表示参数,参数所有可能取值组成的集合称为参数空间,常用表示。参数估计问题就是根据样本对上述各种未知参数作出估计。参数估计的形式有两种:点估计与区间估计。设x1,x2,…,xn是来自总体X的一个样本,我们用一个统计量的取值作为的估计值,称为的点估计(量),简称估计。在这里如何构造统计量并没有明确的规定,只要它满足一定的合理性即可。这就涉及到两个问题:其一是如何给出估计,即估计的方法问题;其二是如何对不同的估计进行评价,即估计的好坏判断标准。§6.1点估计的几种方法6.1.1替换原理和矩法估计一、矩法估计替换原理是指用样本矩及其函数去替换相应的总体矩及其函数,譬如:用样本均值估计总体均值E(X),即;用样本方差估计总体方差Var(X),即用样本的p分位数估计总体的p分位数,用样本中位数估计总体中位数。例6.1.1对某型号的20辆汽车记录其每加仑汽油的行驶里程(km),观测数据如下:29.827.628.327.930.128.729.928.027.928.728.427.229.528.528.030.029.129.829.626.9经计算有由此给出总体均值、方差和中位数的估计分别为:28.695,0.9185和28.6。矩法估计的实质是用经验分布函数去替换总体分布,其理论基础是格里纹科定理。二、概率函数P(x,θ)已知时未知参数的矩法估计设总体具有已知的概率函数P(x,1,…,k),x1,x2,…,xn是样本,假定总体的k阶原点矩k存在,若1,…,k能够表示成1,…,k的函数j=j(1,…,k),则可给出诸j的矩法估计为其中例6.1.2设总体服从指数分布,由于EX=1/,即=1/EX,故的矩法估计为另外,由于Var(X)=1/2,其反函数为因此,从替换原理来看,的矩法估计也可取为s为样本标准差。这说明矩估计可能是不唯一的,这是矩法估计的一个缺点,此时通常应该尽量采用低阶矩给出未知参数的估计。例6.1.3x1,x2,…,xn是来自(a,b)上的均匀分布U(a,b)的样本,a与b均是未知参数,这里k=2,由于不难推出由此即可得到a,b的矩估计:6.1.2极(最)大似然估计定义6.1.1设总体的概率函数为P(x;),是参数可能取值的参数空间,x1,x2,…,xn是样本,将样本的联合概率函数看成的函数,用L(;x1,x2,…,xn)表示,简记为L(),称为样本的似然函数。如果某统计量满足则称是的极(最)大似然估计,简记为MLE(MaximumLikelihoodEstimate)。人们通常更习惯于由对数似然函数lnL()出发寻找的极大似然估计。当L()是可微函数时,求导是求极大似然估计最常用的方法,对lnL()求导更加简单些。例6.1.6设一个试验有三种可能结果,其发生概率分别为现做了n次试验,观测到三种结果发生的次数分别为n1,n2,n3(n1+n2+n3=n),则似然函数为其对数似然函数为将之关于求导,并令其为0得到似然方程解之,得由于所以是极大值点。例6.1.7对正态总体N(,2),θ=(,2)是二维参数,设有样本x1,x2,…,xn,则似然函数及其对数分别为将lnL(,2)分别关于两个分量求偏导并令其为0,即得到似然方程组(6.1.9)(6.1.10)解此方程组,由(6.1.9)可得的极大似然估计为将之代入(6.1.10),得出2的极大似然估计利用二阶导函数矩阵的非正定性可以说明上述估计使得似然函数取极大值。虽然求导函数是求极大似然估计最常用的方法,但并不是在所有场合求导都是有效的。例6.1.8设x1,x2,…,xn是来自均匀总体U(0,)的样本,试求的极大似然估计。解似然函数要使L()达到最大,首先一点是示性函数取值应该为1,其次是1/n尽可能大。由于1/n是的单调减函数,所以的取值应尽可能小,但示性函数为1决定了不能小于x(n),由此给出的极大似然估计:。§6.2点估计的评价标准6.2.1相合性我们知道,点估计是一个统计量,因此它是一个随机变量,在样本量一定的条件下,我们不可能要求它完全等同于参数的真实取值。但如果我们有足够的观测值,根据格里纹科定理,随着样本量的不断增大,经验分布函数逼近真实分布函数,因此完全可以要求估计量随着样本量的不断增大而逼近参数真值,这就是相合性,严格定义如下。定义6.2.1设∈Θ为未知参数,是的一个估计量,n是样本容量,若对任何一个ε>0,有(6.2.1)则称为参数的相合估计。相合性被认为是对估计的一个最基本要求,如果一个估计量,在样本量不断增大时,它都不能把被估参数估计到任意指定的精度,那么这个估计是很值得怀疑的。通常,不满足相合性要求的估计一般不予考虑。证明估计的相合性一般可应用大数定律或直接由定义来证.若把依赖于样本量n的估计量看作一个随机变量序列,相合性就是依概率收敛于,所以证明估计的相合性可应用依概率收敛的性质及各种大数定律。在判断估计的相合性时下述两个定理是很有用的。定理6.2.1设是的一个估计量,若则是的相合估计,定理6.2.2若分别是1,…,k的相合估计,=g(1,…,k)是1,…,k的连续函数,则是的相合估计。6.2.2无偏性定义6.2.2设是的一个估计,的参数空间为Θ,若对任意的∈Θ,有则称是的无偏估计,否则称为有偏估计。例6.2.4对任一总体而言,样本均值是总体均值的无偏估计。当总体k阶矩存在时,样本k阶原点矩ak是总体k阶原点矩k的无偏估计。但对中心矩则不一样,譬如,由于,样本方差s*2不是总体方差2的无偏估计,对此,有如下两点说明:(1)当样本量趋于无穷时,有E(s*2)2,我们称s*2为2的渐近无偏估计。(2)若对s*2作如下修正:,则s2是总体方差的无偏估计。6.2.3有效性定义6.2.3设是的两个无偏估计,如果对任意的∈Θ,有且至少有一个∈Θ使得上述不等号严格成立,则称比有效。例6.2.6设x1,x2,…,xn是取自某总体的样本,记总体均值为,总体方差为2,则,,都是的无偏估计,但显然,只要n>1,比有效。这表明用全部数据的平均估计总体均值要比只使用部分数据更有效。6.2.4均方误差无偏估计不一定比有偏估计更优。评价一个点估计的好坏一般可以用:点估计值与参数真值的距离平方的期望,这就是下式给出的均方误差均方误差是评价点估计的最一般的标准。我们希望估计的均方误差越小越好。注意到,因此(1)若是的无偏估计,则,这说明用方差考察无偏估计有效性是合理的。(2)当不是的无偏估计时,就要看其均方误差。下面的例子说明:在均方误差的含义下有些有偏估计优于无偏估计。例6.2.8对均匀总体U(0,),由的极大似然估计得到的无偏估计是,它的均方误差现我们考虑θ的形如的估计,其均方差为用求导的方法不难求出当时上述均方误差达到最小,且其均方误差所以在均方误差的标准下,有偏估计优于无偏估计。6.3.2最小方差无偏估计定义6.3.1对参数估计问题,设是的一个无偏估计,如果对另外任意一个的无偏估计,在参数空间Θ上都有则称是的一致最小方差无偏估计,简记为UMVUE。如果UMVUE存在,则它一定是充分统计量的函数。§6.5区间估计6.5.1区间估计的概念定义6.5.1设是总体的一个参数,其参数空间为Θ,x1,x2,…,xn是来自该总体的样本,对给定的一个(0<<1),若有两个统计量和,若对任意的∈Θ,有(6.5.1)则称随机区间[]为的置信水平为1-的置信区间,或简称[]是的1-置信区间.和分别称为的(双侧)置信下限和置信上限.这里置信水平1-的含义是指在大量使用该置信区间时,至少有100(1-)%的区间含有。例6.5.1设x1,x2,…,x10是来自N(,2)的样本,则的置信水平为1-的置信区间为其中,,s分别为样本均值和样本标准差。这个置信区间的由来将在6.5.3节中说明,这里用它来说明置信区间的含义。若取=0.10,则t0..95(9)=1.8331,上式化为现假定=15,2=4,则我们可以用随机模拟方法由N(15,4)产生一个容量为10的样本,如下即是这样一个样本:14.8513.0113.5014.9316.9713.8017.953313.3716.2912.38由该样本可以算得从而得到的一个区间估计为该区间包含的真值--15。现重复这样的方法100次,可以得到100个样本,也就得到100个区间,我们将这100个区间画在图6.5.1上。由图6.5.1可以看出,这100个区间中有91个包含参数真值15,另外9个不包含参数真值。图6.5.1的置信水平为0.90的置信区间取=0.50,我们也可以给出100个这样的区间,见图6.5.2。可以看出,这100个区间中有50个包含参数真值15,另外50个不包含参数真值。图6.5.2的置信水平为0.50的置信区间定义6.5.2沿用定义6.5.1的记号,如对给定的(0<<1),对任意的∈Θ,有(6.5.2)称为的1-同等置信区间。同等置信区间是把给定的置信水平1-用足了。常在总体为连续分布场合下可以实现。定义若对给定的(0<<1)和任意的∈Θ,有,则称为的置信水平为1-的(单侧)置信下限。假如等号对一切∈Θ成立,则称为的1-同等置信下限。若对给定的(0<<1)和任意的∈Θ,有,则称为的置信水平为1-的(单侧)置信上限。若等号对一切∈Θ成立,则称为1-同等置信上限。单侧置信限是置信区间的特殊情形。因此,寻求置信区间的方法可以用来寻找单侧置信限。6.5.3单个正态总体参数的置信区间一、已知时的置信区间在这种情况下,枢轴量可选为,c和d应满足P(c≤G≤d)=(d)-(c)=1-,经过不等式变形可得该区间长度为。当d=-c=u1-/2时,d-c达到最小,由此给出了的同等置信区间为[,]。(6.5.8)这是一个以为中心,半径为的对称区间,常将之表示为。例6.5.3用天平秤某物体的重量9次,得平均值为(克),已知天平秤量结果为正态分布,其标准差为0.1克。试求该物体重量的0.95置信区间。解:此处1-=0.95,=0.05,查表知u0.975=1.96,于是该物体重量的0.95置信区间为,从而该物体重量的0.95置信区间为[15.3347,15.4653]。例6.5.4设总体为正态分布N(,1),为得到的置信水平为0.95的置信区间长度不超过1.2,样本容量应为多大?解:由题设条件知的0.95置信区间为其区间长度为,它仅依赖于样本容量n而与样本具体取值无关。现要求,立即有n(2/1.2)2u21-/2.现1-=0.95,故u1-/2=1.96,从而n(5/3)21.962=10.6711。即样本容量至少为11时才能使得的置信水平为0.95的置信区间长度不超过1.2。二、2未知时的置信区间这时可用t统计量,因为,因此t可以用来作为枢轴量。完全类似于上一小节,可得到的1-置信区间为此处是2的无偏估计。例6.5.5假设轮胎的寿命服从正态分布。为估计某种轮胎的平均寿命,现随机地抽12只轮胎试用,测得它们的寿命(单位:万公里)如下:4.684.854.324.854.615.025.204.604.584.724.384.70此处正态总体标准差未知,可使用t分布求均值的置信区间。经计算有=4.7092,s2=0.0615。取=0.05,查表知t0.975(11)=2.2010,于是平均寿命的0.95置信区间为(单位:万公里)在实际问题中,由于轮胎的寿命越长越好,因此可以只求平均寿命的置信下限,也即构造单边的置信下限。由于由不等式变形可知的1-置信下限为将t0.95(11)=1.7959代入计算可得平均寿命的0.95置信下限为4.5806(万公里)。三、2的置信区间取枢轴量,由于2分布是偏态分布,寻找平均长度最短区间很难实现,一般都用等尾置信区间:采用2的两个分位数2/2(n-1)和21-/2(n-1),在2分布两侧各截面积为/2的部分,使得由此给出2的1-置信区间为例6.5.6某厂生产的零件重量服从正态分布N(,2),现从该厂生产的零件中抽取9个,测得其重量为(单位:克)45.345.445.145.345.545.745.445.345.6试求总体标准差的0.95置信区间。解:由数据可算得s2=0.0325,(n-1)s2=80325=0.26.查表知20.025(8)=2.1797,20.975(8)=17.5345,代入可得2的0.95置信区间为从而的0.95置信区间为:[0.1218,0.3454]。6.5.5两个正态总体下的置信区间设x1,…,xm是来自N(1,12)的样本,y1,…,yn是来自N(2,22)的样本,且两个样本相互独立。与分别是它们的样本均值,和分别是它们的样本方差。下面讨论两个均值差和两个方差比的置信区间。一、1-2的置信区间1、12和22已知时的两样本u区间2、12=22=2未知时的两样本t区间3、22/12=已知时的两样本t区间4、当m和n都很大时的近似置信区间5、一般情况下的近似置信区间其中例6.5.9为比较两个小麦品种的产量,选择18块条件相似的试验田,采用相同的耕作方法作试验,结果播种甲品种的8块试验田的亩产量和播种乙品种的10块试验田的亩产量(单位:千克/亩)分别为:甲品种628583510554612523530615乙品种535433398470567480498560503426假定亩产量均服从正态分布,试求这两个品种平均亩产量差的置信区间.(=0.05)。解:以x1,…,x8记甲品种的亩产量,y1,…,y10记乙品种的亩产量,由样本数据可计算得到=569.3750,sx2=2140.5536,m=8=487.0000,sy2=3256.2222,n=10下面分两种情况讨论。(1)若已知两个品种亩产量的标准差相同,则可采用两样本t区间。此处故1-2的0.95置信区间为(2)若两个品种亩产量的方差不等,则可采用近似t区间。此处s02=2110.5536/8+3256.2222/10=589.4414,s0=24.2784于是1-2的0.95近似置信区间为[31.3685,133.3815]二、12/22的置信区间由于(m-1)sx2/122(m-1),(n-1)sy2/222(n-1),且sx2与sy2相互独立,故可仿照F变量构造如下枢轴量,对给定的1-,由经不等式变形即给出12/22的如下的置信区间例6.5.10某车间有两台自动机床加工一类套筒,假设套筒直径服从正态分布。现在从两个班次的产品中分别检查了5个和6个套筒,得其直径数据如下(单位:厘米):甲班:5.065.085.035.005.07乙班:4.985.034.974.995.024.95试求两班加工套筒直径的方差比甲2/乙2的0.95置信区间。解:由数据算得sx2=0.00037,sx2=0.00092,故置信区间[0.0544,3.7657]
本文档为【概率论与数理统计教程(茆诗松)第6章】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
机构认证用户
夕夕资料
拥有专业强大的教研实力和完善的师资团队,专注为用户提供合同简历、论文写作、PPT设计、计划书、策划案、各类模板等,同时素材和资料部分来自网络,仅供参考.
格式:ppt
大小:697KB
软件:PowerPoint
页数:0
分类:
上传时间:2021-03-29
浏览量:63