首页 参数估计

参数估计

举报
开通vip

参数估计nullnull第六章: 参数估计数理统计的任务: ●总体分布类型的判断; ●总体分布中未知参数的推断(参数估计与假设检验)。null参数估计问题的一般提法 设总体 X 的分布函数为 F( x, θ ),其中θ 为未知参数或参数向量,现从该总体中抽样,得到样本X1, X2 , … , Xn . 依样本对参数θ 做出估计,或估计参数 θ 的某个已知函数 g(θ ) 。这类问题称为参数估计。 参数估计包括:点估计和区间估计。 ...

参数估计
nullnull第六章: 参数估计数理统计的任务: ●总体分布类型的判断; ●总体分布中未知参数的推断(参数估计与假设检验)。null参数估计问题的一般提法 设总体 X 的分布函数为 F( x, θ ),其中θ 为未知参数或参数向量,现从该总体中抽样,得到样本X1, X2 , … , Xn . 依样本对参数θ 做出估计,或估计参数 θ 的某个已知函数 g(θ ) 。这类问题称为参数估计。 参数估计包括:点估计和区间估计。 null 为估计参数 µ,需要构造适当的统计量 T( X1, X2 , … , Xn ), 一旦当有了样本,就将样本值代入到该统计量中,算出一个值作为 µ 的估计,称该计算值为 µ 的一个点估计。 null寻求估计量的方法1. 矩估计法2. 极大似然法3. 最小二乘法4. 贝叶斯方法 …我们仅介绍前面的两种参数估计法 。null其思想是: 用同阶、同类 的样本矩来估计总体矩。 矩估计是基于“替换”思想建立起来的一种参数估计方法 。 最早由英国统计学家 K. 皮尔逊 提出。§6.1 点估计的几种方法null矩估计就是用相应的样本矩去估计总体矩。null 设总体 X 的分布函数中含 k 个未知参数 步骤一:记总体 X 的 m 阶原点矩 E(Xm)为 am , m = 1,2,…,k.am(1,2,…,k), m =1, 2, …, k. 一般地, am (m = 1, 2, …, k) 是总体分布中参数或参数向量 (1, 2, …, k) 的函数。 故, am (m=1, 2, …, k) 应记成:null步骤二:算出样本的 m 阶原点矩步骤三:令 得到关于 1,2,…,k 的方程组(L≥k)。一般要求方程组(1)中有 k 个独立方程。null步骤四:解方程组(1), 并记其解为 这种参数估计法称为参数的矩估计法,简称矩法。null解:先求总体的期望例1:设总体 X 的概率密度为null由矩法,令样本矩总体矩解得为α 的矩估计。注意:要在参数上边加上“^”, 表示参数的估计。它是统计量。null解: 先求总体的均值和 2 阶原点矩。例2:设 X1,X2,…Xn 是取自总体 X 的简单样本, X 有概率密度函数令y=(x-μ )/θnull令y=(x-μ )/θnull用样本矩 估计总体矩得null列出方程组:例3:设总体X的均值为,方差为2,求 和2 的矩估计。解:由 null故,均值,方差2的矩估计为求解,得null如:正态总体N( , 2) 中 和2的矩估计为null又如:若总体 X∼ U(a, b),求a, b的矩估计。 解:列出方程组 因 null解上述方程组,得到 a,b 的矩估计: null 矩估计的优点是:简单易行, 不需要事先知道总体是什么分布。 缺点是:当总体的分布类型已知时,未充分利用分布所提供的信息;此外,一般情形下,矩估计不具有唯一性 。null 极大似然估计法是在总体的分布类型已知前提下,使用的一种参数估计法 。 该方法首先由德国数学家高斯于 1821年提出,其后英国统计学家费歇尔于 1922年发现了这一方法,研究了方法的一些性质,并给出了求参数极大似然估计一般方法——极大似然估计原理 。nullI. 极大似然估计原理 设总体 X 的分布 (连续型时为概率密度,离散型时为概率分布) 为 f(x, θ) , X1,X2,…,Xn 是抽自总体 X 的简单样本。于是,样本的联合概率函数 (连续型时为联合概率密度,离散型时为联合概率分布) 为被看作固定, 但未知的参数。视为变量null将上式简记为 L(θ ),即称 L(θ )为θ 的似然函数。视为变量视为固定值null 假定现在我们观测到一组样本 X1, X2, …, Xn,要去估计未知参数θ 。称 为θ 的极大似然估计 (MLE)。 一种直观的想法是:哪个参数(多个参数时是哪组参数) 使得现在的出现的可能性 (概率) 最大,哪个参数(或哪组参数)就作为参数的估计。 这就是 极大似然估计原理。如果θ 可能变化空间, 称为参数空间。null (4) 在最大值点的表达式中,代入样本值, 就得参数 θ 的极大似然估计。II. 求极大似然估计(MLE)的一般步骤 由总体分布导出样本的联合概率函数(连 续型时为联合概率密度, 离散型时为联合 概率分布);(2) 把样本的联合概率函数中的自变量看成 已知常数, 参数θ 看成自变量, 得到似然 函数 L(θ );(3) 求似然函数 L(θ ) 的最大值点 (常常转化 为求ln L(θ )的最大值点) ,即 θ 的MLE;null两点说明:● 求似然函数 L(θ ) 的最大值点,可应用微积分中的技巧。由于 ln(x) 是 x 的增函数,所以 ln L(θ ) 与 L(θ ) 在 θ 的同一点处达到各自的最大值。假定 θ 是一实数, ln L(θ )是 θ 的一个可微函数。通过求解似然方程可以得到 θ 的MLE。null● 用上述方法求参数的极大似然估计有时行不通,这时要用极大似然原理来求 。若θ 是向量,上述似然方程需用似然方程组代替 。nullIII. 下面举例说明如何求参数的MLE例1: 设X1, X2, …, Xn是取自总体 X~B(1, p) 的一个样本,求参数 p 的极大似然估计。解:似然函数为null对数似然函数为:对 p 求导,并令其等于零,得上式等价于null解上述方程,得换成换成null例2:求正态总体 N(, 2) 参数  和 2 的极大似然估计(注: 我们把 2 看作一个参数)。解:似然函数为对数似然函数为null 似然方程组为由第一个方程,得到代入第二方程,得到null 是L(,2)的最大值点,即  和 2 的极大似然估计。 下面验证:似然方程组的唯一解是似然函数的最大值点。null例3:设总体 X 服从泊松分布 P( ),求参数 的极大似然估计。解:由 X 的概率分布函数为得 的似然函数null似然方程为对数似然函数为其解为null换成换成得 的极大似然估计null例4:设 X ∼U(a, b),求 a, b 的极大似然估计。 解:因所以nullnull 由上式看到:L(a,b)作为a和b的二元函数是不连续的,所以我们不能用似然方程组来求极大似然估计,而必须从极大似然估计的定义出发,求L(a,b)的最大值。null 为使 L(a, b) 达到最大,b-a 应该尽量地小。 但 b不能小于 max{x1,x2,…,xn}。否则,L(a,b) = 0。类似地,a 不能大于min{x1,x2,…,xn}。 因此,a 和 b 的极大似然估计为null解:似然函数为例5:设 X1, X2,…,Xn 是抽自总体 X 的一个样本,X 有如下概率密度函数其中θ >0为未知常数。求θ 的极大似然估计。也可写成null求导并令其导数等于零,得解上述方程,得null 从前面两节的讨论中可以看到: ● 同一参数可以有几种不同的估计,这时就需 要判断采用哪一种估计为好的问题。 ● 另一方面,对于同一个参数,用矩法和极大 似然法即使得到的是同一个估计, 也存在衡 量这个估计优劣的问题。 估计量的优良性准则就是:评价一个估计量 “好”与“坏”的标准。§6.2 点估计的评价标准null 设总体的分布参数为,对一切可能的 成立,则称 为 的无偏估计。6.2.1 无偏性 对于样本 X1,X2,,Xn的不同取值, 取不同的值 )。 如果 的均值等于,即简记为 是 的一个估计(注意! 它是一个统计量,是随机变量。null参数,有时可能估计偏高,有时可能偏低,但是平均来说它等于。 “一切可能的 ”是指:在参数估计问题中,参数  一切可能的取值。 我们之所以要求对一切可能的  都成立, 是因为在参数估计问题中, 我们并不知道参数 的真实取值。自然要求它在参数 的一切可能取值的范围内都成立说明:无偏性的意义是:用估计量 估计 null例1:设 X1, X2, …, Xn 为抽自均值为 的总体X的随机样本,考虑  的如下几个估计量:例如:若 指的是正态总体N( , 2)的均值,则其一切可能取值范围是(-∞,∞)。若 指的是方差2,则其一切可能取值范围是(0,∞)。nullnull定理6.2.1 设总体 X 的均值为,方差为2, X1,X2,…,Xn 为来自总体 X 的随机样本,记 与 分别为样本均值与样本方差,即 即样本均值和样本方差分别是 总体均值 和总体方差 的无偏估计。null证明:因为 X1, X2, …, Xn 独立同分布,且 E(Xi )=μ , 所以另一方面,因null于是,有注意到null 前面两节中,我们曾用矩法和极大似然法分别求得了正态总体 N(μ , σ2) 中参数 σ2 的估计,均为很显然,它不是 σ2 的无偏估计。这正是我们为什么要将其分母修正为 n-1,获得样本方差 S2来估计 σ2 的理由。如果 是参数 的一个估计,我们通常用 作为 的估计。但必须注意的是:即使 是 的无偏估计, 也未必是 的无偏估计。null例2:求证:样本标准差 S 不是总体标准差 的无偏估计。 证明:因 E(S2)= 2, 所以,Var(S)+[E(S)]2 = 2, 由 Var(S)>0,知 [E(S)]2 =  2 - Var(S)<  2. 所以,E(S)< . 故,S 不是  的无偏估计。null 用估计量 估计,估计误差6.2.2均方误差准则 是随机变量,通常用其均值衡量估计误差的大小。 要注意: 为了防止求均值时正、负误差相互抵消,我们先将其平方后再求均值,并称其为均方误差,记成 ,即null 哪个估计的均方误差小,就称哪个估计比较优,这种判定估计优劣的准则为“均方误差准则”。注意:均方误差可分解成两部分:证明:null 上式表明,均方误差由两部分构成:第一部分是估计量的方差,第二部分是估计量的偏差的平方和。 注意:如果一个估计量是无偏的,则第二部分是零,则有: 如果两个估计都是无偏估计,这时哪个估计的方差小,哪个估计就较优。这种判定估计量优劣的准则称为方差准则。null例3:设 X1, X2, …, Xn 为抽自均值为  的总体,考虑  的如下两个估计的优劣: 我们看到: 显然两个估计都是 的无偏估计。计算二者的方差:null§ 6.3 最小方差无偏估计Rao-Blackwell定理定理6.3.1 设总体概率函数是 p(x,  ), x1, x2 ,…, xn 是其样本,T=T(x1, x2 , …, xn )是 的 充分统计量,则对 的任一无偏估计 令 , 则 也是 的无偏估计,且 null定理6.3.1说明:如果无偏估计不是充分统计量 的函数,则将之对充分统计量求条件期望可以 得到一个新的无偏估计,该估计的方差比原来 的估计的方差要小,从而降低了无偏估计的方 差。换言之,考虑 的估计问题只需要在基于 充分统计量的函数中进行即可,该说法对所有 的统计推断问题都是正确的,这便是所谓的充 分性原则。 null 例4 设 x1, x2 , …, xn 是来自b(1, p)的样本,则 是 p 的充分统计量。为估计 =p2,可令 由于 ,所以 是 的无偏估计。这个只使用了两个观测值的估计并不好.下面我们用Rao-Blackwell定理对之加以改进:求 关于充分统计量 的条件期望,得 null定义6.3.1 对参数估计问题,设 是 的一个无偏 估计,如果对另外任意一个 的无偏估计 ,在参数 空间Θ上都有 则称 是 的一致 最小方差无偏估计,简记为UMVUE。如果UMVUE存在, 则它一定是充分统计量的函数。 null关于UMVUE,有如下一个判断准则。 定理6.3.3 设 X=(X1, X2 , …, Xn) 是来自某总体的一个样本, 是 的一个无偏估计, 如果对任意一个满足E((X))=0的(X),都有 ,则 是 的UMVUE。null 例5 设 x1,x2 ,…,xn 是来自指数分布Exp(1/ )的样本,则T = x1+…+xn 是 的充分统计量,而 是 的无偏估计。设 =(x1 ,x2 , …, xn)是0的任一无偏估计,则 两端对 求导得 这说明 ,从而 ,由定理6.3.3,它是 的UMVUE。null6.3.3 Cramer-Rao不等式定义6.3.2 设总体的概率函数 P(x, ), ∈Θ满足下列条件: (1) 参数空间Θ是直线上的一个开区间; (2) 支撑 S={x: P(x, )>0}与 无关; (3) 导数 对一切∈Θ都存在; (4) 对P(x, ),积分与微分运算可交换次序; (5) 期望 存在; 则称 为总体分布的费希尔(Fisher) 信息量。 null 费希尔信息量是数理统计学中一个基本概念,很多的统计结果都与费希尔信息量有关。如极大似然估计的渐近方差,无偏估计的方差的下界等都与费希尔信息量I( )有关。I( )的种种性质显示,“I( )越大”可被解释为总体分布中包含未知参数 的信息越多。 null例6 设总体为泊松分布P()分布,则 于是例7 设总体为指数分布,其密度函数为 例7 设总体为指数分布,其密度函数为 可以验证定义6.3.2的条件满足,且于是null定理6.3.4(Cramer-Rao不等式) 设定义6.3.2的条件满足,x1, x2 , …, xn 是来 自该总体的样本,T=T(x1, x2 , …, xn )是g( ) 的任一个无偏估计, 存在,且对 ∈Θ中一切 ,微分可在积分号下进行,则有 null上式称为克拉美-罗(C-R)不等式; [g’(θ)]2/(nI( ))称为g( )的无偏估计的方差的C-R下界,简称g( )的C-R下界。 特别,对 的无偏估计 ,有 ; 如果等号成立,则称 T=T(x1, …, xn) 是 g( )的有效估计,有效估计一定是UMVUE。 null例8 设总体分布列为p(x, )=  x(1- )1-x, x=0,1,它满足定义6.3.2的所有条件,可以算 得该分布的费希尔信息为 ,若 x1, x2, …, xn 是该总体的样本,则 的C-R下界 为(nI( ))-1=  (1- )/n。因为 是 的无 偏估计,且其方差等于 (1- )/n,达到C-R 下界,所以 是 的有效估计,它也是 的 UMVUE。 null 例9 设总体为指数分布Exp(1/ ),它满足 定义6.3.2的所有条件,例6.3.4中已经算出 该分布的费希尔信息量为I( ) = -2,若x1, x2, …, xn 是样本,则 的C-R下界为 (nI( ))-1= 2/n。而 是 的无偏估计, 且其方差等于 2/n,达到了C-R下界,所以, 是 的有效估计,它也是 的UMVUE。 null能达到C-R下界的无偏估计不多: 例10 设总体为N(0, 2 ),满足定义6.3.2的 条件,且费希尔信息量为 , 令 ,则 的C-R下界 为 , 而 的UMVUE为 其方差大于C-R下界。这表明所有 的无偏估 计的方差都大于其C-R下界。 §6.4 贝叶斯估计§6.4 贝叶斯估计6.4.1 统计推断的基础 经典学派的观点:统计推断是根据样本信息对总体分布或总体的特征数进行推断,这里用到两种信息:总体信息和样本信息;贝叶斯学派的观点:除了上述两种信息以外,统计推断还应该使用第三种信息:先验信息。 null(1)总体信息:总体分布提供的信息。 (2)样本信息:抽取样本所得观测值提供的信息。 (3)先验信息:人们在试验之前对要做的问题在 经验上和资料上总是有所了解的,这些信息对统 计推断是有益的。先验信息即是抽样(试验)之 前有关统计问题的一些信息。一般说来,先验信 息来源于经验和历史资料。先验信息在日常生活 和工作中是很重要的。 null 基于上述三种信息进行统计推断的统计学称 为贝叶斯统计学。它与经典统计学的差别就 在于是否利用先验信息。贝叶斯统计在重视 使用总体信息和样本信息的同时,还注意先 验信息的收集、挖掘和加工,使它数量化, 形成先验分布,参加到统计推断中来,以提 高统计推断的质量。忽视先验信息的利用, 有时是一种浪费,有时还会导出不合理的结 论。 null 贝叶斯学派的基本观点: 任一未知量 都可看作随机变量,可用一个概率分布去描述,这个分布称为先验分布;在获得样本之后,总体分布、样本与先验分布通过贝叶斯公式结合起来得到一个关于未知量 新的分布—后验分布;任何关于 的统计推断都应该基于 的后验分布进行。 null6.4.2 贝叶斯公式的密度函数形式总体依赖于参数 的概率函数在贝叶斯统计中记为P (x |  ),它表示在随机变量θ取某个给定值时总体的条件概率函数; 根据参数 的先验信息可确定先验分布( ); 从贝叶斯观点看,样本 x1, x2 , …, xn 的产生分两步进行:首先从先验分布( )产生一个样本0,然后从P (x |0)中产生一组样本。这时样本的联合条件概率函数为 , 这个分布综合了总体信息和样本信息;null0 是未知的,它是按先验分布( )产生的。为把先验信息综合进去,不能只考虑0,对的其它值发生的可能性也要加以考虑,故要用( )进行综合。这样一来,样本x1 , …, xn和参数 的联合分布为: h(x1, x2 , …, xn,  ) = p(x1, x2 , …, xn )( ), 这个联合分布把总体信息、样本信息和先验信息三种可用信息都综合进去了; null在没有样本信息时,人们只能依据先验分布对 作出推断。在有了样本观察值 x1, x2 , …, xn 之后,则应依据 h(x1, x2 , …, xn ,  )对 作出推断。由于 h(x1,x2 ,…,xn ,  ) =(  x1,x2 ,…,xn )m(x1,x2 ,…,xn), 其中 是x1, x2 , …, xn 的边际概率函数,它与 无关,不含 的任何信息。null推断的仅是条件分布(  x1, x2 , …,xn), 它的计算公式是 这个条件分布称为 的后验分布,它集中了 总体、样本和先验中有关 的一切信息。 后验分布( x1, x2 , …, xn )的计算公式就是 用密度函数表示的贝叶斯公式。它是用总体 和样本对先验分布( )作调整的结果,贝 叶斯统计的一切推断都基于后验分布 进行。null6.4.3 贝叶斯估计 基于后验分布( x1, x2 , …, xn )对 所作的贝叶斯估计有多种,常用有如下三种: 使用后验分布的密度函数最大值作为 的点估计,称为最大后验估计; 使用后验分布的中位数作为 的点估计,称为后验中位数估计; 使用后验分布的均值作为 的点估计,称为后验期望估计。 用得最多的是后验期望估计,它一般也简称为贝叶斯估计,记为 。 null例1 设某事件A在一次试验中发生的概率为 ,为估计,对试验进行了n次独立观测,其 中事件A发生了X次,显然 Xb(n, ),即 假若我们在试验前对事件A没有什么了解,从 而对其发生的概率也没有任何信息。在这种 场合,贝叶斯建议采用“同等无知”的原则使 用区间(0,1)上的均匀分布U(0,1)作为的先 验分布,因为它取(0,1)上的每一点的机会 均等。这个建议被后人称为贝叶斯假设。null由此即可利用贝叶斯公式求出 的后验分布。 具体如下:先写出X和 的联合分布 然后求X的边际分布 最后求出 的后验分布 null最后的结果说明 X Be(x+1,n-x+1),其后验期望估计为 (6.4.4) 某些场合,贝叶斯估计要比极大似然估计更合理一点。比如: “抽检3个全是合格品”与“抽检10个全是合格品”,后者的质量比前者更信得过。这种差别在不合格品率的极大似然估计中反映不出来(两者都为0),而用贝叶斯估计两者分别是 0.2 和 0.83。 由此可以看到,在这些极端情况下,贝叶斯估计比极大似然估计更符合人们的理念。 null6.4.4 共轭先验分布若后验分布( x)与( )属于同一个分布族,则称该分布族是 的共轭先验分布(族)。 二项分布b(n,  )中的成功概率 的共轭先验分布是贝塔分布Be(a,b); 泊松分布P( )中的均值 的共轭先验分布是伽玛分布Ga(,); 在方差已知时,正态均值 的共轭先验分布是正态分布N(, 2); 在均值已知时,正态方差 2的共轭先验分布是倒伽玛分布IGa(,)。 null小结 本讲首先介绍参数矩估计的基本思想以及求矩估计的步骤,给出多个求参数矩估计的例子;然后介绍参数极大似然估计的基本原理,求极大似然估计的基本方法,给出多个求参数极大似然矩估计的例子。null 前面讨论了参数的点估计。点估计就是利用样本计算出的值 (即实轴上点) 来估计未知参数。§6.5 区间估计 其优点是:可直地告诉人们 “未知参数大致是多少”; 缺点是:并未反映出估计的误差范围 (精度)。故,在使用上还有不尽如人意之处。 而区间估计正好弥补了点估计的这一不足之处 。null 例如:在估计正态总体均值 µ 的问题中,若根据一组实际样本,得到 µ 的极大似然估计为 10.12。 一个可以想到的估计办法是:给出一个区间,并告诉人们该区间包含未知参数 µ 的可靠度 (也称置信系数)。 实际上,µ 的真值可能大于10.12,也可能小于10.12。null 也就是说,给出一个区间,使我们能以一定的可靠度相信区间包含参数 µ 。 这里的“可靠度”是用概率来度量的,称为置信系数,常用 表示null 置信系数的大小常根据实际需要来确定,通常取0.95或0.99,即 根据实际样本,由给定的置信系数,可求出一个尽可能短的区间 ,使null 为确定置信区间,我们先回顾前面给出的随机变量的上α 分位点的概念。nullnullnull现在回到寻找置信区间问题上来。null6.5.1 区间估计的概念定义1:null实际应用上,一般取 α = 0.05 或 0.01。null由图6.5.1可以看出,这100个区间中有91个包含参数真15,另外9个不包含参数真值。 图6.5.1  的置信水平为0.90的置信区间 null取=0.50,我们也可以给出100个这样的区间,见图6.5.2。可以看出,这100个 区间中有50个包含参数真值15,另外50个不包含参数真值。 图6.5.2  的置信水平为0.50的置信区间null6.5.3 单个正态总体参数的置信区间根据基本定理 (见定理6.4.1) ,知nullnull也可简记为null例1: 某厂生产的零件长度 X 服从 N( , 0.04),现从该厂生产的零件中随机抽取6个,长度 测量值如下(单位:毫米): 14.6, 15.l, 14.9, 14.8, 15.2, 15.1. 求:µ 的置信系数为0.95的区间估计。 解:n = 6, = 0.05,z/2 = z0.025 = 1.96,2=0.22 . 所求置信区间为null当方差未知时,取● µ 的区间估计null于是,µ 的置信系数为1-α 的区间估计为也可简记为null● σ2 的区间估计null● σ2 的区间估计null例2:为估计一物体的重量μ,将其称量10次,得到重量的测量值 (单位: 千克) 如下: 10.l, 10.0, 9.8, 10.5, 9.7, l0.l, 9.9, 10.2, 10.3, 9.9. 设它们服从正态分布 N( , 2)。求 的置信系数为0.95的置信区间。null解: n=10,  =0.05, t9 (0.025)=2.2622,null例3(续例2) 求2的置信系数为0.95的置信区间。解:n=10,  = 0.05, S2=0.0583, 查附表得, 于是,null 在实际应用中,经常会遇到两个正态总体的区间估计问题。 于是,评价新技术的效果问题,就归结为研究两个正态总体均值之差 1-2 的问题。 例如:考察一项新技术对提高产品的某项质量指标的作用,将实施新技术前的产品质量指标看成正态总体 N(1, 12),实施新技术后产品质量指标看成正态总体 N(2, 22)。6.5.4 两个正态总体下的置信区间null定理1:设 X1, X2, ···, Xm是抽自正态总体X 的简单样本,X~N(1, 12),样本均值与样本方差为Y1, Y2, ···, Yn 是抽自正态总体 Y 的简单样本,Y ~N(2, 22),样本均值与样本方差为null当两样本相互独立时,有null证明:I.由基本定理(见定理6.4.1),知 故,(1) 式成立;且二者相互独立。null且(3)式与(4)式中的随机变量相互独立。由 t 分布的定义,得nullN(0,1)χ 2m+n-2换形式~ t m+n -2 . 分母互换null 利用该定理,我们可以得到 μ1-μ2 的置信 系数为 1-α 的置信区间。null例1 (比较棉花品种的优劣) 假设用甲、乙两种棉花纺出的棉纱强度分别为 X~N(1, 2.182)和Y ~N(2, 1.762)。试验者从这两种棉纱中分别抽取样本 X1, X2 ,…, X200 和 Y1, Y2, …, Y100,样本均值分别为: 求 1-2 的置信系数为 0.95 的区间估计。 解: 1=2.18, 2=1.76, m=200, n=100, =0.05, 由(5)式,得 1- 2 的置信系数为 1- 的置信区间为null例2 某公司利用两条自动化流水线灌装矿泉水。设这两条流水线所装矿泉水的体积 (单位:毫升) X~N(1, 2) 和 Y~N(2, 2)。现从生产线上分别抽取 X1, X2,…, X12 和 Y1, Y2, …, Y17,样本均值与样本方差分别为:求  1- 2 的置信系数为0.95的区间估计。解:m=12, n=17,  = 0.05,再由其他已知条件及(7)式,可算出null查 t 分布表,得 tm+n-2(α /2) = t27(0.025)=2.05.再由(6)式,得 1- 2 的置信系数为 1- 的置信区间 在这两个例子中, 1- 2 的置信区间都包含了零,也就是说: 1可能大于 2,也可能小于 2。这时我们认为二者没有显著差异。 null§6.6 非正态总体的区间估计 前面两节讨论了正态总体分布参数的区间估计。但是在实际应用中,我们有时不能判断手中的数据是否服从正态分布,或者有足够理由认为它们不服从正态分布。这时,只要样本大小 n 比较大,总体均值 μ 的置信区间仍可用正态总体情形的公式 或σ2已知时σ2未知时null所不同的是:这时的置信区间是近似的。 这是求一般总体均值的一种简单有效的方法,其理论依据是中心极限定理,它要求样本大小 n 比较大。因此,这个方法称为大样本方法。 设总体均值为 μ, 方差为σ2 , X1, X2, …, Xn 为来自总体的样本。因为这些样本独立同分布的,根据中心极限定理,对充分大的 n, 下式近似成立null因而,近似地有 于是, μ 的置信系数约为1-α 的置信区间为当σ2未知时,用σ2的某个估计,如 S2 来代替, 得到null只要 n 很大,(2)式所提供的置信区间在应用上是令人满意的。 那么,n 究竟多大才算很大呢? 显然,对于相同的 n , (2)式所给出的置信区间的近似程度随总体分布与正态分布的接近程度而变化,因此,理论上很难给出 n 很大的一个界限。 但许多应用实践表明:当 n≥30时,近似程度是可以接受的;当 n≥50时,近似程度是很好的。null例1 某公司欲估计自己生产的电池寿命。现从其产品中随机抽取 50 只电池做寿命试验。这些电池寿命的平均值为 2.266 (单位:100小时),标准差 S=1.935。求该公司生产的电池平均寿命的置信系数为 95% 的置信区间。 解:查正态分布表,得 zα /2= z0.025=1.96,由公式 (2),得电池平均寿命的置信系数为 95% 的置信区间为null 设事件 A 在一次试验中发生的概率为 p, 现在做 n 次试验,以Yn记事件 A 发生的次数,则 Yn ~ B(n, p)。依中心极限定理,对充分大的 n,近似地有 6.6.1 二项分布 (3)式是(1)式的特殊情形。null (4)式就是二项分布参数 p 的置信系数约为1-α 的置信区间。例2 商品检验部门随机抽查了某公司生产的产品100件,发现其中合格产品为84件,试求该产品合格率的置信系数为0.95的置信区间。解:n=100, Yn=84, α =0.05, zα/2=1.96, 将这些结果代入到(4)式,得 p 的置信系数为0.95的近似置信区间为 [0.77, 0.91]。null例3 在环境保护问题中, 饮水质量研究占有重要地位, 其中一项工作是检查饮用水中是否存在某种类型的微生物。假设在随机抽取的100份一定容积的水样品中有20份含有这种类型的微生物。试求同样容积的这种水含有这种微生物的概率 p 的置信系数为0.90的置信区间。解:n=100, Yn=20, α =0.10, zα/2=1.645, 将这些结果代入到(4)式,得 p 的置信系数为0.90的近似置信区间为 [0.134, 0.226]。null6.6.2 泊松分布 设 X1, X2 ,…, Xn 为抽自具有泊松分布P(λ)的总体的样本,因为 E(X)=Var(X) =λ,应用(2)式,并用null例4 公共汽车站在一单位时间内 (如半小时,或1 小时, 或一天等) 到达的乘客数服从泊松分布 P(λ), 对不同的车站, 所不同的仅仅是参数 λ 的取值不同。现对一城市某一公共汽车站进行了100个单位时间的调查。这里单位时间是20 分钟。计算得到每 20 分钟内来到该车站的乘客数平均值为 15.2 人。试求参数 λ 的置信系数为 95%的置信区间。 null解: n=100, α =0.05, zα/2=1.96, 将这些 结果代入到 (5) 式, 得 λ 的置信系数为0.95的近似置信区间为 [14.44, 15.96]。
本文档为【参数估计】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_371691
暂无简介~
格式:ppt
大小:2MB
软件:PowerPoint
页数:0
分类:
上传时间:2011-10-22
浏览量:93