首页 5-参数估计

5-参数估计

举报
开通vip

5-参数估计null 医学统计学 Medical Statistics 医学统计学 Medical Statistics第三章 抽样误差 第三章 抽样误差 一、抽样误差的概念一、抽样误差的概念统计推断的概念 例如,某地成年男子血红蛋白的总体均数  =13.76(g/100ml),我们随机抽查了360名男子,平均血红蛋白含量为13.45,若作为该地区成年男子血红蛋白总体均数( )的估计值,则与实际总体均数相差0.31。 由于随机抽样引起的样本统计量与总体参数之间的差异称为抽样误差。 在抽样...

5-参数估计
null 医学统计学 Medical Statistics 医学统计学 Medical Statistics第三章 抽样误差 第三章 抽样误差 一、抽样误差的概念一、抽样误差的概念统计推断的概念 例如,某地成年男子血红蛋白的总体均数  =13.76(g/100ml),我们随机抽查了360名男子,平均血红蛋白含量为13.45,若作为该地区成年男子血红蛋白总体均数( )的估计值,则与实际总体均数相差0.31。 由于随机抽样引起的样本统计量与总体参数之间的差异称为抽样误差。 在抽样研究中抽样误差是不可避免的。 抽样误差的表现形式抽样误差的表现形式样本统计量≠总体参数 样本统计量1 ≠样本统计量2二、抽样误差产生的条件二、抽样误差产生的条件一是抽样研究。只有对总体中的部分个体进行抽样研究,才可能导致样本指标与总体指标的不相等,而且在同一类型的研究中,样本例数越少,抽样误差可能会越大。 二是个体变异。在抽样方法和样本含量不变的条件下,变异大的事物其抽样误差也大,反过来,变异小的事物其抽样误差也小。三、均数的抽样误差及 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 误三、均数的抽样误差及标准误如果进行K次抽样,所得的K个样本统计量(例如 )很可能各不相同。 将这些样本统计量编制成频率分布图,就可看出样本统计量的抽样分布规律。 计算机模拟: 从正态分布N(5.00,0.502)的总体中随机抽取100个样本,每个样本的样本含量为10。在每次抽样后计算其均数,这样就得到100个样本均数。null模拟结果(100个样本均数):发现一发现一从同一总体中随机抽取样本含量(n)相等的若干个样本,通过每一个样本可以计算出一个样本均数,这些 不一定恰好等于相应的总体均数μ,各 之间也不完全相等。 这种由于抽样而造成的来自同一总体的各个样本均数与相应的总体均数μ之间的差别,就称为均数的抽样误差。 100个样本均数的频数分布图 100个样本均数的频数分布图 发现二发现二从所得的100个样本均数的频数分布直方图可以看出, 的分布是有规律,围绕着μ,中间多,两边少,左右基本对称。 正态分布? 中心极限定理 中心极限定理 涵义:从均数为μ、标准差为 的总体中独立随机抽样,当样本含量n增加时,样本均数 的分布将趋于正态分布,此分布的均数为μ,标准差为 。 在统计理论上将样本均数的标准差 称为标准误(standard error,SE) ,用来衡量抽样误差的大小。 抽样误差的意义抽样误差的意义 越小,则抽样误差越小,表示样本均数与总体均数越接近,用样本均数估计总体均数的可靠性就越好; 反过来, 越大,则抽样误差越大,表示样本均数离总体均数就越远,用样本均数估计总体均数的可靠性就越差。null例、随机抽取某市200名7岁男童的身高均数为124.0cm,标准差为4.6cm,试估计其抽样误差。 抽样误差可以通过标准误来反映,所以利用标准误的 公式 小学单位换算公式大全免费下载公式下载行测公式大全下载excel公式下载逻辑回归公式下载 来求解:null中心极限定理认为:即使是从非正态分布的总体中进行随机抽样,只要样本含量足够大(一般n≥50),样本均数的分布也趋于正态分布。 计算机模拟(P31)四、t分布四、t分布(一)t分布的概念 如果某变量X服从总体均数为 、标准差为 的正态分布,即 , , ,…服从正态分布N(、 2),那么,标准化变换后, , , ,…它们就服从标准正态分布N(0,1),也称u分布。 null中心极限定理表明,从正态分布N( , 2)中,随机抽取n次样本(当样本含量较大时),所得的一系列均数 , , ,…,也就服从正态分布N( , ),同理,就有 , , ,…,也服从标准正态分布N(0,1),即u分布。 null在实际工作中,总体标准误 往往是未知的(尤其是在小样本的研究中),而是用样本标准误 去估计的。这时,用 代替 进行的变换就不再是u变换,而变成了t变换: null所得的 , , ,…,就不再服从标准正态分布,而是服从自由度为n-1的t分布(t-distribution)。 1908年,英国统计学家W.S.Gosset在《生物统计》杂志上发表该论文时用的是笔名“Student”,故t分布又称Student t分布。null(二)t分布的图形和特征 t值是由 代替 进行变换求得,那么当 等于或近似 时,t分布就接近u分布,即标准正态分布。 什么时候 等于或近似 ? 标准正态分布是t分布的极限形式 自由度分别为1、5、∞时的t分布 自由度分别为1、5、∞时的t分布 t分布特征t分布特征(1) t分布为一簇单峰分布曲线,每一个自由度都对应一条曲线。 (2) t分布以0为中心,左右对称。 (3) t分布曲线的形态与自由度有关,自由度越小,t值越分散,曲线越低平;当自由度逐渐增大时,t分布逐渐逼近标准正态分布(u分布);当自由度为无穷大时,t分布就是标准正态分布。(三)t分布曲线的规律(三)t分布曲线的规律每一自由度下的t分布曲线都有其自身分布规律,见t界值表(附表2) 。 表中数据为相应的t界值,常记为t, ,其中α为预先 规定 关于下班后关闭电源的规定党章中关于入党时间的规定公务员考核规定下载规定办法文件下载宁波关于闷顶的规定 的尾端概率。 附表2图中的阴影部分,表示在总体中随机抽样获得大于或等于t, 的概率P。 t值为负值时,可求其绝对值再查附表2。 null例如,双尾t0.05,10=2.228,表明,从正态分布总体中抽取样本含量为n=11的样本,由该样本计算的t值大于等于2.228的概率为0.025,小于等于-2.228的概率也为0.025。也就是说t值大于等于2.228和小于等于-2.228的概率之和为0.05。可表示为: P(t≤-2.228)+P(t≥2.228)=0.05 或:P(-2.228 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 。(二)F分布的图形和特征 (二)F分布的图形和特征 F值表(附表4) F值表(附表4) F(0.05;20,20)= 2.12表示,从方差相等的正态分布总体中随机抽取n1=n2=21的样本,则由两样本计算的F值大于等于2.12的可能性为0.025,而小于1/2.12=0.4717的可能性亦为0.025。 nullF分布表明,从两个方差相等的正态分布总体中随机抽取含量分别为n1和n2的样本,计算所得F值,应接近v2/(v2-2),当第二个样本含量增加时,F值接近于1。 null 第四章 可信区间一、可信区间的概念一、可信区间的概念统计推断包括两方面的内容:参数估计和假设检验。 参数估计 :由样本统计量估计总体参数 参数估计有两种: 点估计(point estimation) 区间估计(interval estimation) 点估计(point estimation) 点估计(point estimation) 点估计是直接用样本统计量作为总体参数的估计值。 缺点:未考虑抽样误差的大小。 例:点估计某地区12岁男孩的总体平均身高。 甲随机抽取120名12岁男孩,测得平均身高为142.67cm ; 乙也随机抽取120名12岁男孩,测得平均身高为141.95cm 。 谁的结论更可信? 区间估计(interval estimation) 区间估计(interval estimation) 由于抽样误差的客观存在, 按一定的概率或可信度(1-)用一个区间来估计总体参数的所在范围, 该范围称作可信度为1- 的可信区间(confidence interval, CI),又称置信区间。 这种参数估计方法就叫做区间估计。 可信度为1- 的可信区间的确切涵义 可信度为1- 的可信区间的确切涵义 对总体进行随机抽样,每100个样本所算得的100个可信度为100(1-)% 的可信区间,平均有100(1-)个包含了总体参数。 如取=0.05,则每100个样本所算得的100个95%可信区间,平均有95个包含总体参数在内,有5个不包含总体参数。 可信限(confidence limit) 可信限(confidence limit) 可信区间通常由两个可信限构成,其中较小者称为下限,记为CL,较大者称为上限,记为CU。 严格地讲,可信区间并不包括上可信限和下可信限两个值,即可信区间(CL, CU)是一开区间。 可信区间的两个要素 可信区间的两个要素 1、可靠性(或叫准确度),反映为可信度1- 的大小,可信度越接近1越可靠性。常用的可信度90%,95%,99%。 2、精确性(或叫精密度),反映为可信区间的宽度,宽度越小越精确。 两者是相互矛盾的。需要同时兼顾准确度与精确度,一般常用95%可信区间。 二、均数可信区间的计算 二、均数可信区间的计算 1、总体均数的可信区间 P(t≤- tα/2,ν)+P(t≥tα/2,ν)=α 即P(- tα/2,ν100),这时t分布近似服从标准正态分布,即u分布,那么总体均数的100(1-α)%可信区间的通式就简化为: 已知,标准正态分布下, =0.10时,u/2=1.64; =0.05时,u/2=1.96; =0.01时,u/2=2.58。 null例、某地120名12岁男孩身高均数142.67cm,标准误0.5477cm,计算该地12岁男孩身高总体均数90%的可信区间。 因n=120>100,故可以用标准正态分布代替t分布,u0.10/2=1.64, 即该地12岁男孩平均身高的90%可信区间为:141.77~143.57(cm) 。 若按t分布计算, 结果为:141.76~143.58(cm) 。null例、某城市200名7岁男孩身高=124.0cm, =0.33cm,估计该市7岁男孩身高总体均数的95%可信区间。 即该市7岁男孩平均身高的95%可信区间为:123.4~124.6(cm) 。总体均数可信区间的计算应该根据资料的具体条件来定: 总体均数可信区间的计算应该根据资料的具体条件来定: σ未知且n较小时,用 来代替σ, σ未知且n足够大(n>100)时,用 来代替σ,u值代替t值, σ已知时, 2、两均数之差的区间估计2、两均数之差的区间估计实际工作需要 =n1+n2-2 1-2的可信区间为: 例、某医生研究转铁蛋白对病毒性肝炎诊断的临床意义,测得12名正常人和15名病毒性肝炎患者血清转铁蛋白含量(g/dl),结果如下,试估计正常人和患者的转铁蛋白含量均数之差的95%可信区间。 例、某医生研究转铁蛋白对病毒性肝炎诊断的临床意义,测得12名正常人和15名病毒性肝炎患者血清转铁蛋白含量(g/dl),结果如下,试估计正常人和患者的转铁蛋白含量均数之差的95%可信区间。 nullnull自由度为=n1+n2-2=12+15-2=25、=0.05的t界值为:t0.05/2,25=2.060,则两组均数之差的95%可信区间为: (271.89-235.21 ) ± 2.060 × 4.95 = 26.48 ~ 46.88 可以认为病毒性肝炎患者的血清转铁蛋白含量较正常人平均低36.68(g/dl),其95%可信区间为26.48~46.88(g/dl)。五、方差的可信区间五、方差的可信区间方差的抽样分布是2分布。 null六、可信区间的正确应用六、可信区间的正确应用1、正确理解可信区间的涵义 如果重复100次抽样,每次样本含量均为n,每个样本均按 构建可信区间,则在此100个可信区间内,理论上有95个包含总体均数,而有5个不包含总体均数。 错误的理解错误的理解总体参数有95%的可能落在该区间内 ; 有95%的总体参数在该区间内,而5%的参数不在该区间内。 2、单侧可信区间2、单侧可信区间实际工作中,有时仅有可信区间的下限或上限有意义。 药物的平均有效期最短是多少? 某药物的不良反应发生率最大是多少? 具体问题具体分析。 3、区间 和 的区别 3、区间 和 的区别 区间 表示的本质含义是样本均数的正常值范围。 从已知的均数为标准差为的正态分布总体中抽样,每100个样本含量为n的样本均数中,理论上有95个被包含在该区间内。 演绎法解释样本均数的抽样误差。 null可信区间 是以样本均数为中心的区间,用以估计总体均数所在范围。 用同样方法估计100次,理论上将有95个可信区间包含总体均数。 归纳法解释样本均数的抽样误差。 4、可信区间 与 容许区间 的区别 4、可信区间 与 容许区间 的区别 (1)可信区间 用于估计总体参数,总体参数只有一个;而容许区间 用于估计变量值的分布范围,变量值可能很多甚至无限。null95%容许区间指有95%的变量值在该范围内。 95%可信区间的涵义是指从总体中随机抽样,每100个样本所算得的100个95%可信区间,平均有95个包含了总体参数。 null(2)可信区间 所基于的t分布是统计量的抽样分布,一般可通用;而容许区间 所基于的正态分布是变量值的分布,只有当分布接近正态分布时方适用。两者有着本质的区别。 5、标准差和标准误的区别与联系 5、标准差和标准误的区别与联系 null 谢谢!
本文档为【5-参数估计】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_929054
暂无简介~
格式:ppt
大小:964KB
软件:PowerPoint
页数:0
分类:其他高等教育
上传时间:2011-05-09
浏览量:29