null第 4 章 参数估计第 4 章 参数估计§4.1 参数估计的一般问
题
快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题
§4.2 一个总体参数的区间估计
§4.3 样本容量的确定§4.1 参数估计的一般问题§4.1 参数估计的一般问题一、估计量与估计值
二、点估计与区间估计
三、评价估计量的标准一、估计量与估计值
(estimator & estimated value)一、估计量与估计值
(estimator & estimated value)估计量与估计值概念估计量与估计值概念估计量:用于估计总体参数的随机变量。
(即:用于估计总体参数的统计量的名称)
如样本均值 、样本比例 、样本方差 等
2、估计值:估计参数时计算出来的统计量的具体数值。
如通过某个特定的样本求出该样本的均值 x =80,则80就是相应总体参数的估计值。二、点估计与区间估计
(point estimate& interval estimate)二、点估计与区间估计
(point estimate& interval estimate)点估计点估计定义:用样本统计量 的某个取值直接作为总体参数 的估计值,称为参数的点估计。
例如:用样本均值 直接作为总体均值 的估计
优点:计算简单,快捷;
缺点:由于没有给出估计值接近总体参数程度的信息,所以该法估计的可靠性差。区间估计区间估计定义:在点估计的基础上,给出总体参数估计的一个区间范围,称作参数的区间估计。
总体参数的估计区间通常是由样本统计量加减抽样误差得到的。
优点:区间估计可以根据样本统计量的抽样分布,能够对样本统计量与总体参数的接近程度给出一个概率度量。区间估计的图示区间估计的图示区间估计中的两个基本概念区间估计中的两个基本概念置信区间:在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。其中区间的最小值叫做置信下限,最大值叫做置信下限。
2、置信水平——是将构造置信区间的步骤重复多次后,置信区间中包含总体参数真值的次数所占的比例,也称为置信系数或置信度。
置信水平通常用符号 (1 -
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
示,
:总体参数不包括在置信区间内的概率。
null区间估计(数理统计中的概念)
定义:设 是总体 的一个参数, 是来自总体 的一组样本, , 是两个统计量,且 ,对给定的常数
及任意的参数 ,有
则称随机区间 是 的置信度(置信水平)为 的置信区间(区间估计)。其中 分别为置信下限和置信上限。null影响置信区间宽度的因素:
1. 样本容量:当置信水平(1 - )固定时,置信区间的宽度随样本容量的增大而减小;
2. 置信水平 (1 - ):当样本容量给定时,置信区间的宽度随着置信水平的增大而增大。null对置信区间的理解有以下几点要注意:
(1)如果用某种方法构造的所有区间中有95%的区间包含总体参数的真实值,由5%的区间不包含总体参数的真值,那么用该方法构造的区间称为置信水平为95%的置信区间。
(2)总体参数的真值是固定的、未知的,而用样本构造的区间则是不固定的。
(3)在实际问题中,进行估计时往往只抽取一个样本,此时所构造的是与该样本相联系的一定置信水平下的置信区间。null 注意一类表述:
如果以95%的置信水平得到某班学生考试成绩的置信区间为(60,80)。
问:能否说全班学生平均考试成绩的真值以95%的概率落在(60,80)或者说(60,80)这个区间以95%的概率包含全班学生平均考试成绩的真值?
错误的原因:这个概率不是用来描述某个特定的区间包含总体参数真值的可能性,而是针对随机区间而言的。
评价估计量的标准评价估计量的标准一、无偏性
(unbiasedness)一、无偏性
(unbiasedness)无偏性:估计量抽样分布的数学期望等于被估计的总体参数。
设总体参数为 ,所选择的估计量为 ,如果满足 ,则称 为 的无偏估计量。二、有效性
(efficiency)二、有效性
(efficiency)有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效。
设有两个无偏估计量 和 ,如果有
则称 比 更有效。三、一致性
(consistency)三、一致性
(consistency)一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数。
即:
§4.2 一个总体参数的区间估计§4.2 一个总体参数的区间估计一、总体均值的区间估计
二、总体比例的区间估计
三、总体方差的区间估计一个总体参数的区间估计一个总体参数的区间估计总体均值 的区间估计
总体均值 的区间估计
1、大样本( )1、大样本( ) 假定条件①:
总体方差(2)已知
那么我们使用的统计量为正态分布z统计量则在此条件下推导出的总体均值 在置信水平1-下的置信区间为:null 假定条件②:
总体方差(2)未知
则在此条件下推导出的总体均值 在置信水平1-下的置信区间为:那么我们使用的统计量为正态分布z统计量2、小样本( )2、小样本( )假定条件①
总体服从正态分布,且方差(2) 已知则在此条件下推导出的总体均值 在置信水平1-下的置信区间为:
那么我们使用的统计量为正态分布z统计量
null假定条件②
总体服从正态分布, 且方差(2) 未知则在此条件下推导出的总体均值 在置信水平1-下的置信区间为:
那么我们使用的统计量为服从t分布的t统计量
null 例题:例题:例1:一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企业质检部门经常要进行抽检,以
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布,且总体标准差为10g。试估计该批产品平均重量在95%置信水平下的置信区间。null解:已知X~N(,102),n=25, 1- = 95%,z/2=1.96。
根据样本数据计算得:
总体均值在1-置信水平下的置信区间为该食品平均重量的置信区间为101.44g~109.28gnull例2:一家保险公司收集到由36投保个人组成的随机样本,得到每个投保人的年龄(周岁)数据如下表。试建立投保人年龄90%的置信区间。 null解:已知n=36, 1- = 90%,z/2=1.645。
根据样本数据计算得:
总体均值在1- 置信水平下的置信区间为投保人平均年龄的置信区间为37.37岁~41.63岁。null例3:已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(小时)如下。建立该批灯泡平均使用寿命95%的置信区间。null解:已知X~N(,2),n=16, 1- = 95%,t/2=2.131
根据样本数据计算得: ,
总体均值在1-置信水平下的置信区间为该种灯泡平均使用寿命的置信区间为1476.8小时~1503.2小时。总体比例 的区间估计总体比例 的区间估计null假定条件
大样本(即满足: )则在此条件下我们推导出的总体比例在置信水平1-下的置信区间为:
那么我们使用的统计量为正态分布z统计量
例题:例题:例:某城市想要估计下岗职工中女性所占的比率,随机地抽取了100名下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比率的置信区间解:已知 n=100,p=65% , 1- = 95%,z/2=1.96该城市下岗职工中女性比率的置信区间为55.65%~74.35% 。总体比例在置信水平1-下的置信区间为
总体方差 的区间估计总体方差 的区间估计null假设条件
总体服从正态分布
我们使用的是与 分布相关的 统计量则在此条件下得到总体方差在置信水平1-下的置信区间为(图示)(图示) 2 21- 2 总体方差
1- 的置信区间自由度为n-1的2分布例题:例题:【例】一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布。以95%的置信水平建立该种食品重量标准差的置信区间。 null解:已知n=25,1-=95% ,根据样本数据计算得
s2 =93.21
2置信度为95%的置信区间为 该企业生产的食品总体重量标准差的的置信区
间为7.54g~13.43g。§4.3 样本容量的确定§4.3 样本容量的确定一、估计总体均值时样本容量的确定
二、估计总体比例时样本容量的确定
null总体均值的置信区间是由样本均值 和边际误差两部分组成。令 代表希望达到的边际误差,即
由此可以推导出确定样本容量的公式如下:
一、估计总体均值时样本容量的确定
null 由上式可以看出:
样本容量与置信水平成正比;
在其他条件不变的情况下,置信水平越大,所需的样本容量也就越大。
样本容量与总体方差成正比;
总体的差异越大,所要求的样本容量也越大。
样本容量与边际误差成反比;
即可以接受的边际误差的平方越大,所需的样本容量就越小。
null【例】拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元,假定想要估计年薪95%的置信区间,希望允许误差为400元,应抽取多大的样本容量?
null解: 已知 =2000,E=400, 1-=95%, z/2=1.96
应抽取的样本容量为
即应抽取97人作为样本 null令E代表所希望达到的边际误差,即
由此可以推导出重复抽样或无限总体抽样条件下确定样本容量的公式如下:
二、估计总体比例时样本容量的确定null【例】根据以往的生产统计,某种产品的合格率约为90%,现要求允许误差为5%,在求95%的置信区间时,应抽取多少个产品作为样本? 解:已知=90%,=0.05, z/2=1.96,E=5% 应抽取的样本容量为 应抽取139个产品作为样本.