null第九章 参数估计第九章 参数估计null 一、统计推论
统计推论适用于抽样调查资料的处理。所谓统计推论就是根据局部资料(样本资料)对总体的特征进行推断。它属于归纳推理的范畴。
统计推论具有两方面的特点:
1、由于局部资料来源于总体,因此局部资料的特性在某种程度上能反映总体的特性;
2、由于社会资料的随机性,即抽样的结果不是唯一的,又使得一次抽样结果不能恰好就等于总体的结果。这种“抽样结果与总体参数不一致”是随机现象在推论中所特有的,也是进行推论的难点所在。
统计推论的理论基础是概率论。统计推论的内容大体可分两部分:1、通过样本对总体的未知参数进行估计,简称参数估计;
2、通过样本对总体的某种假设(例如参数或分布的情况)进行检验,简称假设检验。
null二、名词解释
1、总体:研究对象的全体,总体是由个体构成的。
2、样本:从总体中按一定方式抽出的一部分称作样本。样本也是由个体构成的,其中包含个体数目n成为样本大小或样本容量。从样本中抽取的个体,可以看作是个数为n的一组数据 。它们在未抽出之前可看作是一个随机变量 。
如果要求抽样这样一些数据,不但是随机变量,而且相互独立,遵从同一分布(即同总体所遵从的分布),那么这样的样本就称作简单随机样本。
一般在无限总体(即总体个数是无限的)中的随机抽样;或在有限总体(即总体中个数是有限的)中的重复随机抽样(即每次抽样经观测后将抽到的个体放回,允许再次被抽到,又称回置抽取)所得的样本都是简单随机样本。null3、统计量
从总体中抽取容量为n的样本,可以看作n个独立同总体分布的随机变量 。那么,随机变量
的任何函数 叫做统计量。
根据随机变量 的观测值 计算得到的一切统计数字特征(例如均值、方差)可以看作是相应统计量的观测值。
统计量的分布又称作抽样分布。
三、参数的点估计
参数估计可分作两类:
1、点估计:用样本计算出来的一个数来估计未知参数。
2、区间估计:通过样本计算出一个范围来对未知参数进行估计。
null (一)总体参数(均值与方差)的点估计公式
1、总体均值的点估计:用样本均值作为总体均值的点估计值:
样本均值:
2、总体方差的点估计:用样本方差作为总体方差的点估计值:
样本方差:
3、总体
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
差的点估计:用样本标准差作为总体标准差的点估计值:
样本标准差:
null 4、总体成数的点估计:当 表示的是定类变量,其取值有: 1 当观测值为所研究的A类
0 其他
表示在样本n次观测中,A类出现m次。
用样本成数作为总体成数的点估计值。
样本成数: null(二)评价点估计值的标准
所谓总体参数Q的最佳估计值 (它是样本值的函数)应当是在某种意义下最近似Q的。衡量估计值好坏有如下几个标准:
1、无偏性
如果 是总体参数Q的估计值,且 分布的均值有: ,则称 是Q的无偏估计。反之, 将是Q的有偏估计。
样本方差为 时,
样本方差为 时, 所以 作为总体方差的估计值比 好,它是无偏的。
null 2、有效性
有效性标准要求估计值的抽样分布应该具有较小的分散性。
如果有两个估计值 和 它们都满足无偏性。那么,当 的方差比 的方差小时: 则称 较 有效。
3、一致性
对于估计值除了要求无偏性和有效性外,一个好的估计值还应当要求随着样本容量n的增大以更大的概率去接近被估计参数的值。
把样本容量为n的估计值记作 ,如果 时, 按概率收敛于总体参数Q,即对于任何正数 ,有: 则称 是Q的一致估计值。null 四、抽样分布——统计量的分布
(一)样本均值 的分布
1、总体分布为正态分布 ,且方差 已知:
根据正态分布的性质:任意有限个服从正态分布的独立随机变量直线型函数仍然服从正态分布。因此,若
服从总体分布为 中抽出的一个样本,则 是n个相互独立,分布为 的随机变量。那么,样本均值 仍然服从正态分布:
~
null 比较: ~ ;
~ 。
可见,随着样本容量n的增加,可以有效减少抽样分布的分散程度。
称作抽样均值的平均误差或标准误,反映了统计量
围绕 的分散程度,或者说反映了抽样均值 与 的平均误差水平, 值除了与总体 有关外,它还随着样本容量 n而变化。由于 是由抽样引起的,其大小可以反映统计量的可靠程度。
如果将 标准化: ~null 2、总体分布为正态分布 ,且方差 未知:
这时用样本方差 作为总体方差 的估计值。根据数学推算,统计量
~ 自由度k为n-1的t分布。
当K很大时,t分布图形与标准正态分布差别很小。因此,当K很大时(n>30),就可以用标准正态分布N(0,1)来近似t分布。null 3、任意总体,大样本情况:
根据中心极限定理,只要样本容量足够大(n>=50)即在大样本的情况下, 的分布将接近正态分布:
若总体的均值为 ,方差为 , 是取自该总体的大小为n的样本的均值,S是样本的标准差,则当 时
~ (方差已知)
~ (方差未知)null (二)样本方差 的分布
在总体为正态分布时, 的分布与 分布相联系。可以
证明
住所证明下载场所使用证明下载诊断证明下载住所证明下载爱问住所证明下载爱问
:
~
自由度k=n-1的 分布。
分布的均值、方差与自由度k有如下关系:
null 五、参数的区间估计
(一)有关区间估计的几个概念
1、名词解释
区间估计:通过样本计算出一个范围来对未知参数进行估计。参数的区间估计在给出区间估计的同时,还必须指出所给区间包含未知参数的概率是多少。
例如:用 作为未知参数Q的估计值,那么,区间 包含参数Q的概率为1-α,其中区间 称作置信区间。区间大小,反映了估计的准确性或精确性。1-α称作置信度、置信概率或置信系数。它表示用置信区间估计的可靠性。α称显著性水平它表示置信区间估计不可靠的概率。显然,置信度与显著性水平之和为1。null2、置信区间(Confidence interval)与置信度(Confidence coefficient)之间的关系
置信区间的一般形式:
Q是未知参数,对于确定
的总体,它是唯一的。
但 和 是统计量,它是随着样本而变的随机变量。所以区间 是一个随机区间,对于一次抽样所形成的样本,区间估计可能包含待估参数Q,也可能不包含待估参数Q。 指出包含待估参数的概率是多少;指出不包含待估参数的概率是多少。
置信区间除了写作双侧区间: 之外;还可以写作单侧区间: 或 。单侧区间与置信度之间的关系:
null 置信度一般是根据实际情况预先给定的。通常置信度的标准有:0.90,0.95,0.99。
置信度为0.90,表示如果独立重复地抽取很多样本,每次样本容量n保持不变的话,那么,平均而言,每100个样本,其中有90个样本计算出的区间估计是包含待估参数Q的。
在样本容量一定的情况下,置信区间和置信度是相互制约的。置信度越大(即估计的可靠性越大),则相应的置信区间也越宽(估计的越不精确)。
3、区间估计与抽样分布
区间估计与置信度之间的关系是用概率公式表达的: 其中置信度是预先给定的,接下来只有知道了 或和其有关的统计量的抽样分布,才能把概率1-α的大小和区间 的大小联系起来。
null (二)总体均值的区间估计
1、总体分布为正态分布,且方差已知:
统计量 ~
总体均值的双侧置信区间有:
将统计量Z代入上式有:
经整理有:
区间 为待估参数置信度为1-α的双侧置信区间。
null例:设某工厂妇女从事家务劳动时间服从正态分布
。根据36人的随机抽样调查,每天平均从事家务劳动时间 小时,求 的双侧置信区间(置信度取0.95和0.99两种)。
null 2、总体分布为正态分布,且方差未知:
统计量 ~
总体均值的双侧置信区间有:
将统计量Z代入上式经整理有:
区间
为待估参数置信度为1-α的双侧置信区间。
null 例:设某社区受教育程度服从正态分布
未知。根据25人的随机抽样调查,平均受教育年限和标准差为 ,求 的双侧置信区间(1-a=0.99)
null 3、任意总体,大样本情况:
统计量 ~ ; ~
(1)方差已知时,区间估计公式为:
区间 为待估参数
置信度为1-α的双侧置信区间。
(2)方差未知时,区间估计公式为:
区间 为待估参数
置信度为1-α的双侧置信区间。
null 例:设某社区受教育程度的总体分布、方差都不知道。根据50人的抽样调查结果,平均受教育年限和标准差为 ,求 的双侧置信区间(1-a=0.99)
null (三)正态总体方差的区间估计
在总体为正态分布时,统计量
~
对于给定置信度1-α,双侧区间 的临界值应满足:
整理后有:
其中区间 为待估参数置信度为1-α
的双侧置信区间。
null 例:设某村平均家庭收入服从正态分布。现根据10户平均年收入的抽样调查,得数据:578;572;570;568;572;570;570;596;584;572。求方差和标准差的置信区间(1-a=0.95)null 例:设根据某地100户的随机抽查,其中有60户拥有电冰箱,求该地拥有电冰箱成数p的置信区间(置信度为0.95)。
null (四)大样本总体(二项总体)成数的区间估计
当 表示的是定类变量,其取值有:
1 当观测值为所研究的A类
0 其他
表示在样本n次观测中,A类出现m次。
样本成数: 可以看作是n个满足二点分布(0,1)分布的 随机变量 的均值。
根据中心极限定理,在大样本情况下(np>=5和nq>=5),
的分布可近似看作正态分布,
因此大样本成数区间估计公式有:
区间 为待估参数置信度为1-α的双侧置信区间。其中 为总体成数p的点估计值, ,当p未知时,可用 代替p。
~