第 7777章 参 数 估 计
统计推断的两大基本问题
⎩
⎨
⎧
假设检验问题.
题);估计问题、区间估计问参数估计问题(包括点
7777....1111 点 估 计 法
点估计:对总体分布函数中包含的未知参数作出统计推断,即作出估计.
先见下例,增加感性认识.
例 1111.设某次考试的成绩 ) ,( 2σµNX~ , µ 、 2σ 为未知参数.今随机地抽取 6666名考生,成绩分
别为:68686868,75757575,45454545,61616161,87878787,72727272. 试估计 µ 及 2σ .
解:Θ )(XE=µ ————————考试的平均成绩; )(2 XVar=σ ————————考试成绩(总体)的方差.
可用样本均值 x 及样本方差 2s 来估计 µ及 2σ .
68)728761457568(
6
1
x
6
1 6
1
i =+++++== ∑
=i
x ; 8.200)(x16
1 6
1
2
i
2 =−
−
= ∑
=i
xs .
得 )(XE=µ 的估计值 68686868, 2σ 的估计值 200.8200.8200.8200.8.
估 计量 :设 θ 为 总体 XXXX 的 待估 计的 参数 ,由 样本 n21 X , ,X , ΛX 构 造统 计量
), ,,(ˆˆ 21 nXXX Λθθ = 来估计 θ . 称 θˆ 为 θ 的一个估计量.相应于样本的一个观察值
n21 x, , x, Λx , 称 ), ,,(
ˆ
21 nxxx Λθ 为θ 的一个估计值.
推广到多个参数的情形: 设 ) , , ,( 21 kθθθ Λ 为总体分布中的一组未知参数, 用统计量
), ,,(ˆˆ 21 nii XXX Λθθ = 作为参数 iθ 的估计 )k , 2, ,1 ( Λ=i , 则称 kkkk维统计量
)ˆ, ,ˆ ,ˆ(ˆ 21 kθθθθ Λ= 为参数向量 ) , , ,( 21 kθθθθ Λ= 的一个估计.
如上例中的估计量 ∑
=
==
n
1
iX
1
ˆ
i
n
Xµ ,
2
n
1
2
i
2 )(X
1
1
ˆ
SX
n
i
=−
−
= ∑
=
σ ;
估计值 68ˆ =µ , 8.200ˆ 2 =σ .
下面介绍两种常用的点估计法:矩估计法和最大似然法.
一.... 矩估计法(数字特征法)
概率函数 )(xf :称随机变量 XXXX的概率函数为 )(xf , 是指
⎩
⎨
⎧
=
=
∗
为离散的.当
为连续的;当,概率密度
X x},P{X
X )(
)(
xf
xf )( Rx∈ .
设总体 XXXX的概率函数为 ) , , ( k1 θθ Λ;xf 的类型已知, ) , ,( k1 θθ Λ 为未知参数,待估计. 样本
n21 X , ,X , ΛX . 假设 XXXX的前 kkkk阶矩 ) , , , ()( k21 θθθµ Λl
l
XE = k) , 2, ,1 ( Λ=l 存在. 由辛钦
大数定律, l
P
i
l
il
X
n
A µ⎯→⎯= ∑
=
n
1
1
, ) n ( +∞→ , 且样本的连续函数 ⎯→⎯P 总体矩的连续
函数. 由
⎪
⎪
⎩
⎪
⎪
⎨
⎧
=
=
=
⇒
⎪
⎪
⎩
⎪
⎪
⎨
⎧
=
=
=
) , , , (ˆˆ
) , , , (ˆˆ
) , , , (ˆˆ
) , , , (
) , , , (
) , , , (
n21
n2122
n2111
k21
2k212
1k211
XXX
XXX
XXX
A
A
A
kk
kk Λ
ΛΛΛΛΛΛΛ
Λ
Λ
Λ
ΛΛΛΛΛΛΛ
Λ
Λ
θθ
θθ
θθ
θθθµ
θθθµ
θθθµ
.
上述 k21 ˆ ,ˆ ,ˆ θθθ Λ 称为矩估计量,相应的观察值称为矩估计值.此方法称为矩估计法.
例 1111.设总体 ) ,( baUX~ , ba、 未知. n21 X , ,X , ΛX 是一个样本,求 ba、 的矩估计量.
解:
⎪
⎪
⎩
⎪⎪
⎨
⎧
==
+
+
−
=+==
==+==
∑
=
n
1
2
i2
22
22
2
11
X
1
4
)(
12
)(
)]([)()(
)(
2
1
)(
i
n
A
baab
XEXVarXE
XAbaXE
µ
µ
,
即 ⎪
⎩
⎪
⎨
⎧
⎥
⎦
⎤
⎢
⎣
⎡
−=−
=+
∑
=
2n
1
2
iX
1
12
2
X
n
ab
Xba
i
⇒
( )
( )⎪
⎪
⎩
⎪
⎪
⎨
⎧
−+=
−−=
∑
∑
=
=
n
1
2
i
n
1
2
i
X
3ˆ
X
3
ˆ
i
i
X
n
Xb
X
n
Xa
.
例 2222.设总体 XXXX的均值 µ 及方差 2σ 均存在,且 02 >σ , 2σµ、 未知.样本 n21 X , ,X , ΛX ,
试求 σσµ 、、 2 的矩估计量.
解:
⎪
⎪
⎪
⎪
⎩
⎪⎪
⎪
⎪
⎨
⎧
−==
=−=−=
==
⇒
⎪
⎪
⎩
⎪⎪
⎨
⎧
=+=
+==
====
∑
∑∑
=
==
n
1
2
2
2
n
1
22
n
1
22
1
2
22
22
2
11
)(
1
ˆ
)(
11
ˆ
ˆ
)]([)()(
)(
i
i
i
i
i
i
XX
n
B
BXX
n
XX
n
AX
A
XEXVarXE
XAXE
σ
σ
µ
µσ
µ
µµ
.
特别,若 ) ,( 2σµNX~ , 2σµ、 未知,则 2
n
1
22 )(
1
ˆ ,ˆ BXX
n
X
i
i
=−== ∑
=
σµ .
例 3333.设总体 )(λPX~ ,参数
λ
未知.样本 n21 X , ,X , ΛX ,试求λ 的矩估计量.
解: XXE === λµ )(1 , 得 X=λˆ .
二.... 最大似然法 (((( MaximumMaximumMaximumMaximum LikelihoodLikelihoodLikelihoodLikelihood Estimators,Estimators,Estimators,Estimators, 简称MLEMLEMLEMLE ))))
设总体 XXXX的概率函数 ) ( θ;xf 的类型已知,θ 为未知参数,待估计.则样本 n21 X , ,X , ΛX 的
联合概率密度(或分布律)为∏
=
n
1
i ) ;f(x
i
θ . 令 ∏
=
==
n
1
in1 ) ;f(x) ; x, ,()(
i
xLL θθθ Λ ————————
似然函数 (((( likelihoodlikelihoodlikelihoodlikelihood functionfunctionfunctionfunction )))).
结合例子介绍最大似然法的思想方法.
例子:设一袋中装有黑、白两种球,试通过摸球估计两者数量之比.
解:pppp ————————摸到黑球的概率.只要估计 pppp, ]1 ,0[∈p .总体 ) ,1( pBX~ ,pppp为未知参数.作 nnnn次
放回抽样摸球, 令
⎩
⎨
⎧
=
次摸到白球,第,
次摸到黑球,第
i 0
i ,1
i
X 得样本 n21 X , ,X , ΛX .
)1 ,0(k ,)1(}{ 1 =−== −kk
i
ppkXP , (((( n , 2, ,1 Λ=i )))).
若(((( n21 , , , xxx Λ )))) 为一组观察值, 概率函数
ii
xx
i
ppxf
−−= 1)1()p ;( ;
似然函数 } ,,{)1() ;f(x)( 11
)1(
n
1
i nn
xnxn
i
xXxXPppppL ===−== −
=
∏ Λ .
假定摸球 100100100100次,观察值 10021 , , , xxx Λ 中有 9999个为 1111,其余为 0000,此时
919 )1()( pppL −= .
最大似然法的主要思想:若在一次观察中一个事件出现了,则可以认为此事件出现的概率很大.
令 max)1()( 919 =−= pppL , 求 pˆ .
令 0)1009()1()1(91)1(9
908909918 =−−=−−−= ppppppp
dp
dL
, 当 09.0ˆ =p 时, )(pL 取
maxmaxmaxmax. 所以,黑球 :::: 白球==== 0.090.090.090.09 :::: 0.91=0.91=0.91=0.91= 9999 :::: 91919191.
用同样的思想方法可以估计连续随机变量总体的未知参数.
最大似然估计法: 设总体 XXXX的概率函数为 ) ( θ;xf 的类型已知, Θ∈θ 为未知参数.作似然函
数 ∏
=
==
n
1
in1 ) ;f(x) ; x, ,()(
i
xLL θθθ Λ . 若存在 θ 的一个估计值 Θ∈= ),,(ˆˆ 1 nxx Λθθ ,
使 ) ; x, ,(max)ˆ( n1
θθ
θ
ΛxLL
Θ∈
= , 则称 ),,(ˆ 1 nxx Λθ 为θ 的一个最大似然估计值;
称 ),,(ˆ 1 nXX Λθ 为θ 的一个最大似然估计量.
方法:求θˆ的问题就是求 )(θL 的最大值问题.当 )(θL 可导时,可由 0
)(
=
θ
θ
d
dL
求得θˆ.
因 )(ln θL 与 )(θL 在同一个θ 值处取得最值,也可由 θ
θ
θ ˆ 0
)]([ln
⇒=
d
Ld
. ((((对数似然方程))))
例 1111.设总体 )(λPX~ ,未知参数 ) ,0( ∞+∈λ . 样本 n21 X , ,X , ΛX ,试求λ 的最大似然估
计量.
解:概率函数 ⎪⎩
⎪
⎨
⎧
∉
∈
===
−
N x0,
N x,
!}{) ( x
e
xXPxf
x λ
λ
λ;
;
!!!
) ;f(x) ; x, ,()(
1
n n
1
xn
1
in1
i
n
nx
i
i
i
xx
e
x
e
xLL
Λ
Λ
λλ
λλ
λλλ
−
=
−
=
⋅
==== ∏∏ ,
)!!ln(ln )(ln 1 nxxnxnL Λ−−= λλλ , 0
)]([ln
=−= n
xn
d
Ld
λλ
λ
∑
=
==⇒
n
1
ix
1ˆ
i
n
xλ ,(最大似然估计值); 最大似然估计量 ∑
=
==
n
1
iX
1ˆ
i
n
Xλ .
例 2222.设总体 )(λExpX~ ,
⎩
⎨
⎧
<
≥
=
−
0x 0,
0 x,
)(
x
e
xf
λ
λ
, 未知参数 ) ,0 ( ∞+∈λ .
n21 , , , xxx Λ 为一组观察值,试求λ 的最大似然估计量.
解:似然函数
x n
n
1
n
1
in1 ) ;f(x) ; x, ,()(
λ
λ
λλλλλ
n
i
x
i
eexLL
i
−
=
−
=
⋅==== ∏∏Λ ,
)0( ≥
i
x ; xnnL ln )(ln λλλ −= ,
1n
1
ix
1ˆ 0
)]([ln
−
=
⎟
⎠
⎞
⎜
⎝
⎛
==⇒=−= ∑
i
n
x
xn
n
d
Ld
λ
λλ
λ
(最大似然估计值); 最大似然估计量
X
1ˆ =λ .
最大似然估计法可用于多个未知参数的概率函数 ) , , ;( k1 θθ Λxf 的总体. 这时
∏
=
==
n
1
k1i1n1 ),, ;f(x),, ; x, ,(
i
k
xLL θθθθ ΛΛΛ . 求 kkkk元函数 LLLL的最大值, 可令
0
lnlnln
21
=
∂
∂
==
∂
∂
=
∂
∂
k
LLL
θθθ
Λ , 解得
k
θθ
ˆ , ,1ˆ Λ .
例 3333.设总体 ) ,( 2σµNX~ ,参数 2σµ、 未知.样本 n21 X , ,X , ΛX ,试求
2
σµ、 的最大似然
估计量.
解: ⎥
⎦
⎤
⎢
⎣
⎡ −−
=
2
2
2
2
)(
exp
2
1
) , ;(
σ
µ
σπ
σµ
x
xf ;
似然函数 ⎥
⎦
⎤
⎢
⎣
⎡
−
−
⎟
⎠
⎞
⎜
⎝
⎛
=⎥
⎦
⎤
⎢
⎣
⎡ −−
= ∑∏
==
n
i
i
n
i
i
x
x
L
1
2
2
2
2
n
1
2
2
2 )(
2
1
exp
2
1
2
)(
exp
2
1
) ,( µ
σπσσ
µ
σπ
σµ ;
∑
=
−−
−
=
n
1
2
i2
2 )(x
2
1
)2ln(
2
ln
i
n
L µ
σ
πσ ;
⎪
⎪
⎩
⎪
⎪
⎨
⎧
=−+
−
=
∂
∂
=−=
∂
∂
∑
∑
=
=
0)(x
2
1
2
ln
0)(x
1ln
n
1
2
i422
n
1
i2
i
i
nL
L
µ
σσσ
µ
σµ
,
得 )( )(
1
ˆ ,ˆ 22
n
1
22
1 SBXX
n
AX
i
i
≠=−=== ∑
=
σµ .
例 4444.设总体 XXXX具有分布律
其中 )1 ,0(∈θ 为未知参数.已知取得了样本值
1 x2, x,1 321 ===x ,试求θ的矩估计值和最大似
然估计值.
解: )3(2
1
)3(
2
1ˆ ,23)1(3)1(4)( 11
22
1 XAAXE −=−==−=−+−+== θθθθθθµ ,(矩估
计量); 矩估计值为 6
5
3
121
3
2
1
)3(
2
1ˆ =⎟
⎠
⎞
⎜
⎝
⎛ ++−=−= xθ .
设 321 ,, XXX 为样本,则似然函数 }x X,X ,{)( 332211 ==== xxXPL θ
1) (0, ),1(2)1(2}x P{X}X {}{ 522332211 ∈−=⋅−⋅==⋅=⋅== θθθθθθθxPxXP .
6
5ˆ 0
1
1
5)]([ln
)1ln(5ln2ln)(ln =⇒=
−
−=−++= θ
θθλ
θ
θθθ
d
Ld
L , , (最大似然估计
值).
7777....2222 点估计的
评价
LEC评价法下载LEC评价法下载评价量规免费下载学院评价表文档下载学院评价表文档下载
标准
上面介绍了两种点估计法.对同一参数,用不同的估计法可能得到不同的估计量.那么,究
竟采用哪一个好呢?这就涉及到估计量的评选标准问题.本节介绍三种评选标准:无偏性、有效
XXXX 1111 2222 3333
PPPP 2
θ
)1(2 θθ − 2)1( θ−
性及相合性.这些标准都是刻画了估计量与参数之间在概率意义下的接近程度.
一.无偏性
估计量是随机变量,我们希望其数学期望等于未知参数的真值.这样,估计值在未知参数真
值左右徘徊.
定义:设 θ为总体 XXXX中的待估参数,样本 n21 X , ,X , ΛX , ), ,,(ˆˆ 21 nXXX Λθθ = 为θ的一个估
计量,若 θθ =)ˆ(E ,则称θˆ为θ的一个无偏估计量; 否则,称为有偏估计量.
注: ])ˆ([ θθ −E 常称为θ的估计的系统误差.无偏估计量就是无系统误差.无偏性不是没有偏差,
它有随机误差,无系统误差.
例 1111.样本均值 X 和样本方差
2
S 分别是总体均值 )(XE 和总体方差 )(XVar 的无偏估计量.
∑
=
=
n
1
iX
1
i
n
X , ∑
=
−
−
=
n
1
2
i
2 )(X
1
1
i
X
n
S , )()( XEXE = , )()( 2 XVarSE = .
若取二阶中心矩 ∑
=
−=
n
1
2
i2 )(X
1
i
X
n
B 作为 )(XVar 的估计量, 则
)()(
11
)( 22 XVarXVar
n
n
S
n
n
EBE ≤
−
=⎟
⎠
⎞
⎜
⎝
⎛ −= ————————有偏估计量.
注:一般地,若θˆ是θ的一个有偏估计量,且 0)(a ,)ˆ( ≠+= baE θθ .可取
a
b−
=∗
θ
θ
ˆ
ˆ ,则 ∗θˆ
是θ的一个无偏估计量.
二.有效性
设 1ˆθ 和 2ˆθ 是未知参数θ的两个无偏估计量: θθθ == )ˆ()ˆ( 21 EE .现进一步比较这两个估计量的
优劣.如果 1ˆθ 比 2ˆθ 更密集地集中于θ,则认为 1ˆθ 比 2ˆθ 有效.
定义: 1ˆθ 和 2ˆθ 是未知参数θ的两个无偏估计量,若 )ˆ()ˆ( 21 θθ VarVar ≤ ,则称 1ˆθ 比 2ˆθ 有效. 方差
最小的无偏估计量称为有效估计量.
例 2.2.2.2. 总体 XXXX, 2Var(X) ,)( σµ ==XE ,样本 n21 X , ,X , ΛX , )1( >n . 考查 µ的以下三个
点估计: ∑
=
=
n
1
i1 X
1
ˆ
i
n
µ , )n k ( ,X
1
ˆ
k
1
i2 <= ∑
=ik
µ , ⎥
⎦
⎤
⎢
⎣
⎡
++⎟
⎠
⎞
⎜
⎝
⎛
= ∑
−
=
n
i
Xn
n
)1(X
2
1
ˆ
1n
1
i3µ ,
试证: 321 ˆˆˆ µµµ 、、 都是 µ的无偏估计量,且 321 ˆˆ ˆ µµµ 、比 都有效.
证: µµ == ∑
=
)E(X
1
)ˆ(
n
1
i1
i
n
E , µµ == ∑
=
)E(X
1
)ˆ(
k
1
i2
i
k
E ,
µµµµ =++−=
⎭
⎬
⎫
⎩
⎨
⎧
++⎥
⎦
⎤
⎢
⎣
⎡
= ∑
−
=
])1()1[(
2
1
)()1()E(X
2
1
)ˆ(
1n
1
i3 nn
n
XEn
n
E
n
i
,
故 321 ˆˆˆ µµµ 、、 都是 µ的无偏估计量. 方差分别为:
nn
Var
i
2n
1
i21
)Var(X
1
)ˆ(
σ
µ == ∑
=
,
kk
Var
i
2k
1
i22
)Var(X
1
)ˆ(
σ
µ == ∑
=
,
2222
2
2
1n
1
i23 4
3
])1()1[(
4
1
)()1()Var(X
)2(
1
)ˆ( σσσµ
n
n
nn
n
XVarn
n
Var
n
i
+
=++−=
⎭
⎬
⎫
⎩
⎨
⎧
++⎥
⎦
⎤
⎢
⎣
⎡
= ∑
−
=
,
因为 )ˆ()ˆ( 21 µµ VarVar < , 1)n ( ),ˆ(4
3
)ˆ( 1
2
2
3 >=>
+
= µ
σ
σµ Var
nn
n
Var ,所以 321 ˆˆ ˆ µµµ 、比
都有效.
注: 21 ˆ)1(ˆˆ R, µµµ ttt −+=∈∀ 都是 µ 的无偏估计量.
三.相合性(一致性)
总体 XXXX,样本 n21 X , ,X , ΛX , ), ,,(ˆˆ 21 nXXX Λθθ = 为θ的一个估计量. 当容量 +∞→n 时,
是否有 θθ ⎯→⎯
P
n
XXX ), ,,(ˆ 21 Λ ((((依概率收敛))))?
定义:若 θθ ⎯→⎯
P
n
XXX ), ,,(ˆ 21 Λ , 即 0 >∀ ε ,有 1}
ˆ{lim =<−
+∞→
εθθP
n
, 则称θˆ是θ
的一个相合估计量.
例如:(1)(1)(1)(1) 样本均值X是总体均值µ的相合估计量. 即: µ⎯→⎯PX ((((辛钦大数定律)))).
(2)(2)(2)(2) 同理, 2S 是总体方差 2σ 的相合估计量.
(3)(3)(3)(3) 在一定条件下,最大似然估计量也是相合估计量.
两种点估计法和三种评选标准综述:
先简单回顾两种点估计法和三种评选标准.矩估计法意义直观,易想到;最大似然法理论上优点
多.对于估计量的评选标准,无偏性标准直观上较合理,但并非每个参数具有无偏估计量;相合
性标准要求样本容量大,实际中难做到;有效性标准要求较高,理论上、实际上都比较合理,因
此较常用.
参数估计:点估计,区间估计.
7777....3333 区 间 估 计
在计算或测量时,不但要得到近似值,还要估计误差,即要确切地知道近似值的精确程度.
同样,对于未知参数θ,除求出它的点估计外,还要求出一个范围(通常为区间),并希望知道这
个范围含参数θ真值的可靠程度.这种形式的估计称为区间估计.本节主要介绍正态总体的区间
估计.
问题:调查大学生每月生活费支出 ) ,( 2σµNX~ , αµ −=∈ 1]}950 ,600[{P .
置信区间: 总体 XXXX,分布函数 ) ;( θxF ,未知参数θ,样本 n21 X , ,X , ΛX . 10 <<α , 统
计量 ), ,,(ˆˆ 2111 nXXX Λθθ = 及 ), ,,(ˆˆ 2122 nXXX Λθθ = 满足 αθθθ −≥<< 1}ˆˆ{ 21P , ((((****))))
称随机区间 )ˆ ,ˆ( 21 θθ 是θ的一个置信水平为 ) 1 ( α− 的置信区间; 1ˆθ 及 2ˆθ 分别称为θ的置信
水平为 ) 1 ( α− 的置信下限、置信上限.
((((****)))) 的意义:固定容量 nnnn,若反复多次抽样,每组样本观察值确定一个区间 )ˆ ,ˆ( 21 θθ ,要么包含θ ,
要么不包含θ.在这么多的区间中,按伯努利大数定律,约占 )%1(100 α− 的区间包含θ;另外
约占 %100α 的区间不包含θ.
下面介绍几种常用的区间估计法.
一.... 单个正态总体的情况
总体 ) ,(
2
σµNX~ ,样本 n21 X , ,X , ΛX , 置信水平 ) 1 ( α− .
1111.均值 µ的区间估计
(a)(a)(a)(a) 方差
2
σ 已知
X 是 µ 的无偏点估计,且 )1 0,(N
n
X
U ~
σ
µ−
= (ch6(ch6(ch6(ch6,Th.Th.Th.Th.6.4.6.4.6.4.6.4.1)1)1)1) . 由
α
σ
µ
αα
−=
⎭
⎬
⎫
⎩
⎨
⎧
<
−
<− −− 12121 u
n
X
uP , 解得: 2121 αα
σ
µ
σ
−− +<<− u
n
Xu
n
X ;
所求 ) 1 ( α− 置信区间为 ⎟
⎠
⎞
⎜
⎝
⎛
+− −− 2121 , αα
σσ
u
n
Xu
n
X , 简记 ⎟
⎠
⎞
⎜
⎝
⎛
± − 21 α
σ
u
n
X .
例 1111.已知某种零件的长度 )09.0 ,(µNX~ ((((单位m)m)m)m),样本 4321 X ,,X , XX .求总体均值 µ 的一个
置信水平为 0.950.950.950.95的置信区间.
解: 0.3 4,n ,05.0 === σα . )1 0,()(3.0
2
NX
n
X ~µ
σ
µ
−=
−
.
95.0)(
3.0
2
975.0975.0 =
⎭
⎬
⎫
⎩
⎨
⎧ <−<−∴ uXuP µ . 得: 975.0975.0 2
3.0
2
3.0
uXuX +<<− µ .
96.1975.0 =u , 294.02
3.0
975.0 =u , 故 µ 的一个 0.950.950.950.95置信区间为 )294.0 ,294.0( +− XX .
若得到样本的一组观察值 8.0 7.7, 8.2, ,1.8 , 则 0.8=x , 代入得区间 )294.8 ,706.7( .
(略释意义)
注:置信区间不唯一.如本例中,显然, 95.0)(3.0
2
99.096.0 =
⎭
⎬
⎫
⎩
⎨
⎧
<−<− uXuP µ , 解得
⎟
⎠
⎞
⎜
⎝
⎛
+− 96.099.0 2
3.0
2
3.0
uXuX , , 即 )26.0 ,35.0( +− XX . )(xf
此区间长度较长,一般地取对称的即双侧的百分 2α 2α
位点来计算未知参数的 )1 ( α− 置信区间.特
别在概率密度函数曲线单峰且对称的情况下. 2αx oooo E(X)E(X)E(X)E(X) 21 α−x xxxx
求置信区间的方法((((枢轴量法)))):
(1)(1)(1)(1) 构造样本的一个函数 ) ; , ,( 1 θnXXWW Λ= ,含未知参数θ,但WWWW的分布不含未知参数.
(一般地,WWWW可由θ的点估计经变换而得). 称 ) ; , ,( 1 θnXXW Λ 为枢轴量.
(2)(2)(2)(2) 对于置信水平为 ) 1 ( α− ,定出常数 ba、 ,使 α−≥<< 1}{ bWaP .
(3)(3)(3)(3) 从 bXXWa
n
<< ) ; , ,( 1 θΛ 求得 ), ,,(ˆ), ,,(ˆ 212211 nn XXXXXX ΛΛ θθθ << ,
)ˆ ,ˆ( 21 θθ 就是 θ 的置信水平为 ) 1 ( α− 的置信区间.
(b)(b)(b)(b) 方差 2σ 未知
用 X 估计 µ , 2S 估计 2σ , 且 )1n( −
−
= t
nS
X
t ~µ , (ch6(ch6(ch6(ch6,ThThThTh6.4.26.4.26.4.26.4.2)))) 由此得:
α
µ
αα
−=
⎭
⎬
⎫
⎩
⎨
⎧
−<
−
<−− −− 1)1()1( 2121 nt
nS
X
ntP , 2α )(tf 2α
得 µ 的 )1( α− 置信区间为 ⎟⎠
⎞
⎜
⎝
⎛
−± − )1(21 nt
n
S
X
α .
例 2222.为了调查某种溶液中的甲醛浓度,取得 4444个 )1(21 −− − nt α oooo )1(21 −− nt α tttt
独立测定值的平均值 %34.8=x ,样本标准差
%03.0=s .设总体近似服从 ) ,( 2σµN .求 µ 的 0.950.950.950.95置信区间.
解: 05.0=α , 025.02 =
α , 2 ,31 ,4 σ=−= nn 未知. 1824.3)3(975.0 =t ,
%015.0
4
%03.0
==
n
s
.
∴ µ 的 0.950.950.950.95置信区间为 %)388.8 %,292.8()]%)015.01824.3(34.8([ =×± .
2222.方差 2σ 的区间估计(设 2σµ、 未知) 2α )(yf
2
S 是 2σ 的无偏估计,且 )1n(
)1( 2
2
2
−
−
χ
σ
~Sn . 2α
取 αχ
σ
χ
αα
−=
⎭
⎬
⎫
⎩
⎨
⎧
−<
−
<− − 1)1n(
)1(
)1n( 2 212
2
2
2
Sn
P , oooo )1(2 2 −nαχ )1(
2
21 −− nαχ yyyy
解得 2σ 的 )1 ( α− 置信区间为 ⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−
−
−
−
− )1n(
1)S(n
,
)1n(
)1(
2
2
2
2
21
2
αα
χχ
Sn . (*)(*)(*)(*)
由(*)(*)(*)(*)式还可得σ 的 )1( α− 置信区间为 ⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−
−
−
−
−
S
)1n(
1)(n
,
)1n(
)1(
2
2
2
21 αα χχ
Sn .
注:在这里采用了“等尾置信区间”.
例 3333.求例 2222中 2σ 的 0.950.950.950.95置信区间及σ 的 0.950.950.950.95置信区间.
解: 31=−n , 05.0=α , 025.02 =
α , 975.021 =−
α . 查附表 2222, 348.9)3(2975.0 =χ ,
216.0)3(2025.0 =χ ,
82 109 −×=s .
2
σ 的 0.950.950.950.95置信区间 )10125 ,1089.2(216.0
1093
,
348.9
1093 88
88
−−
−−
××=⎟⎟
⎠
⎞
⎜⎜
⎝
⎛ ××××
;
σ 的 0.950.950.950.95置信区间 )1011.2 ,107.1()10125 ,1089.2( 4488 −−−− ××=×× .
二.... 两个正态总体的情况
实际中常遇见这样的问题:已知某产品的质量指标 XXXX服从正态分布,但由于工艺改变、原料不
同、设备条件不同、操作人员不同等因素,引起总体均值、方差有改变.我们需知道这些改变有
多大.这就需要考虑两总体均值差或者方差比的估计问题.
设总体 ) ,( 211 σµNX~ ,样本 1n 1 X , ,ΛX , 样本均值 ∑
=
=
1n
1
i
1
X
1
i
n
X , 样本方差
∑
=
−
−
=
1n
1
2
i
1
2
1 )(X1
1
i
X
n
S ;
总体 ) ,( 222 σµNY~ , 样本 2n 1 Y , ,ΛY , 样本均值 ∑
=
=
2n
1
i
2
Y
1
i
n
Y , 样本方差
∑
=
−
−
=
2n
1
2
i
2
2
2 )(Y1
1
i
Y
n
S ;
两总体 XXXX与 YYYY相互独立.给定置信水平 ) 1 ( α− .
1111.两总体均值差 )( 21 µµ − 的区间估计
(a)(a)(a)(a)
2
2
2
1 , σσ 均已知
由于 X ,Y 分别是 1µ , 2µ 的无偏估计, )( YX − 是 )( 21 µµ − 的无偏估计.且 ⎟⎠
⎞
⎜
⎝
⎛
1
2
1
1 n ,
σ
µNX~ ,
⎟
⎠
⎞
⎜
⎝
⎛
2
2
2
2 n ,
σ
µNY~ , ⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
+−−
nn
,)(
2
2
2
1
2
1
21
σσ
µµNYX ~ , )1 ,0(
nn
)()(
2
2
21
2
1
21
N
YX
W ~
σσ
µµ
+
−−−
= ,
得 )( 21 µµ − 的 ) 1 ( α− 置信区间为 ⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
+⋅±− −
2
2
2
1
2
1
21
nn
uYX
σσ
α .
(b)(b)(b)(b)
2
2
2
1 , σσ 均未知
只要 21 , nn 充分大(一般要求 50≥ ),就可用 ⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
+⋅±− −
2
2
2
1
2
1
21
n
S
n
S
uYX
α 作为 )( 21 µµ − 的
) 1 ( α− 近似置信区间.
(c)(c)(c)(c)
22
2
2
1 σσσ == ,但未知
此时, )2n(
n1n1
)()(
21
21
21 −+
+⋅
−−−
= nt
S
YX
W
W
~µµ , (ch6,(ch6,(ch6,(ch6, Th.Th.Th.Th.6.6.6.6.4444.4.4.4.4)))),
其中 2
)1()1(
21
2
22
2
11
−+
−+−
=
nn
SnSn
S
w .
从而得 )( 21 µµ − 的 ) 1 ( α− 置信区间为 ( )212121 11)2( nnSnntYX w +⋅−+±− −α .
例 4444.检查某地正常成年女子 20202020名,正常成年男子 25252525名,计算得女性红细胞样本均值为 422.1422.1422.1422.16666
万/mm/mm/mm/mm3333,样本方差为 2453.802453.802453.802453.80 ((((万/mm/mm/mm/mm3333))))2222;男性红细胞样本均值为 465.13465.13465.13465.13万/mm/mm/mm/mm3333,样本方差为
3022.413022.413022.413022.41 ((((万 /mm/mm/mm/mm3333))))2222.设总体 XXXX 和 YYYY 分别表示正常成年女性和男性每 mmmmmmmm3333中的红细胞数,
) ,( 21 σµNX~ , ) ,( 22 σµNY~ , 2σ 未知.求 )( 21 µµ − 的 0.990.990.990.99置信区间.
解: 222
2
1 σσσ == ,但未知. 99.01 =−α , 995.021 ,005.02 =−= αα ,
432n ,25n ,20 2121 =−+== nn . 6951.2)43(995.0 =t ,
64.52
43
41.30222480.245319
=
×+×
=
w
S . )( 21 µµ − 的 0.90.90.90.99999置信区间为
)0.41 ,53.85()56.4213.46516.422(
25
1
20
1
)43(995.0 −−=±−=⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
+⋅±−
w
Styx .
含意:我们有较大把握认为,若置信下限 0> ,则 21 µµ > ; 若置信上限 0< ,则 21 µµ < ; 若
置信区间含 0000,则均值无显著差别.
2222.两总体方差比的区间估计(设 21 µµ、 未知)
因 )1n(
)1(
1
2
2
1
2
11 −
−
χ
σ
~Sn , )1n(
)1(
2
2
2
2
2
22 −
−
χ
σ
~Sn , 相互独立.
比值 )1n 1,n(])1[()1(
])1[()1(
212
2
2
1
2
2
2
1
2
22
2
22
2
11
2
11 −−=
−−
−−
= F
SS
nSn
nSn
F ~
σσσ
σ
.
由 α
σσ
αα
−=
⎭
⎬
⎫
⎩
⎨
⎧
−−<<−− − 1)1n 1,n()1n 1,n( 21212
2
2
1
2
2
2
1
212 F
SS
FP ,
得
2
2
2
1 σσ 的 )1( α− 置信区间 ⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−−−−− )1n 1,n(
,
)1n 1,n( 212
2
2
2
1
2121
2
2
2
1
αα
F
SS
F
SS
.
含意:我们有较大把握认为,若置信上限 1< 或下限 1> ,则方差 22
2
1 , σσ 有显著差别;若置信
区间包含 1111,则方差无显著差别.
例 5.5.5.5. 总体 ) ,( 211 σµNX~ , ) ,(
2
22 σµNY~ , 容量 10n ,21 21 ==n ,样本方差 38.6
2
1 =s ,
15.522 =s ,置信水平 9.0)1( =−α . 则 05.02 =
α , 95.021 =−
α , 94.2)9 ,20(95.0 =F ,
39.2
1
)20 ,9(
1
)9 ,20(
95.0
05.0 ==
F
F , 24.115.5
38.6
2
2
2
1 ==
s
s
. 故 22
2
1 σσ 的 0.950.950.950.95 置 信 区 间 为
)2.964 ,422.0(2.391.24 ,
94.2
24.1
=⎟
⎠
⎞
⎜
⎝
⎛ × . 表明 22
2
1 σσ 无显著差别.
请见 207P 表 7.3.17.3.17.3.17.3.1.
三.... 单侧置信区间
前面求解了双侧置信区间 )ˆ ,ˆ( 21 θθ .但在某些实际问题中,如设备、元件的寿命,我们希望平
均寿命长,即关心平均寿命的下限;相反,对产品的次品率 pppp,关心 pppp的上限.这就引出单侧置
信区间的概念.
给定置信水平 )1( α− ,样本 n21 X , ,X , ΛX .
(a)(a)(a)(a) 统计量 ), ,,(ˆˆ 2111 nXXX Λθθ = 满足 αθθ −≥> 1}ˆ{ 1P , 称区间 ) ,
ˆ( 1 ∞+θ 是θ 的一个置
信水平为 )1( α− 的单侧置信区间, 1ˆθ ————————θ 的 )1( α− 单侧置信下限.
(b)(b)(b)(b) 统计量 ), ,,(ˆˆ 2122 nXXX Λθθ = 满足 αθθ −≥< 1}ˆ{ 2P ,称区间 )ˆ ,( 2θ−∞ 是θ 的一个置
信水平为 )1( α− 的单侧置信区间, 2ˆθ ————————θ 的 )1( α− 单侧置信上限.
例如,总体 ) ,( 2σµNX~ , 2σµ、 未知.样本 n21 X , ,X , ΛX , 置信水平 )1( α− .
(a)(a)(a)(a) 由 )1 n(
)(
−
−
t
nS
X ~µ , α
µ
α
−=
⎭
⎬
⎫
⎩
⎨
⎧
−<
−
− 1)1(
)(
1 nt
nS
X
P , 即
αµ
α
−=
⎭
⎬
⎫
⎩
⎨
⎧
−−> − 1)1(1 nt
n
S
XP , 得µ 的 )1( α− 单侧置信区间为
⎟
⎠
⎞
⎜
⎝
⎛
∞+−− − )1(1 ,nt
n
S
X
α , 单侧置信下限 )1(ˆ 11 −−= − nt
n
S
X
α
µ .
f(t)f(t)f(t)f(t) f(y)f(y)f(y)f(y)
α α−1
α−1 α
oooo )1(1 −− nt α tttt oooo )1(
2 −n
α
χ yyyy
(b)(b)(b)(b) 由 )1n(
)1( 2
2
2
−
−
χ
σ
~Sn , αχ
σ
α
−=
⎭
⎬
⎫
⎩
⎨
⎧
−>
−
1)1n(
)1( 2
2
2
Sn
P , 即
α
χ
σ
α
−=
⎭
⎬
⎫
⎩
⎨
⎧
−
−
< 1
)1n(
)1(
2
2
2 Sn
P ,
得 2σ 的 )1( α− 单侧置信区间为 ⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
−
−
)1n(
1)S(n
,0
2
2
α
χ
, 单侧置信上限 )1n(
1)S(n
ˆ
2
2
2
−
−
=
α
χ
σ .
例 6666.从一批灯泡中抽 5555只作寿命试验,测得寿命(小时)为 1050105010501050,1100110011001100,1120112011201120,1250125012501250,1280128012801280.
设总体 ) ,( 2σµNX~ , 2σµ、 未知,置信水平 95.01 =−α . 1318.2)4()1( t,5 95.01 ==−= − tnn α
9950s 1160,x 2 == , 得 µ 的 )1( α− 单侧置信下限 1065)1(ˆ 11 =−−= − nt
n
s
x
α
µ ;
µ 的 )1( α− 单侧置信区间 ) ,1065( ∞+ .
2
σ 的 )1( α− 单侧置信上限 496.55977711.0
99504
)1n(
1)s(n
ˆ
2
2
2 =
×
=
−
−
=
α
χ
σ ;
2
σ 的 )1( α− 单侧置信区间为 )55977.496 ,0( .