1
概率分布间的关系研究
姓名:王斌姓名:王斌姓名:王斌姓名:王斌
专业:专业:专业:专业:06060606信息与计算科学信息与计算科学信息与计算科学信息与计算科学 B1B1B1B1 班班班班
指导老师:史及民指导老师:史及民指导老师:史及民指导老师:史及民
一、摘要
随机变量的概率分布是概率论和数理统计教学中最基本的概念,也是随机变量研究的
终极目的。众多概率分布彼此之间存在着这样那样的联系,弄清楚这些分布之间的关系对学
习和应用概率论无疑是十分重要的。本文介绍了常见的几种概率分布,例如: 、、、 tF2χ 正态
等之间的关系,也列举了一些不常见的分布,如超几何、威布尔等等之间的联系,并对文中
的某些关系进行严格的理论推导与证明,最后还给出了几个应用实例。
二、关键词:分布、正态分布、复合、特征函数
三、关系研究
(一)关系分类研究
1、均匀、指数、威布尔、瑞利、麦克斯韦、辛普森这几个分布间关系
这一部分涉及的几个分布间关系的简单图如下:
麦克斯韦分布瑞利分布威布尔分布指数分布均匀分布辛普森分布 ←→↔↔←
(图1)
下面一一进行论证:
(1) 指数分布均匀分布↔
1 指数分布均匀分布→
命题:设随机变量 )1,0(~UX ,其概率密度为:
2
⎩
⎨
⎧ <<
=
其他,0
10,1
)(
x
xf ,则 )0)((~ln 1 >−= αα
α
eXY
解:
依题有:
α
α
α
α
y
y
y
e
dxxf
eXP
yXP
yYP
yF
e
Y
−
−
−=
=
≥=
≤−=
≤=
∫ −
1
)(
}{
}ln{
}{
)(
1
对上式求导, 0,)( 1 >= − yeyf
y
Y
α
α
0≤y 时, 0)( =yf
Y
;
即有
XY lnα−= 的 ... fdp 为:
⎪⎩
⎪
⎨
⎧
≤
>
=
−
0,0
0,
)(
1
y
ye
yf
y
α
α
即 )0)((~ln 1 为参数>−= αα
α
eXY
其实有以下一般结论:
若 )(xGy = 为单调、连续函数,不妨设 )(xG 单增, )(1 yGx −= 为其反函数,又设
)1,0(~Uξ ,则 )(~)(1 yGGY ′= − ξ
证明:
依题 ),( +∞−∞∈Y , })({}{)( 1 yGPyYPyF
Y
≤=≤= − ξ ,而由已知 )(xGy = 为单增
且连续的函数
)()}({})({
)(
0
1
yGdxyGPyGP
yG
==≤=≤∴ ∫− ξξ
对上式求导得: )()( yGyf
Y
′= ,此即为 )(1 ξ−=GY 的概率密度,即有:
)(~)(1 yGGY ′= − ξ
2 均匀分布指数分布→
命题:设随机变量 )(~ λeX ,其概率密度为:
3
⎩
⎨
⎧
≤
>
=
−
0,0
0,
)(
x
xe
xf
xλ
λ
则 )1,0(~UeY Xλ−=
解:
)ln(1}ln{}{)( 11 yFyXPyePyF
X
X
Y
λλ
λ −−=−≥=≤= −
对其求导得: )100ln(1)ln)(ln()( 111 <<>−=′−−−= yyyyfyf
XY
即为其中
λλλ
⎩
⎨
⎧ <<
=∴
其他,0
10,1
)(
y
yf
Y
(2) 威布尔分布指数分布↔
威布尔分布 ),( αλW 的 ... fdp 为: )0,(
0,0
0,
)(
1
为常数>
⎪⎩
⎪
⎨
⎧
≤
>
=
−−
αλ
λα
α
λα
x
xex
xf
x
1 )()1,( λλ eW =
设随机变量 )1,(~ λWX ,则其 ... fdp 为:
⎩
⎨
⎧
≤
>
=
−
0,0
0,
)(
x
xe
xf
xλ
λ
此式正说明 )(~ λeX ,∴ )()1,( λλ eW =
可见,指数分布乃是威布尔分布的特例。
2 ),(~
1
αλ
α
WXY =
命题:若 )(~ λeX ,则 )0)(,(~
1
>= ααλα WXY
证明:
)0()()(
}{}{}{)(
11
0
1
>=⋅=′=∴
=≤=≤=≤=
−−−−
−∫
yeyyeyFyf
dxeyXPyXPyYPyF
yy
YY
y
x
Y
αα
α
α
λααλ
λα
λααλ
λ
显然知当 0≤y 时, 0)( =yf
Y
;
从而证得 )0)(,(~
1
>= ααλα WXY
(3) 瑞利分布→),( αλW
命题:威布尔分布 )(Weibull 中当令 2=α 时则化为瑞利分布。
即:瑞利分布是威布尔分布的一个特殊情况。
4
证明:
若随机变量 X 的 ... fdp 为 )0(
0,0
0,)(
22
2
2 为常数其中 >
⎪⎩
⎪
⎨
⎧
≤
>=
−
σ
σ
σ
x
xe
xf
x
x
,称 X 服从
参数为σ 的瑞利分布。
设随机变量 )2,(~ λWY ,则其 ... fdp 为:
⎪⎩
⎪
⎨
⎧
≤
>
=
−
0,0
0,2
)(
2
x
xxe
yf
xλ
λ
可见,随机变量Y 服从参数为
λ
的瑞利分布,从而命题得证。
(4) 瑞利分布麦克斯韦分布→
麦克斯韦 )(Maxwell 分布的 ... fdp 为:
)0(
0,0
0,)(
2
2
3
24
为参数>
⎪⎩
⎪
⎨
⎧
≤
>=
−
α
α
πα
x
xe
xf
x
x
瑞利分布的 ... fdp 为:
)0(
0,0
0,2
)(
2
为参数>
⎪⎩
⎪
⎨
⎧
≤
>
=
−
λ
λ
λ
x
xxe
xf
x
命题:设随机变量
X
服从参数为
α
的麦克斯韦分布,则
πα
2
2
X
Y = 服从参数为π 的瑞利分布。
证明:
)0(2
)()(
)()(
)(
}{
}{
}{)(
2
)(4 2
2)(
3
2
2
2
>=
⋅=
′⋅=
′=∴
=
≤=
≤=
≤=
−
−
yey
e
yyf
yFyf
yF
yXP
yP
yYPyF
y
y
y
X
YY
X
X
Y
y
π
πα
πα
πα
πα
π
παπα
πα
πα
α
πα
0≤y 时, 0)( =yf
Y
;
⎩
⎨
⎧
≤
>
=∴
−
0,0
0,2
)(
y
yey
yf
y
Y
π
π
令 yt = ,则有:
5
⎪⎩
⎪
⎨
⎧
≤
>
=
−
0,0
0,2
)(
2
t
tte
yf
t
Y
π
π
从而原命题得证。
(5)威布尔、指数、瑞利这三个分布之间性质的比较
1 共同性质
许多产品(例如轴承)的使用寿命服从威布尔分布。威布尔是瑞典物理学家,他在 1939
年研究物质材料的强度时首先提出了这种分布。
威布尔分布 ),( αλW 的数学期望 µ和方差 2σ 分别为:
⎥⎦
⎤
⎢⎣
⎡
+Γ−+Γ=+Γ=
−−
)
1
1()
2
1(),
1
1( 2
2
2
1
αα
λσ
α
λµ
αα
由前面的推导知,当令 ),( αλW 中 1=α 时就化为了参数为λ的指数分布,令 2=α 就
是参数为
λ
的瑞利分布了,则很容易由 ),( αλW 的 2σµ、 求得指数分布与瑞利分布的 µ和
2
σ 了。
2 指数分布的无记忆性
指数分布通常用来描述对某一事件发生的等待时间,比如,来客在公共汽车站等车的时
间,灯泡使用寿命(等待用坏的时间),电话交换台收到两次呼叫的时间间隔。在离散型分
布中,我们知道,几何分布用来描述伯努利试验中,直到某事件 A发生为止共进行的试验
次数,如果将每次试验视为经历一个单位时间,那么直到事件 A发生为止进行的试验次数
可视为直到 A发生为止的等待时间(离散时间)。在这个意义上,指数分布可视为离散型情
形的几何分布在连续型情形的推广。
虽然指数分布是威布尔分布的一个特例,但是它与几何分布类似,具有“无记忆性”的
特性,而这是威布尔分布所没有的性质。
指数分布无记忆性的数学
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
示为:
,0, ≥∀ ts 有:
}{
}{
}{
}{
},{
}{
)(
tXP
e
e
e
sXP
tsXP
sXP
sXtsXP
sXtsXP
t
s
ts
>=
=
=
>
+>
=
>
>+>
=
>+>
−
−
+−
λ
λ
λ
所谓无记忆性,是说它忘记自己已经生活了 s年,它再继续生活 t年以上的概率与新生
儿能生活 t年以上的概率一样。为此我们通常戏称指数分布是“永远年青”的分布。
6
正因为指数分布这一特性,因而常用它来描述这一类寿命分布,其衰老作用不明显,或
其生命的结束主要是随机因素造成的。它的应用十分广泛,例如很多电子元器件(电子管、
电视机)的寿命(从生产出来到失去规定功能所经历的时间),某些微生物、易损物品的寿
命等都服从指数分布。
(6)均匀分布派生出的一个新的分布-辛普森分布
辛普森分布也叫三角分布,是一种连续型分布。假设随机变量
1ξ
和
2ξ
相互独立,且都在
],[
22
ba 上服从均匀分布,则
21 ξξ + 的分布称为三角分布,其概率密度为:
⎪
⎪
⎪
⎩
⎪
⎪
⎪
⎨
⎧
∉
≤<
+
−
−
+
≤≤
−
−
=+
]),[(0
)
2
(
)(
)(4
)
2
(
)(
)(4
)(
2
2
21
bax
bx
ba
ab
xb
ba
xa
ab
ax
xp
ξξ
说明:三角分布也正说明了并非所有的分布都具有可加性,均匀分布就是一个例外。
综上所述,得这几个分布之间的关系图如下:
瑞利分布麦克斯韦分布 ⎯⎯ →⎯
=
πα
2
2
X
Y
特例
2=α 1=α
威布尔分布指数分布均匀分布 ⎯⎯⎯⎯ →⎯ >= )0(
1
α
α
XY
)0(ln >−= αα XY
X
eY
λ−=
派生
辛普森分布
特性
无记忆性
分布)(λe
(图 2)
7
2、与负二项分布有关的一些分布
这一部分涉及的几个分布的简单关系图:
泊松分布负二项分布正态分布 →←
指数分布几何分布→
分布Γ
(图 3)
(1)负二项分布渐近泊松分布
),( 为常数且条件:泊松分布负二项分布 渐近 λ→∞→⎯⎯→⎯
p
rq
r
证明:
负二项分布是一种等待时间的分布,它的分布律为:
),1,,0,,1(}{ 11 ⋯+=>=+== −−− rrkqpqprqpCkXP rkrrk 为正整数,
X 服从负二项分布记作: ),(~ prNBX
将负二项分布律作一个等价变换有:
rkrrk
rkr
rkrrk
k
rkrr
k
qpCqpCqpCkXP
−−
−−+
−−
−
−−
− ==== 1)(1
1
1}{
从而负二项分布的分布律可写成:
),2,1,0,0,,1,(}{ 1 ⋯=>=+== −+ xqpqprqpCxXP
xrx
xr
为正整数
负二项分布的母函数为: r
q
p
p )()( 1 θθ −=
)(~
,
∞→∴
→∞→
r
r
p
q
p
rq
r
λ
λ∵
从而
)1()(lim
)1lim)(1(
1ln1lnlim
)(lnlim
−
∞→
∞→
∞→
∞→
=∴
=−=
⎥
⎥
⎦
⎤
⎢
⎢
⎣
⎡
⎟
⎠
⎞
⎜
⎝
⎛
−−⎟
⎠
⎞
⎜
⎝
⎛
−=
θλ
θ
θλ
λθλ
θ
ep
p
r
p
r
p
p
r
r
rr
r
r
其中
8
而我们知道 )1( −θλ
e
是泊松分布的母函数,据唯一性定理知:在 ∞→r ,且 λ→
p
rq 为常数
时,负二项分布渐近泊松分布。
注:
唯一性定理:分布函数 )(1 xF 及 )(2 xF 恒等的充分必要条件为它们的特征函数 )(1 xϕ 及
)(2 xϕ 恒等;这一问题中研究的是取值为全体非负整数值 ),2,1,0( ⋯=k 的随机变量,用母
函数代替特征函数较为方便。
(2)负二项分布渐近正态分布
)正态分布(负二项分布 渐近 ∞→⎯⎯→⎯ r
证明:
设 X 服从负二项分布,考虑
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
随机变量
qrp
qrpX
Y
1
1
−
−−
= , Y 的特征函数为:
r
rq
itp
rqitr
Y
qeept
−
−
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−= 1)(ϕ ,
利用泰勒展开,有:
2
2
22
2222
)(
2
2
1lim
2
lim
2
1
2
1
lim
lim
)(lim
t
r
r
r
r
r
r
r
rq
qpit
rq
itq
r
Y
r
e
r
t
p
r
qt
po
r
pt
p
p
rq
t
o
rq
t
rq
it
q
r
qt
o
r
qt
rq
itq
p
qee
t
−
−
∞→
−
∞→
−
∞→
−+
∞→
∞→
=⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
+=
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎣
⎡
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
++
=
⎪
⎪
⎭
⎪
⎪
⎬
⎫
⎪
⎪
⎩
⎪
⎪
⎨
⎧
⎥
⎥
⎦
⎤
⎢
⎢
⎣
⎡
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
+−+−⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
+−+
=
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎣
⎡
−
=
ϕ
而 2
2
t
e
−
是 )1,0(N 的特征函数,由逆极限定理易知:负二项分布在 ∞→r 时渐近正态分布。
9
注:
逆极限定理:设特征函数列 ⋯),(),( 21 tt ϕϕ 收敛于某一函数 )(tϕ ,且 )(tϕ 连续(或在
0=t 点连续),则相应的分布函数列 ⋯),(),( 21 xFxF 弱收敛于某一分布函数 )(xF ,而且
)(tϕ 是 )(xF 的特征函数。
(3)负二项分布渐近Γ分布
)0( →Γ⎯⎯→⎯ p分布负二项分布 渐近
证明:
Γ分布的 ... fdp 为:
)0,(
0,0
0,
)()(
1
>
⎪⎩
⎪
⎨
⎧
<
≥
Γ=
−−
λ
λ
λ
r
x
xex
r
xf
xr
r
设 X 服从负二项分布,令
qrp
qrpX
Y
1
1
−
−−
= ,则Y 的特征函数为:
r
rq
itp
rqit
r
rq
itp
rq
itp
rq
itr
Y
p
qe
e
qe
pe
et
−
−
−
⎟⎟
⎟
⎟
⎠
⎞
⎜⎜
⎜
⎜
⎝
⎛
−
=
⎟⎟
⎟
⎟
⎠
⎞
⎜⎜
⎜
⎜
⎝
⎛
−
=
1
1
)(ϕ
从而
( )
r
rit
r
p
rit
r
p
rit
r
rq
itp
op
rit
Y
p
r
it
e
p
p
r
qit
p
e
p
po
rq
itp
q
e
p
qe
et
−
−
−
→
−
−
→
−
−
→
−
→
⎟
⎠
⎞
⎜
⎝
⎛
−=
⎟⎟
⎟
⎟
⎟
⎠
⎞
⎜⎜
⎜
⎜
⎜
⎝
⎛
−
=
⎥
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎢
⎣
⎡
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
++−
=
⎟⎟
⎟
⎟
⎠
⎞
⎜⎜
⎜
⎜
⎝
⎛
−
=
1
lim
11
lim
1
lim)(lim
0
0
0
ϕ
而
r
rit
r
it
e
−
− ⎟
⎠
⎞
⎜
⎝
⎛
−1 正是服从 Γ分布的标准化随机变量的特征函数,根据逆极限定理知:负
10
二项分布在 0→p 时渐近 Γ分布。
注:
上述证明的一个特殊情形:关于几何分布渐近指数分布的证明 )0( →p
证明:
几何分布的分布律为: ),2,1(}{ 1 ⋯=== − kpqkXP k ,我们知道几何分布是负二项分
布中 1=r 的特殊情形,所以几何分布渐近指数分布的证明正是负二项分布渐近 Γ分布证明
中 1=r 的情形。
(4)负二项分布与几何分布的性质比较
1 共性
负二项分布: ⋯,1,,}{)( 11 +==== −−− rrxqpCxXPxf rxrrx
其数学期望、方差和矩母函数分别为:
r
t
t
qe
pe
tM
p
rq
p
r
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
−
===
1
)(,,
2
2
σµ
负二项分布中,当 1=r 时,称作几何分布,其分布律为: ),2,1(}{ 1 ⋯=== − xpqxXP x
由于几何分布为负二项分布之特例,当然它继承了负二项分布的所有性质,可以验证几
何分布的数学期望、方差和矩母函数分别为:
t
t
qe
pe
tM
p
q
p −
===
1
)(,,
1
2
2
σµ
2 几何分布的无记忆性
随机变量 X 服从几何分布简记为: );(~ pxgX ,作为一种等待分布,几何分布在概
率论中具有其重要作用和良好的性质,那就是几何分布的无记忆性。
在贝努里试验中,等待首次成功的时间 X 服从几何分布。现假定已知在前
m
次试验中
没有出现成功,那么为了达到首次成功所需的等待时间Y 服从几何分布,与前面失败次数m
无关。形象地说,就是把过去的经历完全忘记了。因此无记忆性是几何分布所具有的一个有
趣的性质。但是更加有趣的是,在离散分布中,只有几何分布才具有这样一种特殊性质。
用数学式子表示几何分布的无记忆性为:
如果 X 服从参数为 p的几何分布,则对于任何两个正整数 ,,nm 有:
}{}{ nXPmXnmXP >=>+>
简单证明如下:
由
}{
}{
}{
mXP
nmXP
mXnmXP
>
+>
=>+> ,据几何分布的定义有:
m
j
jm
mk
k
qpqqpqmXP ===> ∑∑
∞
=
−
∞
+=
−
1
1
1
1}{
11
同理,有:
nnm
qnXPqnmXP =>=+> + }{,}{
于是得: }{}{ nXPq
q
q
mXnmXP
n
m
nm
>===>+>
+
几何分布的无记忆性,意指几何分布对过去的
m
次失败信息在后面的计算中被遗忘了。
事实上,还可以证明:一个取正整数值的随机变量,如果具有无记忆性,则一定服从几何分
布。可见,无记忆性实际上是几何分布的一个特征性质。
这一部分涉及的几个分布的关系图如下所示:
指数分布几何分布 ⎯⎯ →⎯ →0p
泊松分布负二项分布正态分布 ⎯⎯⎯ →⎯⎯⎯ ⎯← →∞→∞→ λp
rq
r
r
,
分布Γ
0→p
特例
1=r
特性
无记忆性
(图 4)
3、 2χ 分布、指数分布、 Γ分布三者之间的关系
这一部分研究的几个分布之间的简单关系图如下所示:
指数分布分布分布 ↔↔Γ 2χ
分布)(21e
12
(图 5)
这三个分布的定义分别如下:
)(~ λeX ,其中随机变量 X 的 ... fdp 为:
)0(
0,0
0,
)( 为常数其中 >
⎩
⎨
⎧
≤
>
=
−
λ
λ
λ
x
xe
xf
x
)(~ 2 nX χ ,其中随机变量 X的 ... fdp 为:
⎪⎩
⎪
⎨
⎧
≤
>
Γ=
−−
0,0
0,
)(2
1
);(
22
2
1
2
2
x
xex
nx
xn
n
n
χ
),(~ λαΓX ,其中随机变量 X 的 ... fdp 为:
)00(
0,0
0,
)()(
1
为尺度参数为形状参数, >>
⎪⎩
⎪
⎨
⎧
≤
>
Γ=
−−
λα
α
λ
λα
α
x
xex
xp
x
(1) 指数分布分布↔2χ
1 指数分布分布→2χ
对于 )(2 nχ 分布,令 2=n ,则:
⎪⎩
⎪
⎨
⎧
≤
>
=
−
Γ
0,0
0,
)2;(
2
)1(2
1
2
x
xe
x
x
χ
而据Γ函数的定义 dxext xt −
∞
−∫=Γ 0
1)( 知 1)1(
0
==Γ ∫
∞
−
dxe
x
⎪⎩
⎪
⎨
⎧
≤
>
=∴
−
0,0
0,
)2;(
2
2
1
2
x
xe
x
x
χ
即: )(~
2
1
eX
,也就是说
2
1=λ 的指数分布 )(
2
1
e
可看作 2χ 分布的特殊情况。
2 分布指数分布 2χ→
我们有如下命题成立:
若 )(~ λeX ,则 )2;(~2 2 xXY χλ=
证明:
随机变量
X
的概率密度和分布函数分别为: )(),( xFxf
XX
,
随机变量Y 的概率密度和分布函数分别为: )(),( yFyf
YY
13
0),
2
(}
2
{}2{}{)( >=≤=≤=≤= y
y
F
y
XPyXPyYPyF
XY
λλ
λ
☆
显然,当 0≤y 时, 0)(,0)( == yfyF
YY
对于☆式两边同时求导得: 0,
2
1
2
1
)
2
(
2
1
)( 22 >=⋅==
−−
yee
y
fyf
yy
XY
λ
λ
λλ
λ
λ
⎪⎩
⎪
⎨
⎧
≤
>=∴
−
0,0
0,
2
1
)(
2
y
ye
yf
y
Y
可见: )(~2
2
1
eXY λ=
即: )2;(~2 2 xXY χλ=
(2)Γ分布自身的一些性质
1 Γ分布自身间存在的关系: Γ分布关于形状参数
α
具有可加性
命题:设 ),(~),,(~ 2211 λαλα ΓΓ XX ,且 1X 与 2X 相互独立,试证
),(~ 2121 λαα +Γ+ XX
1X 、 2X 的概率密度分别为:
⎪⎩
⎪
⎨
⎧
≤
>
Γ=
⎪⎩
⎪
⎨
⎧
≤
>
Γ=
−−−−
0,0
0,
)()(,
0,0
0,
)()(
1
2
1
1
2
2
2
1
1
1
y
yey
yf
x
xex
xf
y
X
x
X
λα
α
λα
α
α
λ
α
λ
其中 0,, 21 >λαα 为常数。
证明:
当 0≤Z 时, 21 XXZ += 的概率密度 0)( =zf Z ;
由卷积公式得:当 0>Z 时,
dxxzx
e
dxexzex
dxxzfxf
zf
z
z
xzx
z
XX
Z
∫
∫
∫
−−
−+
−−−−−
∞+
∞−
−
ΓΓ
=
−
Γ
⋅
Γ
=
−=
0
11
21
)(1
2
1
0
1
21
21
2
2
1
1
21
)(
)()(
)(
)()(
)()(
)(
αα
λ
αα
λα
α
λα
α
αα
λ
α
λ
α
λ
当令
ztx = 时有:
14
dtttz
zdttztz
dxxzx
z
1
1
0
11
1
1
0
111
1
0
1
2121
2211
21
)1(
)1(
)(
−−−+
−−−−
−−
−=
⋅−=
−
∫
∫
∫
αααα
αααα
αα
zz
Z
eAzezdtttzf
λααλαααα
αα
αα
λ −−+−−+−−
+
=⋅⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
−
ΓΓ
=∴ ∫ 111
1
0
1
21
212121
21
)1(
)()(
)(
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
−
ΓΓ
= ∫ −−
+
dtttA
1
0
11
21
21
21
)1(
)()(
αα
αα
αα
λ其中
现在来计算 A ,由概率密度的性质有: dzezAdzzf z
Z ∫∫
+∞
−−+
+∞
==
0
1
0
21)(1 λαα
而我们知道
αα
α
det
t −
+∞
−∫=Γ 0
1)(
所以上式即: )()()(1 21
0
1
21
21
21
αα
λ
λλ
λ
αα
λαα
αα
+Γ==
+
+∞
−−+
+ ∫
A
zdez
A
z
)( 21
21
αα
λ
αα
+Γ
=∴
+
A
⎪⎩
⎪
⎨
⎧
≤
>
+Γ=∴
−−+
+
0,0
0,
)()(
1
21
21
21
z
zez
zf
z
Z
λαα
αα
αα
λ
即证得: ),(~ 2121 λαα +Γ+ XX
拓展推广:同样运用数学归纳法可得到 n个相互独立的 Γ分布变量之和也服从Γ分布。
即: ),,2,1( niX
i
⋯= 相互独立,且 ),(~ λα
ii
X Γ ,则:∑ ∑
= =
Γ
n
i
n
i
ii
X
1 1
),(~ λα
这一性质叫做Γ分布的可加性 。
2 Γ分布的特例-指数分布 )(λe
除了所特有的无记忆性外,指数分布完全继承了Γ分布的可加性质、 Γ函数与
),( 21 ααΒ 之关系的性质。另外,若 )(~ λeX ,由于 ),1()( λλ Γ=e ,则由Γ分布的
2
,
λ
α
λ
α
== DXEX ,矩母函数 )()( λ
λ
λ
α
<⎟
⎠
⎞
⎜
⎝
⎛
−
= t
t
tM 可以得到指数分布的
)()(,
1
,
1
2
λ
λ
λ
λλ
<
−
=== t
t
tMDXEX 对于
(3) 分布分布 Γ↔2χ
15
从以上的论述知 2χ 分布与指数分布, Γ分布与指数分布之间存在有互推关系,那么大
家自然会联系到 2χ 分布与 Γ分布之间也应该存在着某种关系,而事实也正是如此。下面我
们就来揭示这两个分布之间的密切关系。
1 分布分布 Γ→)(2 nχ
2
χ 分布的概率密度函数为:
⎪⎩
⎪
⎨
⎧
≤
>
Γ=
−−
0,0
0,
)(2
1
);(
22
2
1
2
2
x
xex
nx
xn
n
n
χ
Γ分布的概率密度函数为: )0(
0,0
0,
)()(
1
为常数,其中 >
⎪⎩
⎪
⎨
⎧
≤
>
Γ=
−−
λα
α
λ
λα
α
x
xex
xf
x
通过仔细观察,我们不难发现,当令 2
χ
分布中
α2=n 时 ),()2(
2
12
ααχ Γ= ,说明 2χ 分布
可看作Γ分布之特殊情况。
2 分布分布 )(2 nχ→Γ
命题如下:若 ),(~ λαΓX ,则: )2(~2 2 αχλXY =
证明:
22 1)(1
22
2
)(2
1
)(
)(2
1
)(
2
1
)(
0)(,0
)(}
2
{}2{}{)(,0
0,
yy
eyefyf
yfy
F
y
XPyXPyYPyFy
yy
XY
Y
y
XY
−−−−
Γ
=
Γ
==∴
=≤
=≤=≤=≤=>∴
>
α
α
λ
α
λ
α
λ
λ
αα
λ
λλ
λ
λ
λα
λ
时当
时当
∵
综上所述,
⎪⎩
⎪
⎨
⎧
≤
>
Γ=
−−
0,0
0,
)(2
1
)(
21
y
yey
yf
y
Y
α
α
α
即证得: )2(~2 2 αχλXY =
3 说明:从以上的推导我们知道 2χ 分布可看作是Γ分布的特殊情形,那么 2χ 分布就
会继承 Γ分布的一些性质,最明显的是它也会像 Γ分布一样具有可加性。
由以上讨论,我们得出 Γ、指数、2χ 这三个分布之间的推导关系图如下:
16
指数分布分布分布可加性 ⎯⎯ ⎯←⎯⎯ →⎯Γ← == XYXY λλ χ 222
特例
2=n
分布)(
2
1
e
(图 6)
4、常用统计量的分布 tF、、2χ 三者之间的密切关系
这一部分涉及的几个分布间关系的简单图如下:
分布分布分布 2χ→→ Ft
(图7)
下面一一进行论述:
(1) tF、 这两个分布间关系
F分布与 t分布有如下关系式成立:
)(),1( 2 ntnF =
证明:
设
n
Y
X
tntt =),(~ ,其中 )(~),1,0(~ 2 nYNX χ ,且 YX、 相互独立
)(
2
2
n
Y
X
t =∴
而 )(~),1(~ 222 nYX χχ ,且 2X 与Y 相互独立,由 F分布的定义知 2t 服从自由度为 ),1( n
的 F 分布,即: ),1(~
)(
2
2
nF
n
Y
X
t =
(2) )(2 nF χ、 两个分布间关系
F
分布与 )(2 nχ 分布关系式为:
n
n
nF
)(
),(
2
χ
=∞
证明:
在 ),( 21 nnF 中令 nn =1 ,则其 ... fdp 为:
17
⎪
⎩
⎪
⎨
⎧
≤
>+
ΓΓ
Γ
=
−−
+
+
0,0
0,)1()(
)()(
)(
)(
1
22
2 22
2
2
2
22
2
x
xxx
xf
n
nn
n
n
n
n
n
n
n
nn
当 0>x 时, 1222
22
2
2
2
2
22 ln)1ln()ln()(ln)(ln)(ln)(ln −−+ ++++Γ−Γ−Γ=
+
n
nn
n
xxxf
n
n
n
n
n
n
nn
根据Γ函数的斯特林 )(stirling近似公式:
⎥⎦
⎤
⎢⎣
⎡
+−=++−−=Γ )(
360
1
12
1
)()(2ln
2
1
ln)()(ln 5
1
32
1
x
o
xx
xRxRxxxx π
易求得: )0(
)(2
)(
ln)(lnlim 2
2
2
2
2
1
>
⎥
⎥
⎦
⎤
⎢
⎢
⎣
⎡
⋅
Γ
= −
−
∞→
xne
nx
xf
nx
n
n
nn
显然当 0≤x 时, 0)(lim
2
=
∞→
xf
n
⎪⎩
⎪
⎨
⎧
≤
>
Γ=∴
−−
∞→
0,0
0,)(
)(2)(lim
22
2
2
1
2
x
xenx
n
xf
nxn
n
n
n
等式右端正好为
n
n)(2χ 分布的 ... fdp
F∴ 分布当 nn =1 , ∞→2n 时渐近
n
n)(2χ 分布,即有:
n
n
nF
)(
),(
2
χ
=∞
以上所讨论的分布之间关系的详细图如下所示:
分布分布分布 2, 21
2
χ⎯⎯⎯ →⎯⎯→⎯ ∞→= nnnt Ft
(图8)
5、与正态分布有关的一些分布
这一部分要研究的几个分布之间关系的简单图谱如下所示:
18
二项分布正态分布对数正态分布 ←↔
分布2χ
分布Γ 分布t
(图 9)
(1) 先来证明正态分布自身的一些性质:1)线性性,2)可加性
1 线性性的证明
命题:设随机变量 ),(~ 2σµNX ,试证明 X 的线性函数
))(,(~)0( 2σµ abaNabaXY +≠+=
证明:
由 baxy += 得 )(yg
a
by
x =
−
= 且有
a
yg
1
)( =′ ,据随机变量函数的概率密度求解定
理得
baxY += 的概率密度为: )(
1
))(()()(
a
by
f
a
ygfygyf
XXY
−
=′=
而 +∞<<−∞=
−
−
xexf
x
X
,
2
1
)( 22
2)(
σ
µ
σπ
+∞<<−∞==∴
+−−
−
−−
ye
a
e
a
yf
a
aby
a
by
Y
,
2
1
2
11
)(
2)(2
2)]([
22
2)(
σ
µ
σ
µ
πσσπ
即有: ))(,(~ 2σµ abaNY +
2 可加性的证明
命题:设随机变量
YX、 相互独立, )1,0(~, NYX ,其概率密度分别如下:
+∞<<−∞=
+∞<<−∞=
−
−
yeyf
xexf
y
x
Y
X
,
2
1
)(
,
2
1
)(
2
2
2
2
π
π
求 YXZ += 的概率密度。
解:
由卷积公式有:
dxeedxeedxxzfxfzf
zz
xz
x
x
YXZ ∫∫∫
+∞
∞−
−−−+∞
∞−
−−+∞
∞−
==−=
− 2
24
2
2
2)(
2
2
)(
2
1
2
1
)()()(
ππ
19
令
2
z
xt −= 得: 4
2
4
22
4
2
2
1
2
1
2
1
)(
zzz
eedteezf
t
Z
−−+∞
∞−
−− === ∫
π
π
ππ
即: )2,0(~ NZ
一般地,设
YX、 相互独立且 ),(~ 211 σµNX , ),(~
2
22 σµNY ,则 YXZ += 仍然服
从正态分布,即 ),(~ 22
2
121 σσµµ ++NZ 。这个结论还能推广到 n个独立正态随机变量之
和的情况,即若 ),,2,1(),(~ 2 niNX
iii
⋯=σµ ,且他们相互独立,则他们的和
n
XXXZ +++= ⋯21 仍然服从正态分布,
且有 ),(~ 222
2
121 nnNZ σσσµµµ ++++++ ⋯⋯
更一般地,可以证明有限个相互独立的正态随机变量的线性组合仍然服从正态分布,即
若 ),,2,1( niX
i
⋯= 相互独立且 ),(~ 2
iii
NX σµ
,
nn
XaXaXaZ +++= ⋯2211 ,
则: ),(~
1
22
1
∑∑
==
n
i
ii
n
i
ii
aaNZ σµ
,或者有: ),(~
1
22
11
∑∑∑
===
++=
n
i
ii
n
i
ii
n
i
ii
adaNdXaZ σµ
(2)关于
t
分布渐近正态分布的证明 )( ∞→n
证明:
t分布的概率密度函数为: 2
1
)1(
)(
)(
)(
2
2
2
1
+−
+
+
Γ
Γ
=
n
n
t
n
tf
n
n
π
有: 2
1
)1ln()
2
(lnln)
2
1
(ln)(ln
2
+−++Γ−−
+
Γ=
n
n
tn
n
n
tf π
根据Γ函数的斯特林公式:
⎥⎦
⎤
⎢⎣
⎡ +−=++−−=Γ )(
360
1
12
1
)()(2ln
2
1
ln)
2
1
()(ln 513
x
o
xx
xRxRxxxx π
易算得: )
2
1
ln()(lnlim 2
2
t
etf
n
−
∞→
=
π
即: 2
2
2
1
)(lim
t
etf
n
−
∞→
=
π
从而证得:当
n
很大时,
t
分布渐近正态分布。
(3) 正态分布二项分布→
二项分布与正态分布之间的关系:
20
相对于二项分布来说,正态分布在实际生活的应用中更为常见,正态分布又称为Gauss
分布或高斯拉普拉斯分布,在法国文献中也称为德莫哇佛—拉普拉斯律或拉普拉斯第二律,
以区别于我们称为拉普拉斯分布的拉普拉斯第一律。
命题:设随机变量 )10)(,(~),2,1( <<= ppnbn
n
⋯η ,试证对任意 x有:
)(
2
1
}
)1(
{lim 2
2
xdtex
pnp
np
P
t
x
n
n
Φ==≤
−
− −
∞−∞→ ∫
π
η
证明:
先对
n
η 作一个分解,引入随机变量
k
X ,定义如下:
),,,2,1(
,0
,1
pAnk
kA
kA
X
k
率为在每次试验中发生的概其中
次试验中不发生在第事件
次试验中发生在第事件
⋯=
⎩
⎨
⎧
=
则:
nn
XXX +++= ⋯21η
即将
n
η 分解成了 n个相互独立,且都服从同一个两点分布的 ),,2,1( nkX
k
⋯= 之和,据独
立同分布的中心极限定理有:
⎪
⎪
⎭
⎪⎪
⎬
⎫
⎪
⎪
⎩
⎪⎪
⎨
⎧
≤
−
=
⎪
⎪
⎭
⎪
⎪
⎬
⎫
⎪
⎪
⎩
⎪
⎪
⎨
⎧
≤
− ∑
∑
∑∑
=
∞→
=
==
∞→
x
nDX
nEXX
Px
XD
XEX
P
k
k
n
k
k
n
n
k
k
n
k
k
n
k
k
n
1
1
11 lim
)(
)(
lim
而两点分布的 )1(, ppDXpEX
kk
−==
)(
2
1
)1(
lim 2
2
1
xdtex
pnp
npX
P
x
n
k
k
n
t
Φ==
⎪
⎪
⎭
⎪⎪
⎬
⎫
⎪
⎪
⎩
⎪⎪
⎨
⎧
≤
−
−
∴ ∫
∑
∞−
−=
∞→
π
此命题即为著名的
LaplaceMoivreDe − 定理,这个定理表明正态分布是二项分布的极限
分布,当
n
充分大时可利用上式来计算二项分布的概率。实际上,若
np
和
nq
都大于5,近
似值是很好的。
(4)关于对数正态分布与正态分布关系的证明
对数正态分布的定义如下:
若随机变量 X 的 ... fdp 为:
⎪⎩
⎪
⎨
⎧
≤
>
=
−−
0,0
0,
2
1
)(
22
2)(ln
x
xe
x
xf
x
σ
µ
πσ
则称 X 服从对数正态分布,即有: ),(~ 2σµLNX
1 若 ),(~ 2σµLNX ,则 ),(~ln 2σµNXY =
21
证明:
dxe
x
eXPyXPyYPyF
xy
e
y
Y
22
2)(ln
0 2
1
}{}{ln}{)( σ
µ
πσ
−
−
∫=≤=≤=≤=
+∞<<−∞=⋅=′=∴
−− −−
yeee
e
yFyf
y
y
e
y
y
YY
,
2
1
2
1
)()( 22
2)(
22
2)(ln
σ
µ
σ
µ
σππσ
从而证得: ),(~ln 2σµNXY =
2 若 ),(~ 2σµNX ,则 ),(~ 2σµLNeY X=
证明:
)0()(ln}ln{}{}{)( >=≤=≤=≤= yyFyXPyePyYPyF
X
X
Y
0,
2
1
2
11
)(ln
1
)( 22
2)(ln
22
2)(ln
>===∴
−− −−
ye
y
e
y
yf
y
yf
yy
XY
σ
µ
σ
µ
πσσπ
从而证得 ),(~ 2σµLNeY X=
(5)Γ分布渐近正态分布
)正态分布(分布 渐近 ∞→⎯⎯→⎯Γ α
证明:
设 X 服 从 Γ 分 布 ),( αλΓ , 令
1
1
−
−−
=
αλ
αλX
Y , 则 Y 的 特 征 函 数 为 :
α
α
α
ϕ
−
− ⎟
⎠
⎞
⎜
⎝
⎛
−=
it
et
it
Y
1)( ,
从而:
2
1
0
2
1
0
2
1ln
222
limlimlim)(lim
t
t
tit
it
it
it
Y
eeeeeet
−⎟
⎠
⎞
⎜
⎝
⎛
−−
∞→
⎥
⎥
⎦
⎤
⎢
⎢
⎣
⎡
⎟
⎠
⎞
⎜
⎝
⎛
++−−
−
∞→
⎟
⎠
⎞
⎜
⎝
⎛
−−
−
∞→∞→
==⋅=⋅= α
α
α
ααα
α
α
α
α
α
α
αα
ϕ
而 2
2
t
e
−
恰好是 )1,0(N 的特征函数,由逆极限定理得知: Γ分布在 ∞→α 时渐近正态分布。
(6) 2χ 分布渐近正态分布
)正态分布(分布 渐近 ∞→⎯⎯→⎯ nn)(2χ
证明:
设 )(~ 2 nX χ ,令
n
nX
Y
2
−
= ,则Y的特征函数为:
22
( )
( )
n
nt
nn
t
n
itn
nn
itn
n
n
n
eeeeeet
itit
n
it
it
Y
1
22
2
12
2
2
22
2
2
2
2 0
01ln
2
1)(
+−⎥
⎥
⎦
⎤
⎢
⎢
⎣
⎡
++−−
−⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−−
−
−
−
=⋅=⋅=⎟
⎠
⎞
⎜
⎝
⎛ −=ϕ
故 2
2
)(lim
t
et
Y
n
−
∞→
=ϕ 。
而 2
2
t
e
− 是 )1,0(N 的特征函数,根据逆极限定理知: )(2 nχ 分布在 ∞→n 时渐近正态分布。
(7)注:正态分布的重要性
由独立同分布的中心极限定理、 LaplaceMoivreDe − 定理、 Liapunov定理,我
们看到无论各个随机变量 ),2,1( ⋯=kX
k
服从什么分布,只要满足定理的条件,那么他们的
和∑
=
n
i
k
X
1
的标准化变量当n很大时,就近似的服从 )1,0(N ,这就是为什么正态随机变量在概
率论中占有重要地位的一个基本原因。在很多问题中,所考虑的随机变量可以表示成很多个
独立的随机变量之和,例如:在任一指定时刻,一个城市的耗电量是大量用户耗电量的总和;
一个物理实验的测量误差是由许多观察不到的、可加的微小误差所合成的;他们往往近似地
服从正态分布。
下面给出这部分所研究的概率分布之间的详细关系图:
XY ln=
X
eY =
∞→n
分布2χ
线性性、可加性
分布Γ
∞→α ∞→n
分布t
二项分布正态分布对数正态分布 ⎯⎯ ⎯← ∞→n
(图 10)
23
6、其他一些分布之间的关系
(1) t分布与柯西分布间关系
柯西分布 )0,1(C 是 t分布的一个特殊情况, t分布中当令 1=n 时即化为柯西分布 )0,1(C 。
证明:
柯西分布的 ... fdp 为: )0(
)(
11
)(
22
为常数>
−+
= λ
µλπ x
xf
其中随机变量 ),(~ µλCX
t
分布的 ... fdp 为: )()1(
)(
)(
)( 2
1
2
2
2
1
+∞<<−∞+
Γ
Γ
=
+−
+
t
n
t
n
th
n
n
n
π
令 t分布中自由度 1=n ,得:
2
12
1
11
)1(
)
2
1
(
)1(
)(
t
tth
+
=+
Γ
Γ
= −
π
π
∴当 1=n 时, )0,1(~ Ct
(2)超几何分布、二项分布、泊松分布、多项分布、两点分布这几个分布之间的关系
这几个分布之间简单关系图如下:
泊松分布二项分布超几何分布 →→
两点分布
多项分布
(图 11)
1 超几何分布渐近二项分布
命题: 二项分布超几何分布 渐近⎯⎯→⎯ )0,,( 为概率常数其中条件: ≥→∞→ pp
N
M
N
证明:
超几何分布律为: }),min{,,2,1,0,0,0(}{ MnknNMN
C
CC
kXP
n
N
kn
MN
k
M ⋯=≥≥≥≥==
−
−
X 服从超几何分布记为: ),,(~ nMNHX
二项分布律为: ),,2,1,0,0,,1(}{ nkqpqpqpCkXP knkk
n
⋯=≥=+== −
24
X 服从二项分布记为: ),;(~ pnkbX
下面计算极限式
n
N
kn
MN
k
M
N
C
CC
−
−
∞→
lim
)
1
1()
1
1(1
)
1
1()
1
1)(1()
1
()
1
(
lim
)1()1(
)]1([)1)(()1()1(
lim
!
lim
)!(!
!
lim
lim
N
n
N
N
kn
N
M
NN
M
N
M
N
k
N
M
NN
M
N
M
C
nNNN
knMNMNMNkMMM
C
A
AA
k
A
Aknk
nAA
C
CC
k
n
N
k
n
N
n
N
kn
MN
k
M
k
n
N
n
N
kn
MN
k
M
N
n
N
kn
MN
k
M
N
−
−−
−−
−−−−−⋅
−
−−
⋅=
+−−
−−−−−−−⋅+−−
⋅=
⋅=
−
=
∞→
∞→
−
−
∞→
−
−
∞→
−
−
∞→
⋯
⋯⋯
⋯
⋯⋯
,, p
N
M
N →∞→∵ 同时 01, →∞→
N
M
knkk
n
knkk
n
n
N
kn
MN
k
M
N
qpCppC
C
CC −−
−
−
∞→
=−=∴ )1(lim
∴当 p
N
M
N →∞→ , 时,超几何分布即为二项分布。
2 与二项分布有关的一些分布
1) 泊松分布二项分布→
二项分布与泊松分布都是十分常见的两个分布, Poisson 分布常见于稠密性问题中,
例如:一段时间内电话交换台接到的呼唤次数,公共汽车站台候车的旅客数,放射性物质放
射的粒子数,都是服从
Poisson
分布的离散型随机变量。
二项分布与泊松分布之间的关系:
设 ),;(~ pnkbX ,即有分布律:
),,2,1,0,1,0,(}{ nkqpqpqpCkXP knkk
n
⋯==+≥== −
在二项分布中,若
n
充分大而 p很小时, 0→p 则 11 →−= pq ,
此事件称为稀疏事件。事实上,若 50≥n , p 充分小