概率分布间的关系研究

概率分布间的关系研究 1 概率分布间的关系研究姓名：王斌姓名：王斌姓名：王斌姓名：王斌专业：专业：专业：专业：06060606信息与计算科学信息与计算科学信息与计算科学信息与计算科学 B1B1B1B1 班班班班指导老师：史及民指导老师：史及民指导老师：史及民指导老师：史及民一、摘要随机变量的概率分布是概率论和数理统计教学中最基本的概念，也是随机变量研究的终极目的。众多概率分布彼此之间存在着这样那样的联系，弄清楚这些分布之间的关系对学习和应用概率论无疑是十分重要的。本文介绍了常见的几种概率分布，例如：、、、 t...

1 概率分布间的关系研究姓名：王斌姓名：王斌姓名：王斌姓名：王斌专业：专业：专业：专业：06060606信息与计算科学信息与计算科学信息与计算科学信息与计算科学 B1B1B1B1 班班班班指导老师：史及民指导老师：史及民指导老师：史及民指导老师：史及民一、摘要随机变量的概率分布是概率论和数理统计教学中最基本的概念，也是随机变量研究的终极目的。众多概率分布彼此之间存在着这样那样的联系，弄清楚这些分布之间的关系对学习和应用概率论无疑是十分重要的。本文介绍了常见的几种概率分布，例如：、、、 tF2χ 正态等之间的关系，也列举了一些不常见的分布，如超几何、威布尔等等之间的联系，并对文中的某些关系进行严格的理论推导与证明，最后还给出了几个应用实例。二、关键词：分布、正态分布、复合、特征函数三、关系研究（一）关系分类研究 1、均匀、指数、威布尔、瑞利、麦克斯韦、辛普森这几个分布间关系这一部分涉及的几个分布间关系的简单图如下：麦克斯韦分布瑞利分布威布尔分布指数分布均匀分布辛普森分布 ←→↔↔← （图1）下面一一进行论证： (1) 指数分布均匀分布↔ 1 指数分布均匀分布→ 命题：设随机变量 )1,0(~UX ，其概率密度为： 2 ⎩ ⎨ ⎧ << = 其他,0 10,1 )( x xf ，则 )0)((~ln 1 >−= αα α eXY 解：依题有： α α α α y y y e dxxf eXP yXP yYP yF e Y − − −= = ≥= ≤−= ≤= ∫ − 1 )( }{ }ln{ }{ )( 1 对上式求导， 0,)( 1 >= − yeyf y Y α α 0≤y 时， 0)( =yf Y ；即有 XY lnα−= 的 ... fdp 为： ⎪⎩ ⎪ ⎨ ⎧ ≤ > = − 0,0 0, )( 1 y ye yf y α α 即 )0)((~ln 1 为参数>−= αα α eXY 其实有以下一般结论：若 )(xGy = 为单调、连续函数，不妨设 )(xG 单增， )(1 yGx −= 为其反函数，又设 )1,0(~Uξ ，则 )(~)(1 yGGY ′= − ξ 证明：依题 ),( +∞−∞∈Y ， })({}{)( 1 yGPyYPyF Y ≤=≤= − ξ ，而由已知 )(xGy = 为单增且连续的函数 )()}({})({ )( 0 1 yGdxyGPyGP yG ==≤=≤∴ ∫− ξξ 对上式求导得： )()( yGyf Y ′= ，此即为 )(1 ξ−=GY 的概率密度，即有： )(~)(1 yGGY ′= − ξ 2 均匀分布指数分布→ 命题：设随机变量 )(~ λeX ，其概率密度为： 3 ⎩ ⎨ ⎧ ≤ > = − 0,0 0, )( x xe xf xλ λ 则 )1,0(~UeY Xλ−= 解： )ln(1}ln{}{)( 11 yFyXPyePyF X X Y λλ λ −−=−≥=≤= − 对其求导得： )100ln(1)ln)(ln()( 111 <<>−=′−−−= yyyyfyf XY 即为其中 λλλ ⎩ ⎨ ⎧ << =∴ 其他,0 10,1 )( y yf Y (2) 威布尔分布指数分布↔ 威布尔分布 ),( αλW 的 ... fdp 为： )0,( 0,0 0, )( 1 为常数> ⎪⎩ ⎪ ⎨ ⎧ ≤ > = −− αλ λα α λα x xex xf x 1 )()1,( λλ eW = 设随机变量 )1,(~ λWX ，则其 ... fdp 为： ⎩ ⎨ ⎧ ≤ > = − 0,0 0, )( x xe xf xλ λ 此式正说明 )(~ λeX ，∴ )()1,( λλ eW = 可见，指数分布乃是威布尔分布的特例。 2 ),(~ 1 αλ α WXY = 命题：若 )(~ λeX ，则 )0)(,(~ 1 >= ααλα WXY 证明： )0()()( }{}{}{)( 11 0 1 >=⋅=′=∴ =≤=≤=≤= −−−− −∫ yeyyeyFyf dxeyXPyXPyYPyF yy YY y x Y αα α α λααλ λα λααλ λ 显然知当 0≤y 时， 0)( =yf Y ；从而证得 )0)(,(~ 1 >= ααλα WXY (3) 瑞利分布→),( αλW 命题：威布尔分布 )(Weibull 中当令 2=α 时则化为瑞利分布。即：瑞利分布是威布尔分布的一个特殊情况。 4 证明：若随机变量 X 的 ... fdp 为 )0( 0,0 0,)( 22 2 2 为常数其中 > ⎪⎩ ⎪ ⎨ ⎧ ≤ >= − σ σ σ x xe xf x x ，称 X 服从参数为σ 的瑞利分布。设随机变量 )2,(~ λWY ，则其 ... fdp 为： ⎪⎩ ⎪ ⎨ ⎧ ≤ > = − 0,0 0,2 )( 2 x xxe yf xλ λ 可见，随机变量Y 服从参数为 λ 的瑞利分布，从而命题得证。 (4) 瑞利分布麦克斯韦分布→ 麦克斯韦 )(Maxwell 分布的 ... fdp 为： )0( 0,0 0,)( 2 2 3 24 为参数> ⎪⎩ ⎪ ⎨ ⎧ ≤ >= − α α πα x xe xf x x 瑞利分布的 ... fdp 为： )0( 0,0 0,2 )( 2 为参数> ⎪⎩ ⎪ ⎨ ⎧ ≤ > = − λ λ λ x xxe xf x 命题：设随机变量 X 服从参数为 α 的麦克斯韦分布，则 πα 2 2 X Y = 服从参数为π 的瑞利分布。证明： )0(2 )()( )()( )( }{ }{ }{)( 2 )(4 2 2)( 3 2 2 2 >= ⋅= ′⋅= ′=∴ = ≤= ≤= ≤= − − yey e yyf yFyf yF yXP yP yYPyF y y y X YY X X Y y π πα πα πα πα π παπα πα πα α πα 0≤y 时， 0)( =yf Y ； ⎩ ⎨ ⎧ ≤ > =∴ − 0,0 0,2 )( y yey yf y Y π π 令 yt = ，则有： 5 ⎪⎩ ⎪ ⎨ ⎧ ≤ > = − 0,0 0,2 )( 2 t tte yf t Y π π 从而原命题得证。 (5)威布尔、指数、瑞利这三个分布之间性质的比较 1 共同性质许多产品（例如轴承）的使用寿命服从威布尔分布。威布尔是瑞典物理学家，他在 1939 年研究物质材料的强度时首先提出了这种分布。威布尔分布 ),( αλW 的数学期望 µ和方差 2σ 分别为： ⎥⎦ ⎤ ⎢⎣ ⎡ +Γ−+Γ=+Γ= −− ) 1 1() 2 1(), 1 1( 2 2 2 1 αα λσ α λµ αα 由前面的推导知，当令 ),( αλW 中 1=α 时就化为了参数为λ的指数分布，令 2=α 就是参数为 λ 的瑞利分布了，则很容易由 ),( αλW 的 2σµ、求得指数分布与瑞利分布的 µ和 2 σ 了。 2 指数分布的无记忆性指数分布通常用来描述对某一事件发生的等待时间，比如，来客在公共汽车站等车的时间，灯泡使用寿命（等待用坏的时间），电话交换台收到两次呼叫的时间间隔。在离散型分布中，我们知道，几何分布用来描述伯努利试验中，直到某事件 A发生为止共进行的试验次数，如果将每次试验视为经历一个单位时间，那么直到事件 A发生为止进行的试验次数可视为直到 A发生为止的等待时间（离散时间）。在这个意义上，指数分布可视为离散型情形的几何分布在连续型情形的推广。虽然指数分布是威布尔分布的一个特例，但是它与几何分布类似，具有“无记忆性”的特性，而这是威布尔分布所没有的性质。指数分布无记忆性的数学表示为： ,0, ≥∀ ts 有： }{ }{ }{ }{ },{ }{ )( tXP e e e sXP tsXP sXP sXtsXP sXtsXP t s ts >= = = > +> = > >+> = >+> − − +− λ λ λ 所谓无记忆性，是说它忘记自己已经生活了 s年，它再继续生活 t年以上的概率与新生儿能生活 t年以上的概率一样。为此我们通常戏称指数分布是“永远年青”的分布。 6 正因为指数分布这一特性，因而常用它来描述这一类寿命分布，其衰老作用不明显，或其生命的结束主要是随机因素造成的。它的应用十分广泛，例如很多电子元器件（电子管、电视机）的寿命（从生产出来到失去规定功能所经历的时间），某些微生物、易损物品的寿命等都服从指数分布。 (6)均匀分布派生出的一个新的分布-辛普森分布辛普森分布也叫三角分布，是一种连续型分布。假设随机变量 1ξ 和 2ξ 相互独立，且都在 ],[ 22 ba 上服从均匀分布，则 21 ξξ + 的分布称为三角分布，其概率密度为： ⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧ ∉ ≤< + − − + ≤≤ − − =+ ]),[(0 ) 2 ( )( )(4 ) 2 ( )( )(4 )( 2 2 21 bax bx ba ab xb ba xa ab ax xp ξξ 说明：三角分布也正说明了并非所有的分布都具有可加性，均匀分布就是一个例外。综上所述，得这几个分布之间的关系图如下：瑞利分布麦克斯韦分布 ⎯⎯ →⎯ = πα 2 2 X Y 特例 2=α 1=α 威布尔分布指数分布均匀分布 ⎯⎯⎯⎯ →⎯ >= )0( 1 α α XY )0(ln >−= αα XY X eY λ−= 派生辛普森分布特性无记忆性分布)(λe （图 2） 7 2、与负二项分布有关的一些分布这一部分涉及的几个分布的简单关系图：泊松分布负二项分布正态分布 →← 指数分布几何分布→ 分布Γ （图 3）（1）负二项分布渐近泊松分布 ),( 为常数且条件：泊松分布负二项分布渐近 λ→∞→⎯⎯→⎯ p rq r 证明：负二项分布是一种等待时间的分布，它的分布律为： ),1,,0,,1(}{ 11 ⋯+=>=+== −−− rrkqpqprqpCkXP rkrrk 为正整数， X 服从负二项分布记作： ),(~ prNBX 将负二项分布律作一个等价变换有： rkrrk rkr rkrrk k rkrr k qpCqpCqpCkXP −− −−+ −− − −− − ==== 1)(1 1 1}{ 从而负二项分布的分布律可写成： ),2,1,0,0,,1,(}{ 1 ⋯=>=+== −+ xqpqprqpCxXP xrx xr 为正整数负二项分布的母函数为： r q p p )()( 1 θθ −= )(~ , ∞→∴ →∞→ r r p q p rq r λ λ∵ 从而 )1()(lim )1lim)(1( 1ln1lnlim )(lnlim − ∞→ ∞→ ∞→ ∞→ =∴ =−= ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ −−⎟ ⎠ ⎞ ⎜ ⎝ ⎛ −= θλ θ θλ λθλ θ ep p r p r p p r r rr r r 其中 8 而我们知道 )1( −θλ e 是泊松分布的母函数，据唯一性定理知：在 ∞→r ，且 λ→ p rq 为常数时，负二项分布渐近泊松分布。注：唯一性定理：分布函数 )(1 xF 及 )(2 xF 恒等的充分必要条件为它们的特征函数 )(1 xϕ 及 )(2 xϕ 恒等；这一问题中研究的是取值为全体非负整数值 ),2,1,0( ⋯=k 的随机变量，用母函数代替特征函数较为方便。（2）负二项分布渐近正态分布）正态分布（负二项分布渐近 ∞→⎯⎯→⎯ r 证明：设 X 服从负二项分布，考虑标准随机变量 qrp qrpX Y 1 1 − −− = ， Y 的特征函数为： r rq itp rqitr Y qeept − − ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ −= 1)(ϕ ，利用泰勒展开，有： 2 2 22 2222 )( 2 2 1lim 2 lim 2 1 2 1 lim lim )(lim t r r r r r r r rq qpit rq itq r Y r e r t p r qt po r pt p p rq t o rq t rq it q r qt o r qt rq itq p qee t − − ∞→ − ∞→ − ∞→ −+ ∞→ ∞→ =⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ += ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ ++ = ⎪ ⎪ ⎭ ⎪ ⎪ ⎬ ⎫ ⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ +−+−⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ +−+ = ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎣ ⎡ − = ϕ 而 2 2 t e − 是 )1,0(N 的特征函数，由逆极限定理易知：负二项分布在 ∞→r 时渐近正态分布。 9 注：逆极限定理：设特征函数列 ⋯),(),( 21 tt ϕϕ 收敛于某一函数 )(tϕ ，且 )(tϕ 连续（或在 0=t 点连续），则相应的分布函数列 ⋯),(),( 21 xFxF 弱收敛于某一分布函数 )(xF ，而且 )(tϕ 是 )(xF 的特征函数。（3）负二项分布渐近Γ分布 )0( →Γ⎯⎯→⎯ p分布负二项分布渐近证明： Γ分布的 ... fdp 为： )0,( 0,0 0, )()( 1 > ⎪⎩ ⎪ ⎨ ⎧ < ≥ Γ= −− λ λ λ r x xex r xf xr r 设 X 服从负二项分布，令 qrp qrpX Y 1 1 − −− = ，则Y 的特征函数为： r rq itp rqit r rq itp rq itp rq itr Y p qe e qe pe et − − − ⎟⎟ ⎟ ⎟ ⎠ ⎞ ⎜⎜ ⎜ ⎜ ⎝ ⎛ − = ⎟⎟ ⎟ ⎟ ⎠ ⎞ ⎜⎜ ⎜ ⎜ ⎝ ⎛ − = 1 1 )(ϕ 从而 ( ) r rit r p rit r p rit r rq itp op rit Y p r it e p p r qit p e p po rq itp q e p qe et − − − → − − → − − → − → ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ −= ⎟⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜⎜ ⎜ ⎜ ⎜ ⎝ ⎛ − = ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ ++− = ⎟⎟ ⎟ ⎟ ⎠ ⎞ ⎜⎜ ⎜ ⎜ ⎝ ⎛ − = 1 lim 11 lim 1 lim)(lim 0 0 0 ϕ 而 r rit r it e − − ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ −1 正是服从 Γ分布的标准化随机变量的特征函数，根据逆极限定理知：负 10 二项分布在 0→p 时渐近 Γ分布。注：上述证明的一个特殊情形：关于几何分布渐近指数分布的证明 )0( →p 证明：几何分布的分布律为： ),2,1(}{ 1 ⋯=== − kpqkXP k ，我们知道几何分布是负二项分布中 1=r 的特殊情形，所以几何分布渐近指数分布的证明正是负二项分布渐近 Γ分布证明中 1=r 的情形。 (4)负二项分布与几何分布的性质比较 1 共性负二项分布： ⋯,1,,}{)( 11 +==== −−− rrxqpCxXPxf rxrrx 其数学期望、方差和矩母函数分别为： r t t qe pe tM p rq p r ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − === 1 )(,, 2 2 σµ 负二项分布中，当 1=r 时，称作几何分布，其分布律为： ),2,1(}{ 1 ⋯=== − xpqxXP x 由于几何分布为负二项分布之特例，当然它继承了负二项分布的所有性质，可以验证几何分布的数学期望、方差和矩母函数分别为： t t qe pe tM p q p − === 1 )(,, 1 2 2 σµ 2 几何分布的无记忆性随机变量 X 服从几何分布简记为： );(~ pxgX ，作为一种等待分布，几何分布在概率论中具有其重要作用和良好的性质，那就是几何分布的无记忆性。在贝努里试验中，等待首次成功的时间 X 服从几何分布。现假定已知在前 m 次试验中没有出现成功，那么为了达到首次成功所需的等待时间Y 服从几何分布，与前面失败次数m 无关。形象地说，就是把过去的经历完全忘记了。因此无记忆性是几何分布所具有的一个有趣的性质。但是更加有趣的是，在离散分布中，只有几何分布才具有这样一种特殊性质。用数学式子表示几何分布的无记忆性为：如果 X 服从参数为 p的几何分布，则对于任何两个正整数 ,,nm 有： }{}{ nXPmXnmXP >=>+> 简单证明如下：由 }{ }{ }{ mXP nmXP mXnmXP > +> =>+> ，据几何分布的定义有: m j jm mk k qpqqpqmXP ===> ∑∑ ∞ = − ∞ += − 1 1 1 1}{ 11 同理，有： nnm qnXPqnmXP =>=+> + }{,}{ 于是得： }{}{ nXPq q q mXnmXP n m nm >===>+> + 几何分布的无记忆性，意指几何分布对过去的 m 次失败信息在后面的计算中被遗忘了。事实上，还可以证明：一个取正整数值的随机变量，如果具有无记忆性，则一定服从几何分布。可见，无记忆性实际上是几何分布的一个特征性质。这一部分涉及的几个分布的关系图如下所示：指数分布几何分布 ⎯⎯ →⎯ →0p 泊松分布负二项分布正态分布 ⎯⎯⎯ →⎯⎯⎯ ⎯← →∞→∞→ λp rq r r , 分布Γ 0→p 特例 1=r 特性无记忆性（图 4） 3、 2χ 分布、指数分布、 Γ分布三者之间的关系这一部分研究的几个分布之间的简单关系图如下所示：指数分布分布分布 ↔↔Γ 2χ 分布)(21e 12 （图 5）这三个分布的定义分别如下： )(~ λeX ，其中随机变量 X 的 ... fdp 为： )0( 0,0 0, )( 为常数其中 > ⎩ ⎨ ⎧ ≤ > = − λ λ λ x xe xf x )(~ 2 nX χ ，其中随机变量 X的 ... fdp 为： ⎪⎩ ⎪ ⎨ ⎧ ≤ > Γ= −− 0,0 0, )(2 1 );( 22 2 1 2 2 x xex nx xn n n χ ),(~ λαΓX ，其中随机变量 X 的 ... fdp 为： )00( 0,0 0, )()( 1 为尺度参数为形状参数， >> ⎪⎩ ⎪ ⎨ ⎧ ≤ > Γ= −− λα α λ λα α x xex xp x （1）指数分布分布↔2χ 1 指数分布分布→2χ 对于 )(2 nχ 分布，令 2=n ，则： ⎪⎩ ⎪ ⎨ ⎧ ≤ > = − Γ 0,0 0, )2;( 2 )1(2 1 2 x xe x x χ 而据Γ函数的定义 dxext xt − ∞ −∫=Γ 0 1)( 知 1)1( 0 ==Γ ∫ ∞ − dxe x ⎪⎩ ⎪ ⎨ ⎧ ≤ > =∴ − 0,0 0, )2;( 2 2 1 2 x xe x x χ 即： )(~ 2 1 eX ，也就是说 2 1=λ 的指数分布 )( 2 1 e 可看作 2χ 分布的特殊情况。 2 分布指数分布 2χ→ 我们有如下命题成立：若 )(~ λeX ，则 )2;(~2 2 xXY χλ= 证明：随机变量 X 的概率密度和分布函数分别为： )(),( xFxf XX ，随机变量Y 的概率密度和分布函数分别为： )(),( yFyf YY 13 0), 2 (} 2 {}2{}{)( >=≤=≤=≤= y y F y XPyXPyYPyF XY λλ λ ☆ 显然，当 0≤y 时， 0)(,0)( == yfyF YY 对于☆式两边同时求导得： 0, 2 1 2 1 ) 2 ( 2 1 )( 22 >=⋅== −− yee y fyf yy XY λ λ λλ λ λ ⎪⎩ ⎪ ⎨ ⎧ ≤ >=∴ − 0,0 0, 2 1 )( 2 y ye yf y Y 可见： )(~2 2 1 eXY λ= 即： )2;(~2 2 xXY χλ= （2）Γ分布自身的一些性质 1 Γ分布自身间存在的关系： Γ分布关于形状参数 α 具有可加性命题：设 ),(~),,(~ 2211 λαλα ΓΓ XX ,且 1X 与 2X 相互独立，试证 ),(~ 2121 λαα +Γ+ XX 1X 、 2X 的概率密度分别为： ⎪⎩ ⎪ ⎨ ⎧ ≤ > Γ= ⎪⎩ ⎪ ⎨ ⎧ ≤ > Γ= −−−− 0,0 0, )()(, 0,0 0, )()( 1 2 1 1 2 2 2 1 1 1 y yey yf x xex xf y X x X λα α λα α α λ α λ 其中 0,, 21 >λαα 为常数。证明：当 0≤Z 时， 21 XXZ += 的概率密度 0)( =zf Z ；由卷积公式得：当 0>Z 时， dxxzx e dxexzex dxxzfxf zf z z xzx z XX Z ∫ ∫ ∫ −− −+ −−−−− ∞+ ∞− − ΓΓ = − Γ ⋅ Γ = −= 0 11 21 )(1 2 1 0 1 21 21 2 2 1 1 21 )( )()( )( )()( )()( )( αα λ αα λα α λα α αα λ α λ α λ 当令 ztx = 时有： 14 dtttz zdttztz dxxzx z 1 1 0 11 1 1 0 111 1 0 1 2121 2211 21 )1( )1( )( −−−+ −−−− −− −= ⋅−= − ∫ ∫ ∫ αααα αααα αα zz Z eAzezdtttzf λααλαααα αα αα λ −−+−−+−− + =⋅⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − ΓΓ =∴ ∫ 111 1 0 1 21 212121 21 )1( )()( )( ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − ΓΓ = ∫ −− + dtttA 1 0 11 21 21 21 )1( )()( αα αα αα λ其中现在来计算 A ,由概率密度的性质有： dzezAdzzf z Z ∫∫ +∞ −−+ +∞ == 0 1 0 21)(1 λαα 而我们知道 αα α det t − +∞ −∫=Γ 0 1)( 所以上式即： )()()(1 21 0 1 21 21 21 αα λ λλ λ αα λαα αα +Γ== + +∞ −−+ + ∫ A zdez A z )( 21 21 αα λ αα +Γ =∴ + A ⎪⎩ ⎪ ⎨ ⎧ ≤ > +Γ=∴ −−+ + 0,0 0, )()( 1 21 21 21 z zez zf z Z λαα αα αα λ 即证得： ),(~ 2121 λαα +Γ+ XX 拓展推广：同样运用数学归纳法可得到 n个相互独立的 Γ分布变量之和也服从Γ分布。即： ),,2,1( niX i ⋯= 相互独立，且 ),(~ λα ii X Γ ，则：∑ ∑ = = Γ n i n i ii X 1 1 ),(~ λα 这一性质叫做Γ分布的可加性。 2 Γ分布的特例-指数分布 )(λe 除了所特有的无记忆性外，指数分布完全继承了Γ分布的可加性质、 Γ函数与 ),( 21 ααΒ 之关系的性质。另外，若 )(~ λeX ，由于 ),1()( λλ Γ=e ，则由Γ分布的 2 , λ α λ α == DXEX ，矩母函数 )()( λ λ λ α <⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − = t t tM 可以得到指数分布的 )()(, 1 , 1 2 λ λ λ λλ < − === t t tMDXEX 对于（3）分布分布 Γ↔2χ 15 从以上的论述知 2χ 分布与指数分布， Γ分布与指数分布之间存在有互推关系，那么大家自然会联系到 2χ 分布与 Γ分布之间也应该存在着某种关系，而事实也正是如此。下面我们就来揭示这两个分布之间的密切关系。 1 分布分布 Γ→)(2 nχ 2 χ 分布的概率密度函数为： ⎪⎩ ⎪ ⎨ ⎧ ≤ > Γ= −− 0,0 0, )(2 1 );( 22 2 1 2 2 x xex nx xn n n χ Γ分布的概率密度函数为： )0( 0,0 0, )()( 1 为常数，其中 > ⎪⎩ ⎪ ⎨ ⎧ ≤ > Γ= −− λα α λ λα α x xex xf x 通过仔细观察，我们不难发现，当令 2 χ 分布中 α2=n 时 ),()2( 2 12 ααχ Γ= ，说明 2χ 分布可看作Γ分布之特殊情况。 2 分布分布 )(2 nχ→Γ 命题如下：若 ),(~ λαΓX ，则： )2(~2 2 αχλXY = 证明： 22 1)(1 22 2 )(2 1 )( )(2 1 )( 2 1 )( 0)(,0 )(} 2 {}2{}{)(,0 0, yy eyefyf yfy F y XPyXPyYPyFy yy XY Y y XY −−−− Γ = Γ ==∴ =≤ =≤=≤=≤=>∴ > α α λ α λ α λ λ αα λ λλ λ λ λα λ 时当时当 ∵ 综上所述， ⎪⎩ ⎪ ⎨ ⎧ ≤ > Γ= −− 0,0 0, )(2 1 )( 21 y yey yf y Y α α α 即证得： )2(~2 2 αχλXY = 3 说明：从以上的推导我们知道 2χ 分布可看作是Γ分布的特殊情形，那么 2χ 分布就会继承 Γ分布的一些性质，最明显的是它也会像 Γ分布一样具有可加性。由以上讨论，我们得出 Γ、指数、2χ 这三个分布之间的推导关系图如下： 16 指数分布分布分布可加性 ⎯⎯ ⎯←⎯⎯ →⎯Γ← == XYXY λλ χ 222 特例 2=n 分布)( 2 1 e （图 6） 4、常用统计量的分布 tF、、2χ 三者之间的密切关系这一部分涉及的几个分布间关系的简单图如下：分布分布分布 2χ→→ Ft （图7）下面一一进行论述： (1) tF、这两个分布间关系 F分布与 t分布有如下关系式成立： )(),1( 2 ntnF = 证明：设 n Y X tntt =),(~ ，其中 )(~),1,0(~ 2 nYNX χ ，且 YX、相互独立 )( 2 2 n Y X t =∴ 而 )(~),1(~ 222 nYX χχ ，且 2X 与Y 相互独立，由 F分布的定义知 2t 服从自由度为 ),1( n 的 F 分布，即： ),1(~ )( 2 2 nF n Y X t = (2) )(2 nF χ、两个分布间关系 F 分布与 )(2 nχ 分布关系式为： n n nF )( ),( 2 χ =∞ 证明：在 ),( 21 nnF 中令 nn =1 ，则其 ... fdp 为： 17 ⎪ ⎩ ⎪ ⎨ ⎧ ≤ >+ ΓΓ Γ = −− + + 0,0 0,)1()( )()( )( )( 1 22 2 22 2 2 2 22 2 x xxx xf n nn n n n n n n n nn 当 0>x 时， 1222 22 2 2 2 2 22 ln)1ln()ln()(ln)(ln)(ln)(ln −−+ ++++Γ−Γ−Γ= + n nn n xxxf n n n n n n nn 根据Γ函数的斯特林 )(stirling近似公式： ⎥⎦ ⎤ ⎢⎣ ⎡ +−=++−−=Γ )( 360 1 12 1 )()(2ln 2 1 ln)()(ln 5 1 32 1 x o xx xRxRxxxx π 易求得： )0( )(2 )( ln)(lnlim 2 2 2 2 2 1 > ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ ⋅ Γ = − − ∞→ xne nx xf nx n n nn 显然当 0≤x 时， 0)(lim 2 = ∞→ xf n ⎪⎩ ⎪ ⎨ ⎧ ≤ > Γ=∴ −− ∞→ 0,0 0,)( )(2)(lim 22 2 2 1 2 x xenx n xf nxn n n n 等式右端正好为 n n)(2χ 分布的 ... fdp F∴ 分布当 nn =1 ， ∞→2n 时渐近 n n)(2χ 分布，即有： n n nF )( ),( 2 χ =∞ 以上所讨论的分布之间关系的详细图如下所示：分布分布分布 2, 21 2 χ⎯⎯⎯ →⎯⎯→⎯ ∞→= nnnt Ft （图8） 5、与正态分布有关的一些分布这一部分要研究的几个分布之间关系的简单图谱如下所示： 18 二项分布正态分布对数正态分布 ←↔ 分布2χ 分布Γ 分布t （图 9） (1) 先来证明正态分布自身的一些性质：1)线性性，2)可加性 1 线性性的证明命题：设随机变量 ),(~ 2σµNX ，试证明 X 的线性函数 ))(,(~)0( 2σµ abaNabaXY +≠+= 证明：由 baxy += 得 )(yg a by x = − = 且有 a yg 1 )( =′ ，据随机变量函数的概率密度求解定理得 baxY += 的概率密度为： )( 1 ))(()()( a by f a ygfygyf XXY − =′= 而 +∞<<−∞= − − xexf x X , 2 1 )( 22 2)( σ µ σπ +∞<<−∞==∴ +−− − −− ye a e a yf a aby a by Y , 2 1 2 11 )( 2)(2 2)]([ 22 2)( σ µ σ µ πσσπ 即有： ))(,(~ 2σµ abaNY + 2 可加性的证明命题：设随机变量 YX、相互独立， )1,0(~, NYX ，其概率密度分别如下： +∞<<−∞= +∞<<−∞= − − yeyf xexf y x Y X , 2 1 )( , 2 1 )( 2 2 2 2 π π 求 YXZ += 的概率密度。解：由卷积公式有: dxeedxeedxxzfxfzf zz xz x x YXZ ∫∫∫ +∞ ∞− −−−+∞ ∞− −−+∞ ∞− ==−= − 2 24 2 2 2)( 2 2 )( 2 1 2 1 )()()( ππ 19 令 2 z xt −= 得： 4 2 4 22 4 2 2 1 2 1 2 1 )( zzz eedteezf t Z −−+∞ ∞− −− === ∫ π π ππ 即： )2,0(~ NZ 一般地，设 YX、相互独立且 ),(~ 211 σµNX ， ),(~ 2 22 σµNY ，则 YXZ += 仍然服从正态分布，即 ),(~ 22 2 121 σσµµ ++NZ 。这个结论还能推广到 n个独立正态随机变量之和的情况，即若 ),,2,1(),(~ 2 niNX iii ⋯=σµ ，且他们相互独立，则他们的和 n XXXZ +++= ⋯21 仍然服从正态分布，且有 ),(~ 222 2 121 nnNZ σσσµµµ ++++++ ⋯⋯ 更一般地，可以证明有限个相互独立的正态随机变量的线性组合仍然服从正态分布，即若 ),,2,1( niX i ⋯= 相互独立且 ),(~ 2 iii NX σµ ， nn XaXaXaZ +++= ⋯2211 ，则： ),(~ 1 22 1 ∑∑ == n i ii n i ii aaNZ σµ ，或者有： ),(~ 1 22 11 ∑∑∑ === ++= n i ii n i ii n i ii adaNdXaZ σµ (2)关于 t 分布渐近正态分布的证明 )( ∞→n 证明： t分布的概率密度函数为： 2 1 )1( )( )( )( 2 2 2 1 +− + + Γ Γ = n n t n tf n n π 有： 2 1 )1ln() 2 (lnln) 2 1 (ln)(ln 2 +−++Γ−− + Γ= n n tn n n tf π 根据Γ函数的斯特林公式： ⎥⎦ ⎤ ⎢⎣ ⎡ +−=++−−=Γ )( 360 1 12 1 )()(2ln 2 1 ln) 2 1 ()(ln 513 x o xx xRxRxxxx π 易算得： ) 2 1 ln()(lnlim 2 2 t etf n − ∞→ = π 即： 2 2 2 1 )(lim t etf n − ∞→ = π 从而证得：当 n 很大时， t 分布渐近正态分布。 (3) 正态分布二项分布→ 二项分布与正态分布之间的关系： 20 相对于二项分布来说，正态分布在实际生活的应用中更为常见，正态分布又称为Gauss 分布或高斯拉普拉斯分布，在法国文献中也称为德莫哇佛—拉普拉斯律或拉普拉斯第二律，以区别于我们称为拉普拉斯分布的拉普拉斯第一律。命题：设随机变量 )10)(,(~),2,1( <<= ppnbn n ⋯η ，试证对任意 x有： )( 2 1 } )1( {lim 2 2 xdtex pnp np P t x n n Φ==≤ − − − ∞−∞→ ∫ π η 证明：先对 n η 作一个分解，引入随机变量 k X ，定义如下： ),,,2,1( ,0 ,1 pAnk kA kA X k 率为在每次试验中发生的概其中次试验中不发生在第事件次试验中发生在第事件 ⋯= ⎩ ⎨ ⎧ = 则： nn XXX +++= ⋯21η 即将 n η 分解成了 n个相互独立，且都服从同一个两点分布的 ),,2,1( nkX k ⋯= 之和，据独立同分布的中心极限定理有： ⎪ ⎪ ⎭ ⎪⎪ ⎬ ⎫ ⎪ ⎪ ⎩ ⎪⎪ ⎨ ⎧ ≤ − = ⎪ ⎪ ⎭ ⎪ ⎪ ⎬ ⎫ ⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ ≤ − ∑ ∑ ∑∑ = ∞→ = == ∞→ x nDX nEXX Px XD XEX P k k n k k n n k k n k k n k k n 1 1 11 lim )( )( lim 而两点分布的 )1(, ppDXpEX kk −== )( 2 1 )1( lim 2 2 1 xdtex pnp npX P x n k k n t Φ== ⎪ ⎪ ⎭ ⎪⎪ ⎬ ⎫ ⎪ ⎪ ⎩ ⎪⎪ ⎨ ⎧ ≤ − − ∴ ∫ ∑ ∞− −= ∞→ π 此命题即为著名的 LaplaceMoivreDe − 定理，这个定理表明正态分布是二项分布的极限分布，当 n 充分大时可利用上式来计算二项分布的概率。实际上，若 np 和 nq 都大于5，近似值是很好的。 (4)关于对数正态分布与正态分布关系的证明对数正态分布的定义如下：若随机变量 X 的 ... fdp 为： ⎪⎩ ⎪ ⎨ ⎧ ≤ > = −− 0,0 0, 2 1 )( 22 2)(ln x xe x xf x σ µ πσ 则称 X 服从对数正态分布，即有： ),(~ 2σµLNX 1 若 ),(~ 2σµLNX ，则 ),(~ln 2σµNXY = 21 证明： dxe x eXPyXPyYPyF xy e y Y 22 2)(ln 0 2 1 }{}{ln}{)( σ µ πσ − − ∫=≤=≤=≤= +∞<<−∞=⋅=′=∴ −− −− yeee e yFyf y y e y y YY , 2 1 2 1 )()( 22 2)( 22 2)(ln σ µ σ µ σππσ 从而证得： ),(~ln 2σµNXY = 2 若 ),(~ 2σµNX ，则 ),(~ 2σµLNeY X= 证明： )0()(ln}ln{}{}{)( >=≤=≤=≤= yyFyXPyePyYPyF X X Y 0, 2 1 2 11 )(ln 1 )( 22 2)(ln 22 2)(ln >===∴ −− −− ye y e y yf y yf yy XY σ µ σ µ πσσπ 从而证得 ),(~ 2σµLNeY X= (5)Γ分布渐近正态分布）正态分布（分布渐近 ∞→⎯⎯→⎯Γ α 证明：设 X 服从 Γ 分布 ),( αλΓ ，令 1 1 − −− = αλ αλX Y ，则 Y 的特征函数为： α α α ϕ − − ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ −= it et it Y 1)( ，从而： 2 1 0 2 1 0 2 1ln 222 limlimlim)(lim t t tit it it it Y eeeeeet −⎟ ⎠ ⎞ ⎜ ⎝ ⎛ −− ∞→ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ ++−− − ∞→ ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ −− − ∞→∞→ ==⋅=⋅= α α α ααα α α α α α α αα ϕ 而 2 2 t e − 恰好是 )1,0(N 的特征函数，由逆极限定理得知: Γ分布在 ∞→α 时渐近正态分布。 (6) 2χ 分布渐近正态分布）正态分布（分布渐近 ∞→⎯⎯→⎯ nn)(2χ 证明：设 )(~ 2 nX χ ，令 n nX Y 2 − = ，则Y的特征函数为： 22 ( ) ( ) n nt nn t n itn nn itn n n n eeeeeet itit n it it Y 1 22 2 12 2 2 22 2 2 2 2 0 01ln 2 1)( +−⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ ++−− −⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ −− − − − =⋅=⋅=⎟ ⎠ ⎞ ⎜ ⎝ ⎛ −=ϕ 故 2 2 )(lim t et Y n − ∞→ =ϕ 。而 2 2 t e − 是 )1,0(N 的特征函数，根据逆极限定理知： )(2 nχ 分布在 ∞→n 时渐近正态分布。 (7)注：正态分布的重要性由独立同分布的中心极限定理、 LaplaceMoivreDe − 定理、 Liapunov定理，我们看到无论各个随机变量 ),2,1( ⋯=kX k 服从什么分布，只要满足定理的条件，那么他们的和∑ = n i k X 1 的标准化变量当n很大时，就近似的服从 )1,0(N ,这就是为什么正态随机变量在概率论中占有重要地位的一个基本原因。在很多问题中，所考虑的随机变量可以表示成很多个独立的随机变量之和，例如：在任一指定时刻，一个城市的耗电量是大量用户耗电量的总和; 一个物理实验的测量误差是由许多观察不到的、可加的微小误差所合成的；他们往往近似地服从正态分布。下面给出这部分所研究的概率分布之间的详细关系图： XY ln= X eY = ∞→n 分布2χ 线性性、可加性分布Γ ∞→α ∞→n 分布t 二项分布正态分布对数正态分布 ⎯⎯ ⎯← ∞→n （图 10） 23 6、其他一些分布之间的关系 (1) t分布与柯西分布间关系柯西分布 )0,1(C 是 t分布的一个特殊情况， t分布中当令 1=n 时即化为柯西分布 )0,1(C 。证明：柯西分布的 ... fdp 为： )0( )( 11 )( 22 为常数> −+ = λ µλπ x xf 其中随机变量 ),(~ µλCX t 分布的 ... fdp 为： )()1( )( )( )( 2 1 2 2 2 1 +∞<<−∞+ Γ Γ = +− + t n t n th n n n π 令 t分布中自由度 1=n ，得： 2 12 1 11 )1( ) 2 1 ( )1( )( t tth + =+ Γ Γ = − π π ∴当 1=n 时， )0,1(~ Ct (2)超几何分布、二项分布、泊松分布、多项分布、两点分布这几个分布之间的关系这几个分布之间简单关系图如下：泊松分布二项分布超几何分布 →→ 两点分布多项分布（图 11） 1 超几何分布渐近二项分布命题：二项分布超几何分布渐近⎯⎯→⎯ )0,,( 为概率常数其中条件： ≥→∞→ pp N M N 证明：超几何分布律为： }),min{,,2,1,0,0,0(}{ MnknNMN C CC kXP n N kn MN k M ⋯=≥≥≥≥== − − X 服从超几何分布记为： ),,(~ nMNHX 二项分布律为： ),,2,1,0,0,,1(}{ nkqpqpqpCkXP knkk n ⋯=≥=+== − 24 X 服从二项分布记为： ),;(~ pnkbX 下面计算极限式 n N kn MN k M N C CC − − ∞→ lim ) 1 1() 1 1(1 ) 1 1() 1 1)(1() 1 () 1 ( lim )1()1( )]1([)1)(()1()1( lim ! lim )!(! ! lim lim N n N N kn N M NN M N M N k N M NN M N M C nNNN knMNMNMNkMMM C A AA k A Aknk nAA C CC k n N k n N n N kn MN k M k n N n N kn MN k M N n N kn MN k M N − −− −− −−−−−⋅ − −− ⋅= +−− −−−−−−−⋅+−− ⋅= ⋅= − = ∞→ ∞→ − − ∞→ − − ∞→ − − ∞→ ⋯ ⋯⋯ ⋯ ⋯⋯ ,, p N M N →∞→∵ 同时 01, →∞→ N M knkk n knkk n n N kn MN k M N qpCppC C CC −− − − ∞→ =−=∴ )1(lim ∴当 p N M N →∞→ , 时，超几何分布即为二项分布。 2 与二项分布有关的一些分布 1）泊松分布二项分布→ 二项分布与泊松分布都是十分常见的两个分布， Poisson 分布常见于稠密性问题中，例如：一段时间内电话交换台接到的呼唤次数，公共汽车站台候车的旅客数，放射性物质放射的粒子数，都是服从 Poisson 分布的离散型随机变量。二项分布与泊松分布之间的关系：设 ),;(~ pnkbX ，即有分布律： ),,2,1,0,1,0,(}{ nkqpqpqpCkXP knkk n ⋯==+≥== − 在二项分布中，若 n 充分大而 p很小时， 0→p 则 11 →−= pq ，此事件称为稀疏事件。事实上，若 50≥n ， p 充分小

                    本文档为【概率分布间的关系研究】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

概率分布间的关系研究

你可能还喜欢