首页 高级统计学1多元正态分布

高级统计学1多元正态分布

举报
开通vip

高级统计学1多元正态分布第一章多元正态分布目录上页下页返回结束§1.1多元分布的基本概念§1.2统计距离§1.3多元正态分布§1.4均值向量和协方差阵的估计§1.5常用分布及抽样分布第一章多元正态分布一元正态分布在统计学的理论和实际应用中都有着重要的地位。同样,在多变量统计学中,多元正态分布也占有相当重要的位置。原因是:许多随机向量确实遵从正态分布,或近似遵从正态分布;对于多元正态分布,已有一整套统计推断方法,并且得到了许多完整的结果。目录上页下页返回结束第一章多元正态分布多元正态分布是最常用的一种多元概率分布。除此之外,还有多元对数正态...

高级统计学1多元正态分布
第一章多元正态分布目录上页下页返回结束§1.1多元分布的基本概念§1.2统计距离§1.3多元正态分布§1.4均值向量和协方差阵的估计§1.5常用分布及抽样分布第一章多元正态分布一元正态分布在统计学的理论和实际应用中都有着重要的地位。同样,在多变量统计学中,多元正态分布也占有相当重要的位置。原因是:许多随机向量确实遵从正态分布,或近似遵从正态分布;对于多元正态分布,已有一整套统计推断 方法 快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载 ,并且得到了许多完整的结果。目录上页下页返回结束第一章多元正态分布多元正态分布是最常用的一种多元概率分布。除此之外,还有多元对数正态分布,多项式分布,多元超几何分布,多元分布、多元分布、多元指数分布等。本章从多维变量及多元分布的基本概念开始,着重介绍多元正态分布的定义及一些重要性质。目录上页下页返回结束第一章多元正态分布多元分布的基本概念统计距离多元正态分布均值向量和协方差阵的估计常用分布及抽样分布目录上页下页返回结束§1.1多元分布的基本概念目录上页下页返回结束§1.1.1随机向量§1.1.2分布函数与密度函数§1.1.3多元变量的独立性§1.1.4随机向量的数字特征§1.1.1随机向量 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 示对同一个体观测的个变量。若观测了个个体,则可得到如下表1-1的数据,称每一个个体的个变量为一个样品,而全体个样品形成一个样本。假定所讨论的是多个变量的总体,所研究的数据是同时观测个指标(即变量),又进行了次观测得到的,把这个指标表示为常用向量目录上页下页返回结束记它表示第α个样品的观测值。竖看表1-1,第j列的元素表示对第j个变量Xj的n次观测数值。…n…2…1…变量序号目录上页下页返回结束§1.1.1随机向量因此,样本资料矩阵可用矩阵语言表示为:定义1.1设为个随机变量,由它们组成的向量称为随机向量。目录上页下页返回结束§1.1.1随机向量若无特别说明,本书所称向量均指列向量定义1.2设是一随机向量,它的多元分布函数是式中,,并记成。§1.1.2分布函数与密度函数描述随机变量的最基本工具是分布函数,类似地描述随机向量的最基本工具还是分布函数。目录上页下页返回结束§1.1.2分布函数与密度函数目录上页下页返回结束定义1.3:设=,若存在一个非负的函数,使得对一切成立,则称(或)有分布密度并称为连续型随机向量。一个维变量的函数能作为中某个随机向量的分布密度,当且仅当§1.1.3多元变量的独立性目录上页下页返回结束定义1.4:两个随机向量X和Y称为是相互独立的,若对一切成立。注意:在上述定义中,和的维数一般是不同的。(1)若F(x,y)为(X,Y)的联合分布函数,G(x)和H(y)分别为X和Y的分布函数,则X与Y独立当且仅当(2)若(X,Y)有密度f(x,y),用g(x)和h(y)分别表示X和Y的分布密度,则X和Y独立当且仅当§1.1.4随机向量的数字特征是一个维向量,称为均值向量.目录上页下页返回结束当A、B为常数矩阵时,由定义可立即推出如下性质:1、随机向量的均值设有个分量。若存在,定义随机向量的均值为)(ûëûëéPPm)()6.1)()((2121μX=úúúúùêêêêé=úúúúùêêêê=XEXEXEEmm§1.1.4随机向量的数字特征目录上页下页返回结束2、随机向量X的协方差阵称它为p维随机向量X的协方差阵,简称为X的协方差阵。称|cov(X,X)|为X的广义方差,它是协差阵的行列式之值。目录上页下页返回结束§1.1.4随机向量的数字特征3、随机向量X和Y的协差阵设分别为维和维随机向量,它们之间的协方差阵定义为一个矩阵,其元素是,即当A、B为常数矩阵时,由定义可推出协差阵有如下性质:目录上页下页返回结束§1.1.4随机向量的数字特征(3)设X为n维随机向量,期望和协方差存在,记则对于任何随机向量来说,其协差阵∑都是对称阵,同时总是非负定(也称半正定)的。大多数情形下是正定的。目录上页下页返回结束§1.1.4随机向量的数字特征若随机向量的协差阵存在,且每个分量的方差大于零,则X的相关阵定义为:rij也称为分量Xi与Xj之间的(线性)相关系数。4、随机向量X的相关阵在数据处理时,为了克服由于指标的量纲不同对统计分析结果带来的影响,往往在使用某种统计分析方法之前,常需将每个指标“标准化”,即做如下变换目录上页下页返回结束§1.1.4随机向量的数字特征§1.2统计距离和马氏距离目录上页下页返回结束1.欧氏距离2.马氏距离§1.2统计距离和马氏距离1.欧氏距离在多指标统计分析中,距离的概念十分重要,样品间的不少特征都可用距离去描述。大部分多元方法是建立在简单的距离概念基础上的。即平时人们熟悉的欧氏距离,或称直线距离.如几何平面上的点P=(x1,x2)到原点O=(0,0)的欧氏距离,依勾股 定理 三点共线定理勾股定理的证明证明勾股定理共线定理面面垂直的性质定理 有目录上页下页返回结束§1.2统计距离和马氏距离但就大部分统计问 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 而言,欧氏距离是不能令人满意的。目录上页下页返回结束这里因为,每个坐标对欧氏距离的贡献是同等的。当坐标轴表示测量值时,它们往往带有大小不等的随机波动,在这种情况下,合理的办法是对坐标加权,使得变化较大的坐标比变化小的坐标有较小的权系数,这就产生了各种距离。欧氏距离还有一个缺点,这就是当各个分量为不同性质的量时,“距离”的大小竟然与指标的单位有关。§1.2统计距离和马氏距离目录上页下页返回结束例如,横轴x1代表重量(以kg为单位),纵轴x2代表长度(以cm为单位)。有四个点A、B、C、D见图1.1,它们的坐标如图1.1所示这时显然AB比CD要长。§1.2统计距离和马氏距离目录上页下页返回结束现在,如果x2用mm作单位,x1单位保持不变,此时A坐标为(0,50),C坐标为(0,100),则结果CD反而比AB长!这显然是不够合理的。§1.2统计距离和马氏距离目录上页下页返回结束因此,有必要建立一种距离,这种距离要能够体现各个变量在变差大小上的不同,以及有时存在着的相关性,还要求距离与各变量所用的单位无关。看来我们选择的距离要依赖于样本方差和协方差。因此,采用“统计距离”这个术语,以区别通常习惯用的欧氏距离。最常用的一种统计距离是印度统计学家马哈拉诺比斯(Mahalanobis)于1936年引入的距离,称为“马氏距离”。§1.2统计距离和马氏距离目录上页下页返回结束下面先用一个一维的例子说明欧氏距离与马氏距离在概率上的差异。设有两个一维正态总体。若有一个样品,其值在A处,A点距离哪个总体近些呢?图1-2§1.2统计距离和马氏距离目录上页下页返回结束由图1-2可看出,从绝对长度来看,A点距左面总体G1近些,即A点到μ1比A点到μ2要“近一些”(这里用的是欧氏距离,比较的是A点坐标与μ1到μ2值之差的绝对值),但从概率观点来看,A点在μ1右侧约4σ1处,A点在μ2的左侧约3σ2处,若以标准差的观点来衡量,A点离μ2比A点离μ1要“近一些”。显然,后者是从概率角度上来考虑的,因而更为合理些,它是用坐标差平方除以方差(或说乘以方差的倒数),从而化为无量纲数,推广到多维就要乘以协方差阵∑的逆矩阵∑-1,这就是马氏距离的概念,以后将会看到,这一距离在多元分析中起着十分重要的作用。§1.2统计距离和马氏距离2.马氏距离设X、Y从均值向量为μ,协方差阵为∑的总体G中抽取的两个样品。)()(),(1/2YXΣYXYX--=-dm)()(),(1/2μXΣμXX--=-Gdm目录上页下页返回结束定义X、Y两点之间的马氏距离为:定义X与总体G的马氏距离为:§1.2统计距离和马氏距离设E表示一个点集,d表示距离,它EⅹE是到[0,∞)的函数,可以证明,马氏距离符合如下距离的四条基本公理:;(1),(2)当且仅当;(3)(4)目录上页下页返回结束§1.3多元正态分布多元正态分布是一元正态分布的推广。迄今为止,多元分析的主要理论都是建立在多元正态总体基础上的,多元正态分布是多元分析的基础。另一方面,许多实际问题的分布常是多元正态分布或近似正态分布,或虽本身不是正态分布,但它的样本均值近似于多元正态分布。本节将介绍多元正态分布的定义,并简要给出它的基本性质。目录上页下页返回结束§1.3多元正态分布目录上页下页返回结束§1.3.1多元正态分布的定义§1.3.2多元正态分布的性质§1.3.3条件分布和独立性§1.3.1多元正态分布的定义|∑|为协差阵∑的行列式。目录上页下页返回结束定义1.5:若p元随机向量的概率密度函数为:则称遵从p元正态分布,也称X为p元正态变量。记为定理1.1将正态分布的参数μ和∑赋于了明确的统计意义。多元正态分布不止定义1.5一种形式,更广泛地可采用特征函数来定义,也可用一切线性组合均为正态的性质来定义等,有关这些定义的方式参见文献[3]。目录上页下页返回结束§1.3.1多元正态分布的定义定理1.1:设,则§1.3.2多元正态分布的性质目录上页下页返回结束若正态随机向量的协方差阵∑是对角阵,则X的各分量是相互独立的随机变量。容易验证,,但显然不是正态分布。2.多元正态分布随机向量X的任何一个分量子集的分布(称为X的边缘分布)仍然遵从正态分布。而反之则不一定成立,即若一个随机向量的任何边缘分布均为正态,并不能导出它是多元正态分布。例如,设有分布密度§1.3.2多元正态分布的性质目录上页下页返回结束多元正态向量X=(X1,X2,…,Xp)’的任意线性变换仍然遵从多元正态分布。若设X~Np(μ,Σ),而m维随机向量Zmⅹ1=AX+b,其中A=(aij)是mⅹp阶的常数矩阵,b是m维的常向量。那么,m维随机向量Z也是正态的,且Z~Nm(Aμ+b,AΣA’)。即Z遵从m元正态分布。第一次结束4.若X~Np(μ,Σ),则d2若为定值,随着X的变化,其轨迹为一椭球面,是X的密度函数的等值面。若X给定,则d2为X到μ的马氏距离。§1.3.2多元正态分布的性质§1.3.3条件分布和独立性目录上页下页返回结束其中,X(1),μ(1)为qⅹ1,Σ11为qⅹq.设,p≥2,将X、μ和Σ剖分如下:我们希望求给定X(2)时X(1)的条件分布,即(X(1)|X(2))的分布。下一个定理指出:正态分布的条件分布仍为正态分布。目录上页下页返回结束§1.3.3条件分布和独立性定理1.2:设,Σ>0,则其中目录上页下页返回结束§1.3.3条件分布和独立性定理1.3:设,Σ>0,将X,μ,Σ剖分如下:则有如下的条件均值和条件协差阵的递推公式:其中,,定理1.2和定理1.3在20世纪70年代中期为国家标准部门制定服装标准时有成功的应用,见参考文献[3]。在制定服装标准时需抽样进行人体测量,现从某年龄段女子测量取出部分结果如下:X1:身高,X2:胸围,X3:腰围,X4:上体长,X5:臀围,已知它们遵从N5(μ,Σ),其中服装标准例子服装标准例子服装标准例子再利用(1.30)式得服装标准例子这说明,若已知一个人的上体的长和臀围,则身高、胸围和腰围的条件方差比原来的方差大大缩小。此时我们可看到服装标准例子在定理1.2中,我们给出了对X、μ和Σ作形如(1.25)式剖分时条件协差阵的表达式及其与非条件协差阵的关系,令表示的元素,则可以定义偏相关系数的概念:定义1.6:当给定时,与的偏相关系数为:目录上页下页返回结束§1.3.3条件分布和独立性§1.3.3条件分布和独立性在上面制定服装标准的例子中,给定X4和X5时,偏相关系数为:目录上页下页返回结束§1.3.3条件分布和独立性其中,证明参见文献[3].定理1.4:设,Σ>0,将X,μ,Σ剖分如下:§1.4均值向量和协方差阵的估计上节已经给出了多元正态分布的定义和有关的性质,在实际问题中,通常可以假定被研究的对象是多元正态分布,但分布中的参数μ和Σ是未知的,一般的做法是通过样本来估计。目录上页下页返回结束§1.4均值向量和协方差阵的估计1.均值向量的估计在一般情况下,如果样本资料阵为:目录上页下页返回结束§1.4均值向量和协方差阵的估计即均值向量μ的估计量,就是样本均值向量.这可由极大似然法推导出来。推导过程参见文献[3]。目录上页下页返回结束设样品相互独立,同遵从于p元正态分布,而且,Σ>0,则总体参数均值μ的估计量是§1.4均值向量和协方差阵的估计2.协方差阵的估计总体参数协差阵Σ的极大似然估计是目录上页下页返回结束§1.4均值向量和协方差阵的估计目录上页下页返回结束这里L是离差阵,它是每一个样品(向量)与样本均值(向量)的离差积形成的n个阶对称阵的和。但不是Σ的无偏估计,为了得到无偏估计我们常用样本协差阵作为总体协差阵的估计。§1.5常用分布及抽样分布多元统计研究的是多指标问题,为了了解总体的特征,通过对总体抽样得到代表总体的样本,但因为信息是分散在每个样本上的,就需要对样本进行加工,把样本的信息浓缩到不包含未知量的样本函数中,这个函数称为统计量,如前面介绍的样本均值向量、样本离差阵等都是统计量。统计量的分布称为抽样分布.在数理统计中常用的抽样分布有分布、分布和分布.在多元统计中,与之对应的分布分别为Wishart分布、分布和Wilks分布.目录上页下页返回结束§1.5常用分布及抽样分布1.5.2分布与分布1.5.1分布与Wishart分布1.5.3中心分布与Wilks分布目录上页下页返回结束§1.5.1分布与Wishart分布在数理统计中,若(),且相互独立,则所服从的分布为自由度为的分布(chisquareddistribution),记为.目录上页下页返回结束§1.5.1分布与Wishart分布分布的概率密度:§1.5.1分布与Wishart分布~~分布有几个重要的性质:1、若,且相互独立,则称为相互独立的具有可加性.4.设(),且相互独立,为个阶对称阵,且(阶单位阵),记,则为相互独立的分布的充要条件为.此时,.这个性质称为Cochran定理,在方差分析和回归分析中起着重要作用.目录上页下页返回结束§1.5.1分布与Wishart分布(1.32)定义1.7设相互独立,且,记,则随机矩阵:所服从的分布称为自由度为的维非中心Wishart分布,记为,其中,目录上页下页返回结束§1.5.1分布与Wishart分布称为非中心参数,当时称为中心Wishart分布,记为由Wishart分布的定义知,当时,退化为,此时中心Wishart分布就退化为,由此可以看出,Wishart分布实际上是分布在多维正态情形下的推广.下面不加证明的给出Wishart分布的5条重要性质:个随机样本,为样本均值,样本离差阵为维正态总体1.若是从中抽取的,则.相互独立.和(1)(2),目录上页下页返回结束§1.5.1分布与Wishart分布3.若,为非奇异阵,则,为任一4.若元常向量,满足则目录上页下页返回结束§1.5.1分布与Wishart分布2.若且相互独立,则特别的,设和分别为和的第个对角元,则:5.若,为任一元非零常向量,比值目录上页下页返回结束§1.5.1分布与Wishart分布§1.5.2分布与分布在数理统计中,若X~N(0,1),Y~χ2(n),且X与Y相互独立,则称服从自由度为n的t分布,又称为学生分布(studentdistribution),记为T~t(n).目录上页下页返回结束如果将T平方,即,则T2~F(1,n),即t(n)分布的平方服从第一自由度为1第二自由度为F的中心分布.中心分布可化为中心分布,其关系为:显然,当时,有.定义1.8设,,,,,与相互独立,则称随机变量(1.33)所服从的分布称为第一自由度为第二自由度为的中心分布,记为目录上页下页返回结束§1.5.2分布与分布§1.5.3中心分布与Wilks分布在数理统计中,若X~χ2(m),Y~χ2(n),且与相互独立,则称所服从的分布为第一自由度为m,第二自由度为n的中心F分布.记为F~F(m,n).F分布本质上是从正态总体N(μ,σ2)随机抽取的两个样本方差的比.目录上页下页返回结束所服从的分布称为维数为,第一自由度为第二自由度为的WilksΛ分布,记为(1.34)定义1.9设,,,,且与相互独立,则称随机变量目录上页下页返回结束§1.5.3中心分布与Wilks分布目录上页下页返回结束
本文档为【高级统计学1多元正态分布】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: ¥35.0 已有0 人下载
最新资料
资料动态
专题动态
机构认证用户
希望图文
公司秉着用户至上的原则服务好每一位客户,专注课件、范文、教案设计制作
格式:ppt
大小:2MB
软件:PowerPoint
页数:66
分类:
上传时间:2022-04-27
浏览量:6