首页 正态分布中的Bayes决策ppt课件

正态分布中的Bayes决策ppt课件

举报
开通vip

正态分布中的Bayes决策ppt课件2.3正态分布时的统计决策Bayes决策的三个前提:类别数确定各类的先验概率P(ωi)已知各类的条件概率密度函数p(x|ωi)已知Bayes决策中,类条件概率密度的选择要求:模型合理性计算可行性最常用概率密度模型:正态分布观测值通常是很多种因素共同作用的结果,根据中心极限定理,它们(近似)服从正态分布。计算、分析最为简单的模型。一、正态分布判别函数1、为什么采用正态分布:a、正态分布在物理上是合理的、广泛的。b、正态分布数学上简单,N(μ,σ²)只有均值和方差两个参数。§2-3.1正态分布决策理论.2、单变量正态分...

正态分布中的Bayes决策ppt课件
2.3正态分布时的统计决策Bayes决策的三个前提:类别数确定各类的先验概率P(ωi)已知各类的条件概率密度函数p(x|ωi)已知Bayes决策中,类条件概率密度的选择要求:模型合理性计算可行性最常用概率密度模型:正态分布观测值通常是很多种因素共同作用的结果,根据中心极限定理,它们(近似)服从正态分布。计算、分析最为简单的模型。一、正态分布判别函数1、为什么采用正态分布:a、正态分布在物理上是合理的、广泛的。b、正态分布数学上简单,N(μ,σ²)只有均值和方差两个参数。§2-3.1正态分布决策理论.2、单变量正态分布:.从p(x)的图形上可以看出,只要有两个参数m和s2,就可以完全确定其曲线。若服从正态分布的总体中随机抽取样本x,约有95%的样本落在(m-2s,m+2s)中。样本的分散程度可以用s来 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 示,s越大分散程度越大。.正态分布是指一个随机实数度量值在整个实数域上的分布规律。因此它属于概率密度函数类,不是我们所讨论的先验概率P(ωi),也不是后验概率P(ωi|X),而是p(x|ωi)。.3、(多变量)多维正态分布为d维均值向量也就是:(1)函数形式:x=(x1,x2,…,xd)T为d维随机向量S是d×d维协方差矩阵,S-1是S的逆矩阵,|S|为S的行列式。协方差矩阵S是对称的,其中有d×(d+1)/2个独立元素。.由于r(x)可由m和S完全确定,所以实际上r(x)可由d×(d+1)/2+d个独立元素来确定。m、S分别是向量x和矩阵(x-m)(x-m)T的期望。多元正态分布与单态量正态分布在形式上尽管不同,但有很多相似之处,实际上单变量正态分布只是维数为1的多元分布。.当d=1时,Σ只是一个1×1的矩阵,也就是只有1个元素的矩阵,退化成一个数,|Σ|1/2也就是标准差σ,Σ-1也就是σ-2,而(X-μ)T(X-μ)也变成(X-μ)2,多元正态分布的概率密度函数中的元就是我们前面说得特征向量的分量数,也就是维数。.具体说:若xi是x的第i个分量,mi是m的第i个分量,sij2是S的第i、j个元素。其中r(xi)为边缘分布,.协方差矩阵:是一个对称矩阵,只考虑S为正定矩阵的情况,也就是:|S|所有的子式都大于0.同单变量正态分布一样,多元正态分布r(x)可以由m和S完全确定,常记为N(m,S)。.(2)多元正态分布的性质参数μ和Σ完全决定分布等概率密度轨迹为超椭球面不相关性等价于独立性边缘分布和条件分布的正态性线性变换的正态性线性组合的正态性.①.参数m和S对分布的决定性对于d维随机向量x,它的均值向量m也是d维的,协方差矩阵是对称的,其中有d×(d+1)/2个独立元素。r(x)可由m和S完全确定,实际上r(x)可由d×(d+1)/2+d个独立元素决定。常记为:r(x)~N(m,S).②.等密度点的轨迹为一超椭球面由r(x)的定义公式可知,右边指数项为常数时,密度r(x)的值不变,所以等密度点满足:二维情况下,上式的解是一个椭圆轨迹,其长短轴方向由Σ协方差矩阵的特征向量决定,三维时是一个椭球面,超过三维则是超椭球面,主轴方向由协方差矩阵S的特征向量决定,各主轴的长度则与相应的特征值成正比。.从下图可以看出,从正态分布总体中抽取的样本大部分落在由m和S所确定的一个区域里,这个区域的中心由均值向量m决定,区域的大小由协方差矩阵决定。.在数理统计中,令:式中g称为x到m的马氏距离(Mahalanobis)距离。所以等密度点轨迹是x到m的马氏距离g为常数的超椭球面。.③.不相关性等价于独立性概率论中,一般来说,两个随机变量xi和xj之间不相关,并不意味着它们一定独立。如果xi和xj之间不相关,则xixj的数学期望有:如果xi和xj相互独立,则有:.如果xi和xj相互独立,则它们之间一定不相关,反之则不成立。但是对服从正态分布的两个分量xi和xj,若xi和xj互不相关,则它们之间一定独立。 证明 住所证明下载场所使用证明下载诊断证明下载住所证明下载爱问住所证明下载爱问 :见书P27根据独立性的定义:正态分布随机向量的各分量间互不相关性与相互独立等价。独立性是比不相关更强的条件。不相关反映了xi和xj的总体性质。.④.边缘分布与条件分布的正态性从(3)证明得出的结论r(x)表达式,如果x用xj表示,有:也就是说,边缘分布r(x1)服从均值为m,方差为s112的正态分布:同理,.二元正态分布协方差矩阵∑及其逆矩阵∑-1为下面以二元正态分布为例进行证明.根据边缘分布定义.=1另外,条件分布,给定x1的条件下x2的分布:证明条件分布仍然是正态分布(作业题).⑤.线性变换的正态性对于多元随机向量的线性变换,仍为多元正态分布的随机向量。就是:x服从正态分布r(x)~N(m,S),对x作线性变换y=Ax,其中A为线性变换矩阵,且|A|≠0,则y服从正态分布:r(x)~N(Am,ASAT)证明:x经过变换为y,设变换矩阵A为非奇异矩阵,y=Ax即x=A-1y.即Ex=m,Ey=n根据雅克比行列式的定义,有|J|=|A|x的均值向量为m,y的均值向量为n所以y的概密函数与x的概密函数之间的关系为:所以:n=Am即m=A-1n.由于:|A|=|AT|=|AA|1/2(对称正定)由上面的结论可以得到:.即:性质5说明了用非奇异阵A对x作线性变换后,原来的正态分布正好变成另一个参数不同的正态分布。由于∑是对称阵,根据高等代数知识总可以找到某个A,使得变换后y的协方差矩阵A∑AT为对称阵,这就意味着y的各个分量之间是相互独立的,也就是总可以找到一组坐标系,使各随机变量在新的坐标系下是独立的。.⑥.线性组合的正态性若x为多元正态随机向量,则线性组合y=aTx是一维的正态随机变量:其中,a与x同维。证明利用性质(5)做线性变换y=ATx,得.由性质(5),y是服从均值向量ATm,协方差阵AT∑A的多元统计分布,由性质(4),y的边缘分布的正态性,可以得出y=aTx服从正态分布,其概率密度函数为:其中A=[a,A1]为非奇异阵,A1为d×(d-1)为矩阵,y=[y,Y1]T.2.3.2正态分布中的Bayes分类 方法 快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载 前面,我们已经把基于Bayes公式的几种分类判决规则抽象为相应的判决函数和决策面方程。这几种方法中Bayes最小错误率判决规则是一种最基本的方法。如果取0-1损失函数,最小风险判决规则和最大似然比判决规则均与最小错误判决规则等价。.下面以最小错误判决规则为例来研究Bayes分类方法在正态分布中的应用。由最小错误率判决规则抽象出来的判决函数如下:如果类概率密度是正态分布的,.则r(x|wi)~N(mi,Si)。取对数,得判别函数为.下面对几种特殊情况进行讨论。该情况下,每类的协方差矩阵相等,而且类的各特征间相互独立(由上节的性质③得知),具有相等的方差s2。.因此:(1)先验概率P(wi)与P(wj)不相等.其中:将上两式代入gi(x):为x到类wi的均值向量mi的“欧氏距离”的平方。与类别无关,可以忽略,因此gi(x)可简化为:.进一步简化得。xTx与i无关,可以忽略:.是一个线性函数。因此可以进一步写成.(2)P(wi)=P,所有各类概率相等决策规则:对某个x计算决策面是一个超平面。.满足的x的轨迹是wi与wj类间的决策面当P(wi)=P(wj)时,超平面通过mi与mj连线中点并与连线正交.两个同心圆是两类概率分布等密度点轨迹,两个圆心就是两类的均值点。两类的区分线l与m1-m2垂直,其交点为x0若P(w1)≠P(w2)时,x0向先验概率较小的那个类型的均值点偏移。x0一般不是m1-m2的中点,但当P(w1)=P(w2)时,x0为m1-m2的中点。.情况二:Σi=Σ相等,即各类协方差相等从几何上看,相当于各类样本集中于以该类均值点为中心的同样大小和形状的超椭球面内。.对于未知的x,如果把x与各类均值相减,即相当于Mahalanobis距离的平方。这时把x归于最近一类。称为最小距离分类器。与类别无关,可以忽略,.gi(x)为线性函数,故决策面是一个超平面。.如果决策域R1和R2相邻,则决策面方程应满:.下面针对ω1,ω2二类情况进行讨论.情况三:Σί为任意,各类协方差矩阵不等这时判别函数为x的二次型。.如果决策域,R1和R2相邻,则决策面方程应满足...2.4关于分类器的错误率问题在分类过程中,任何一种决策规则都有其相应的错误率,当采用指定的决策规则来对类条件概率密度及先验概率均为已知的问题进行分类时,它的错误率是固定的。错误率反映了分类问题固有的复杂性的程度。对同一种问题 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 出的多种不同的分类 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 ,通常总是以错误率大小作为比较方案好坏的标准。因此,在本书中错误率是非常重要的参数。.2.4.0两类决策的错误率为下式从上式可以看出当x为多维向量的时候,进行积分运算的工作量比较大。因此对于实际问题,对错误率的研究一般从下面三点出发:1、按理论公式研究。2、计算错误率上界3、实验估计.2.4.1在一些特殊情况下错误率的理论计算第一种情况---正态分布且等协方差矩阵S1=S2=S3下面回顾一下最小错误率贝叶斯决策的负对数似然比函数很显然,h(x)为随机变量,记它的分布函数为P(h|wi).这样贝叶斯决策的最小错误率形式在实际情况下,我们只考虑正态分布,因此h(x)可以写成如下形式:..上式表明决策面是x的二次型,如果协方差相等,决策面就变成x的线性函数。即x是d维等协方差正态分布的随机向量,而h(x)是一维的随机变量,且是x的线性函数,因此上式可看成是对x的各分量做线性组合aTx,然后再作平移,其中aT=(m2-m1)TS-1.令则有.同样可以得出p(h/w2)的参数均值h2及方差s22因此,可以利用p(h/w1)和p(h/w2)计算出P1(e)和P2(e)..2.独立随机变量当d维随机向量x的分量相互独立时,x的密度函数课表示为:因此负对数似然比h(x)为:.也就是说随机变量h(x)为d个随机变量h(xl)之和。根据中心极限定理,无论h(xl)的密度函数如何,只要当d大时,h(x)的密度函数总是趋于正态分布。这样我们就可以得到均值h2及方差s22.根据独立性假设,上式中第二项必定为零,所以其方差可写为.
本文档为【正态分布中的Bayes决策ppt课件】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
机构认证用户
爱赢
公司经营范围:网络软件设计、制作、图文设计、影视制作(编辑)
格式:ppt
大小:863KB
软件:PowerPoint
页数:0
分类:互联网
上传时间:2021-03-03
浏览量:11