首页 多元统计分析课后习题解答_

多元统计分析课后习题解答_

举报
开通vip

多元统计分析课后习题解答_第四章判别分析4.1简述欧几里得距离与马氏距离的区别和联系。答:设p维欧几里得空间Rp中的两点x=和Y=则欧几里得距离为O欧几里得距离的局限有①在多元数据分析中,其度量不合理。②会受到实际问题中量纲的影响。协方差设X,Y是来自均值向量为IEMBEDEquation.3if,的总体G中的p维样本。则马氏距离为D(X,Y)=即单位阵时,D(X,Y)=即欧几里得距离。因此,在一定程度上,欧几里得距离是马氏距离的特殊情况,马氏距离是欧几里得距离的推广。4.2试述判别分析的实质。答:判别分析就是希望利用已经测得的变量数据,找...

多元统计分析课后习题解答_
第四章判别分析4.1简述欧几里得距离与马氏距离的区别和联系。答:设p维欧几里得空间Rp中的两点x=和Y=则欧几里得距离为O欧几里得距离的局限有①在多元数据分析中,其度量不合理。②会受到实际问题中量纲的影响。协方差设X,Y是来自均值向量为IEMBEDEquation.3if,的总体G中的p维样本。则马氏距离为D(X,Y)=即单位阵时,D(X,Y)=即欧几里得距离。因此,在一定程度上,欧几里得距离是马氏距离的特殊情况,马氏距离是欧几里得距离的推广。4.2试述判别分析的实质。答:判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来。设R1,R2,,,Rk是p维空间Rp的k个子集,如果它们互不相交,且它们的和集为,则称为Rp的一个划分。判别分析问题实质上就是在某种意义上,以最优的性质对p维空间Rp构造一个“划分”,这个“划分”就构成了一个判别规则。4.3简述距离判别法的基本思想和 方法 快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载 。答:距离判别问题分为①两个总体的距离判别问题和②多个总体的判别问题。其基本思想都是分别计算样本与各个总体的距离(马氏距离),将距离近的判别为一类。两个总体的距离判别问题设有协方差矩阵习相等的两个总体G和G,其均值分别是叫和R2,对于一个新的样品X,要判断它来自哪个总体。计算新样品X到两个总体的马氏距离D2(X,G)和D2(X,G),则X,D2(X,G)ID2(X,G)2,一、2,_X,D(X,G)>D(X,G,具体分析,D2(X,G)-D2(X,G)=(X—山)2(X—岗)一(X—四2)2(X—(12)=X‘2‘X—2X室-\+山‘24■山一(XWx—2X‘2-1险+话刀^妇—2X2((x2—山)+山2四一(x22(x2=2X‘271(&一向)+(向+&)'〉」(博一&)(“+“〈,=—2.X-―2/(出一段)I2J=-2(X-。a=—2a(X—。则判别规则为,W(X),W(X)<0多个总体的判别问题。设有k个总体G〔,G2,…,Gk,其均值和协方差矩阵分别是且Z=Z2=涅=Z。计算样本到每个总体的马氏距离,于哪个总体。具体分析,D2(X,GQ=(X-心/」(X-s)=Xn」X_2e」X+效=Xn」X-2(1#+CQl11.1取\a=2"腿=—必ZS,«=1,2,…,k。可以取线性判别函数为W^X)=l;X+C_,二=1,2,…,k相应的判别规则为XwGi若Wi(XHmax(CQ4.4简述贝叶斯判别法的基本思想和方法。到哪个总体的距离最小就属fi(x),f2(x),…,fk(x),假设k个总体各自出现的概率分别为qi,q2,,qk,qi芝0,£qi=1。设将本来属于Gj总体的样品基本思想:设k个总体G[,G2,…,Gk,其各自的分布密度函数i=1错判到总体Gj时造成的损失为C(j|i),i,j=1,2,…,k。设k个总体G,G2,…,Gk相应的p维样本空间为R=(R,,R2,…,Rk)。在规则R下,将属于Gj的样品错判为Gj的概率为P(j|i,R)=Rfi(x)dxi,j=1,2;,ki=j则这种判别规则下样品错判后所造成的平均损失为kr(i|R)八[C(j|i)P(j|i,R)]i=1,2,,kj日则用规则R来进行判别所造成的总平均损失为kg(R)八qir(i,R)i4kkqLC(j|i)P(j|i,R)i4j4贝叶斯判别 法则 一的法则下载秘密吸引力法则pdf一的法则pdf错觉的法则下载一的法则pdf ,就是要选择一种划分Ri,R2,…,Rk,使总平均损失g(R)达到极小。kk基本方法:g(R)='q'C(j|i)P(j|i,R)i4j4kkqLC(j|i)Rfi(x)dxTOC\o"1-5"\h\zi4j4jkk='、r('qiC(j|i)fi(x))dxj」Rji4kk令ZqQ(j|i)fi(x)=hj(x),则g(R)=WRhj(x)dxidjWjk若有另一划分R*=(R*,R;,…,R;),g(R*)=EL*hj(x)dxj日j则在两种划分下的总平均损失之差为kkg(R)-g(R*)5(x)-hj(x)]dxqjm5因为在Ri上hi(x)苴hj(x)对一切j成立,故上式小于或等于零,是贝叶斯判别的解。R」RRR\R={x|hi(x)=m.inhj(x)}从而得到的划分R—(Rl,R2,,Rk)为1如』1—1,2,,k4.5简述费希尔判别法的基本思想和方法。答:基本思想:从k个总体中抽取具有p个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数U(X)=u1X1u2X2npXp=uX系数u=(Ui,U2,…,Up)'可使得总体之间区别最大,而使每个总体内部的离差最小。将新样品的p个指标值代入线性判别函数式中求出U(X)值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。4.6试析距离判别法、贝叶斯判别法和费希尔判别法的异同。答:①费希尔判别与距离判别对判别变量的分布类型无要求。二者只是要求有各类母体的两阶矩存在。而贝叶斯判别必须知道判别变量的分布类型。因此前两者相对来说较为简单。②当k=2时,若^=12=1则费希尔判别与距离判别等价。当判别变量服从正态分布时,二者与贝叶斯判别也等价。当时,费希尔判别用+£2作为共同协差阵,实际看成等协差阵,此与距离判别、贝叶斯判别不同。距离判别可以看为贝叶斯判别的特殊情形。贝叶斯判别的判别规则是XIG]IInd,W(X)IG?X,W(X) 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 化的典型判别函数系数由于可以将实测的样品观测值直接代入求出判别得分,所以该系数使用起来比标准化的系数要方便一些。具体见表4.3。LanmicaiLUscrkTimaiitIuncflianCdeiTictciiitsFunction1'•1临-•环.173.HD表4.3未标准化的典型判别函数系数由此表可知,Fisher判别函数为:Y--10.794-0.32X16.687X20.173X30.357X40.024X50.710X60.792X7-2.383X8用Y计算出各观测值的具体坐标位置后,再比较它们与各类重心的距离,就可以得知分类,如若与group0的重心距离较近则属于group。,反之亦然。各类重心在空间中的坐标位置如表4.4所示。FunctionsatGroupCentroidsFunctcng『Qii010-243712437Unstandardizedcanonicaldiscriminanrtfunctionse'^lualec)atgroupmeans表4.4各类重心处的费希尔判别函数值用bayes判别法建立判别函数与判别规则,由于此题中假设各类出现的先验概率相等且误判造成的损失也相等,所以距离判别法与bayes判别完全一致。如表4.5所示,group栏中的每一列表示样品判入相应列的Bayes判别函数系数。由此可得,各类的Bayes判别函数如下:G0-418.6930.340X194.070X21.033X3-4.943X42.969X513.723X6-10.994X7-37.504X8G1--171.2960.184X1126.660X21.874X3-6.681X43.086X517.182X6-7.133X7-49.116X8□aswMlcmjiiiFhirhiTtinriCnelTiclHrtcgnupj1.340.1Edx294.070125,560nJ\Q7Ax4■4.043■6681城52.Q6SJ.08613.72217.1政IQ9047133ma■37.50449116118.633职Fishersin?ardisrnminanlfunctcns表4.5Bayes判别函数系数将各样品的自变量值代入上述两个Bayes判别函数,得到两个函数值。比较这两个函数值,哪个函数值比较大就可以判断该样品该判入哪一类。2)在判别结果的CasewiseStastics表中容易查到该客户属于group0,信用好。4.10从胃癌患者、萎缩性胃炎患者和非胃炎患者中分别抽取五个病人进行四项生化指标的化验:血清铜蛋白(X1卜蓝色反应(X2)、尿呵噪乙酸(X3)和中性硫化物(X4),数据见下表。试用距离判别法建立判别函数,并根据此判别函数对原样本进行回判。号27j人病34胃癌患者70胃炎患者萎缩性67891C心5O023121071516非胃炎患者12345111110008052687111115^3011173055130122874011112010127207671055626101943122解:令骨癌患者、萎缩性胃炎患者和非胃炎患者分别为groupl、group2、group3,由于此题中假设各类出现的先验概率相等且误判造成的损失也相等,所以距离判别法与bayes判别完全一致。用spss的解题步骤如下:1.在SPS驹口中选择AnalyzesClassifyDiscriminate,调出判别分析主界面,将左边的变量列表中的"group”变量选入分组变量中,将Xi、X2、X3X4变量选入自变量中,并选择Enterindependentstogether单选按钮,即使用所有自变量进行判别分析。点击DefineRange按钮,定义分组变量的取值范围。本例中分类变量的范围为1到3,所以在最小值和最大值中分别输入1和3。单击Continue按钮,返回主界面。单击Statistics按钮,指定输出的描述统计量和判别函数系数。选中FunctionCoefficients栏中的Fisher:绐出Bayes判别函数的系数。单击Classify按钮,弹出classification子对话框,选中Display选项栏中的Summarytable复选框,即要求输出错判矩阵,以便实现题中对原样本进行回判的要求。返回判别分析主界面,单击OK按钮,运行判别分析过程。根据判别分析的结果建立Bayes判别函数:Bayes判别函数的系数见表4.6。表中每一列表示样本判入相应类的Bayes判别函数系数。由此可建立判别函数如下:Groupi:Y1=—79.21)0.164(1+0.75X2十0.77X3+0.073(4Group2:Y2=T6.721十0.130X1十0.595X2+0.317X3十0.012X4Group3:Y3=工9.598+0.13成1十0.637(2+0.100(3—0.05*4将各样品的自变量值代入上述三个Bayes判别函数,得到三个函数值。比较这三个函数值,哪个函数值比较大就可以判断该样品判入哪一类。u^ssiricaiiDnFuncrioncoeniciRimsgroup171BJ1扑IMj595.637妇31T1IIIJ012-.053-7321?-45.771Fithcr'clin«»rdfunctione表4.6Bayes判别函数系数根据此判别函数对样本进行回判,结果如表4.7。从中可以看出在5个胃癌患者中,有4个被正确地判定,有1个被错误地判定为非胃炎患者,正确率为80%。在5个萎缩性胃炎患者中,有4个被正确判定,有1个被错误地判定为非胃炎患者,正确率为80%。在5个非胃炎患者中,有4个被正确判定,有1个被错误地判为萎缩性胃炎患者。整体的正确率为80.0%oClaftsmrannngrou口FrodictcdGroupTctoi123OriginalDouni14015204153D15%1eo.o,Q20.0100.02.0OQ.D2001Q0.D3.D20.0DOO1Q0.0aBDjO%ofoiiginalgroupsdcaesstonsd^clBBsllal表4.7错判矩阵
本文档为【多元统计分析课后习题解答_】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
陨辰
暂无简介~
格式:doc
大小:286KB
软件:Word
页数:13
分类:
上传时间:2021-10-30
浏览量:164