首页 应用多元统计分析课后答案(3)

应用多元统计分析课后答案(3)

举报
开通vip

应用多元统计分析课后答案(3).'.2.1.试叙述多元联合分布和边际分布之间的关系。解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,12(,,)pXXXX的联合分布密度函数是一个p维的函数,而边际分布讨论是12(,,)pXXXX的子向量的概率分布,其概率密度函数的维数小于p。2.2设二维随机向量12()XX服从二元正态分布,写出其联合分布。解:设12()XX的均值向量为12μ,协方差矩阵为21122212,则其联合分布密度函数为1/212221121122221221211()exp()()22fxxμxμ。...

应用多元统计分析课后答案(3)
.'.2.1.试叙述多元联合分布和边际分布之间的关系。解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,12(,,)pXXXX的联合分布密度函数是一个p维的函数,而边际分布讨论是12(,,)pXXXX的子向量的概率分布,其概率密度函数的维数小于p。2.2设二维随机向量12()XX服从二元正态分布,写出其联合分布。解:设12()XX的均值向量为12μ,协方差矩阵为21122212,则其联合分布密度函数为1/212221121122221221211()exp()()22fxxμxμ。2.3已知随机向量12()XX的联合密度函数为121212222[()()()()2()()](,)()()dcxabaxcxaxcfxxbadc其中1axb,2cxd。求(1)随机变量1X和2X的边缘密度函数、均值和方差;(2)随机变量1X和2X的协方差和相关系数;(3)判断1X和2X是否相互独立。(1)解:随机变量1X和2X的边缘密度函数、均值和方差;112121222[()()()()2()()]()()()dxcdcxabaxcxaxcfxdxbadc12212222222()()2[()()2()()]()()()()ddccdcxaxbaxcxaxcdxbadcbadc121222202()()2[()2()]()()()()ddccdcxaxbatxatdtbadcbadc22121222202()()[()2()]1()()()()dcdcdcxaxbatxatbadcbadcba所以由于1X服从均匀分布,则均值为2ba,方差为212ba。.'.同理,由于2X服从均匀分布2121,()0xxcdfxdc其它,则均值为2dc,方差为212dc。(2)解:随机变量1X和2X的协方差和相关系数;12cov(,)xx12121212222[()()()()2()()]22()()dbcadcxabaxcxaxcabdcxxdxdxbadc()()36cdba1212cov(,)13xxxx(3)解:判断1X和2X是否相互独立。1X和2X由于121212(,)()()xxfxxfxfx,所以不独立。2.4设12(,,)pXXXX服从正态分布,已知其协方差矩阵为对角阵,证明其分量是相互独立的随机变量。解:因为12(,,)pXXXX的密度函数为1/21111(,...,)exp()()22ppfxxΣxμΣxμ又由于21222pΣ22212pΣ.'.212122111pΣ则1(,...,)pfxx211/22222121221111exp()()221pppΣxμΣxμ222123111222212()()()1111exp...2222pppppxxx2121()1exp()...()22piipiiixfxfx则其分量是相互独立。2.6渐近无偏性、有效性和一致性;2.7设总体服从正态分布,~(,)pNXμΣ,有样本12,,...,nXXX。由于X是相互独立的正态分布随机向量之和,所以X也服从正态分布。又111()nnniiiiiEEnEnnXXXμμ2211111()nnniiiiiDDnDnnnΣXXXΣ所以~(,)pNXμΣ。2.8方法1:11?()()1niiinΣXXXX111niiinnXXXX11?()()1niiiEEnnΣXXXX111niiiEnEnXXXX111(1)11ninnnnnΣΣΣΣ。.'.方法2:1()niiiSX-X)(X-X1((niiiX-μXμ)X-μXμ)11()()2()()()nniiiiinX-μX-μX-μX-μXμ)(XμXμ1()()2()()niiinnX-μX-μXμ)(XμXμ)(Xμ1()()()niiinX-μX-μXμ)(Xμ11()()()()11niiiEEnnnSX-μX-μXμ)(Xμ11()()()1niiiEnEnX-μX-μXμ)(XμΣ。故1nS为Σ的无偏估计。2.9.设(1)(2)()nX,X,...,X是从多元正态分布~(,)pNXμΣ抽出的一个简单随机样本,试求S的分布。证明:设******()***111ijnnnΓ为一正交矩阵,即ΓΓI。令12n12nΖ=(ΖΖΖ)=XXXΓ,(1,2,3,4,),iniXΓ由于独立同正态分布且为正交矩阵所以12()n独立同正态分布。且有11nniinΖΧ,11()()nniiEEnnΖΧμ,()VarnZΣ。1()()(1,2,3,,1)naajjjEEranΖΧ11najjnnrμ10najnjinrrμ1()()naajjjVarVarrΖΧ.'.2211nnajjajjjrVarrΧΣΣ所以121nΖΖΖ独立同(0,)NΣ分布。又因为1()()njjiSXXXX1njjjnXXXX因为1111nniinniinnnnnnXXXXZZ又因为nnnjjjXXXXXXXX212111212nnXXXXXΓΓX1212nnZZZZZZ所以原式nnnjjjnnnjjjZZZZZZXX111122...nnnnZZZZZZ-ΖΖ故11njjjS,由于121,,,nZZZ独立同正态分布(0,)pNΣ,所以11~(1,)njjpjWnS2.10.设()iiXnp是来自(,)piiNμΣ的简单随机样本,1,2,3,,ik,(1)已知2...k1μμμμ且2...k1ΣΣΣΣ,求μ和Σ的估计。(2)已知2...k1ΣΣΣΣ求2,,...,,k1μμμ和Σ的估计。解:(1)11121?...ankaiaiknnnμxx,1112?...ankaaiiaiknnnxxxxΣ(2)1ln(,,,)kLμμΣ2111ln()exp[]2anknpaaiaiaai2-1Σ(x-μ)Σ(x-μ).'.1111ln()ln()ln222ankaaiaiaainLpn2-1μ,ΣΣ(x-μ)Σ(x-μ)21111ln(,)1()()022ankaaiaiaaiLnμΣΣXμXμΣΣ11ln(,)()0(1,2,...,)jnjijjijLjkμΣΣXμμ解之,得11?jnjjijijnμxx,1112?...jnkjjjiknnnijijxxxxΣ第三章3.1试述多元统计分析中的各种均值向量和协差阵检验的基本思想和步骤。其基本思想和步骤均可归纳为:第一,提出待检验的假设和H1;第二,给出检验的统计量及其服从的分布;第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域;第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。均值向量的检验:统计量拒绝域均值向量的检验:在单一变量中当2已知0()Xzn/2||zz当2未知0()XtnS/2||(1)ttn(2211()1niiSXXn作为2的估计量)一个正态总体00Hμμ:协差阵Σ已知212000()()~()TnpXμΣXμ220T协差阵Σ未知2(1)1~(,)(1)npTFpnpnp2(1)npTFnp(2100(1)[()()]TnnnXμSXμ).'.两个正态总体012Hμμ:有共同已知协差阵2120()()~()nmTpnmXYΣXY220T有共同未知协差阵2(2)1~(,1)(2)nmpFTFpnmpnmpFF(其中21(2)()()nmnmTnmnmnmXYSXY)协差阵不等mn-1()~(,)npnFFpnppZSZFF协差阵不等mn1()~(,)npnFFpnpp-ZSZFF多个正态总体kH210:单因素方差(1)~(1,)()SSAkFFknkSSEnkFF多因素方差~(,,1)pnkkEETAE协差阵的检验检验0ΣΣ0pHΣI:/2/21exp2npnetrnSS00pHΣΣI:/2/2**1exp2npnetrnSS检验12kΣΣΣ012kHΣΣΣ:统计量/2/2/2/211iikknnpnnpkiiiinnSS3.2试述多元统计中霍特林分布和威尔克斯分布分别与一元统计中t分布和F分布的关系。.'.答:(!)霍特林分布是t分布对于多元变量的推广。22212()()()()nXtnXSXS而若设~(,)pNXμΣ,~(,)pWnSΣ且X与S相互独立,pn,则称统计量的分布为非中心霍特林T2分布。若~(,)pNX0Σ,~(,)pWnSΣ且X与S相互独立,令21TnXSX,则21~(,1)npTFpnpnp。(2)威尔克斯分布在实际应用中经常把统计量化为2T统计量进而化为F统计量,利用F统计量来解决多元统计分析中有关检验问题。与F统计量的关系p1n2nF统计量及分别任意任意1111111(,,1)~(,1)(,,1)nppnFpnpppn任意任意211111(,,2)~(2,2())(,,2)pnnpFpnpppn1任意任意112212121(1,,)~(,)(1,,)nnnFnnnnn2任意任意121212121(2,,)1~(2,2(1))(2,,)nnnFnnnnn3.3试述威尔克斯统计量在多元方差分析中的重要意义。答:威尔克斯统计量在多元方差分析中是用于检验均值的统计量。012kHμμμ:1ijHijμμ:至少存在使用似然比原则构成的检验统计量为~(,,1)pnkkEETAE给定检验水平,查Wilks分布表,确定临界值,然后作出统计判断。第四章4.1简述欧几里得距离与马氏距离的区别和联系。答:设p维欧几里得空间中的两点X=和Y=。则欧几里得距离为.'.。欧几里得距离的局限有①在多元数据分析中,其度量不合理。②会受到实际问题中量纲的影响。设X,Y是来自均值向量为,协方差为的总体G中的p维样本。则马氏距离为D(X,Y)=。当即单位阵时,D(X,Y)==即欧几里得距离。因此,在一定程度上,欧几里得距离是马氏距离的特殊情况,马氏距离是欧几里得距离的推广。4.2试述判别分析的实质。答:判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来。设R1,R2,⋯,Rk是p维空间Rp的k个子集,如果它们互不相交,且它们的和集为,则称为的一个划分。判别分析问题实质上就是在某种意义上,以最优的性质对p维空间构造一个“划分”,这个“划分”就构成了一个判别 规则 编码规则下载淘宝规则下载天猫规则下载麻将竞赛规则pdf麻将竞赛规则pdf 。4.3简述距离判别法的基本思想和方法。答:距离判别问题分为①两个总体的距离判别问题和②多个总体的判别问题。其基本思想都是分别计算样本与各个总体的距离(马氏距离),将距离近的判别为一类。①两个总体的距离判别问题设有协方差矩阵∑相等的两个总体G1和G2,其均值分别是1和2,对于一个新的样品X,要判断它来自哪个总体。计算新样品X到两个总体的马氏距离D2(X,G1)和D2(X,G2),则X,D2(X,G1)D2(X,G2)X,D2(X,G1)>D2(X,G2,具体分析,2212(,)(,)DGDGXX111122111111111222111211122()()()()2(2)2()XμΣXμXμΣXμXΣXXΣμμΣμXΣXXΣμμΣμXΣμμμΣμμΣμ11211212112122()()()2()22()2()XΣμμμμΣμμμμXΣμμXμααXμ记()()WXαXμ则判别规则为X,W(X).'.X,W(X)<0②多个总体的判别问题。设有k个总体kGGG,,,21,其均值和协方差矩阵分别是kμμμ,,,21和kΣΣΣ,,,21,且ΣΣΣΣk21。计算样本到每个总体的马氏距离,到哪个总体的距离最小就属于哪个总体。具体分析,21(,)()()DGXXμΣXμ111122()CXΣXμΣXμΣμXΣXIX取μΣI1,μΣμ121C,k,,2,1。可以取线性判别函数为()WCXIX,k,,2,1相应的判别规则为iGX若1()max()ikWCXIX4.4简述贝叶斯判别法的基本思想和方法。基本思想:设k个总体kGGG,,,21,其各自的分布密度函数)(,),(),(21xxxkfff,假设k个总体各自出现的概率分别为kqqq,,,21,0iq,11kiiq。设将本来属于iG总体的样品错判到总体jG时造成的损失为)|(ijC,kji,,2,1,。设k个总体kGGG,,,21相应的p维样本空间为),,,(21kRRRR。在规则R下,将属于iG的样品错判为jG的概率为xxdfRijPjRi)(),|(jikji,,2,1,则这种判别规则下样品错判后所造成的平均损失为kjRijPijCRir1)],|()|([)|(ki,,2,1则用规则R来进行判别所造成的总平均损失为kiiRirqRg1),()(kikjiRijPijCq11),|()|(贝叶斯判别法则,就是要选择一种划分kRRR,,,21,使总平均损失)(Rg达到极小。基本方法:kikjiRijPijCqRg11),|()|()(xxdfijCqkikjRiij11)()|(.'.kjRkiiijdfijCq11))()|((xx令1(|)()()kiijiqCjifhxx,则kjRjjdhRg1)()(xx若有另一划分),,,(**2*1*kRRRR,kjRjjdhRg1**)()(xx则在两种划分下的总平均损失之差为kikjRRjijidhhRgRg11**)]()([)()(xxx因为在iR上)()(xxjihh对一切j成立,故上式小于或等于零,是贝叶斯判别的解。从而得到的划分),,,(21kRRRR为1{|()min()}iijjkRhhxxxki,,2,14.5简述费希尔判别法的基本思想和方法。答:基本思想:从k个总体中抽取具有p个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数1122()ppUuXuXuXXuX系数),,,(21puuuu可使得总体之间区别最大,而使每个总体内部的离差最小。将新样品的p个指标值代入线性判别函数式中求出()UX值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。4.6试析距离判别法、贝叶斯判别法和费希尔判别法的异同。答:①费希尔判别与距离判别对判别变量的分布类型无要求。二者只是要求有各类母体的两阶矩存在。而贝叶斯判别必须知道判别变量的分布类型。因此前两者相对来说较为简单。②当k=2时,若则费希尔判别与距离判别等价。当判别变量服从正态分布时,二者与贝叶斯判别也等价。③当时,费希尔判别用作为共同协差阵,实际看成等协差阵,此与距离判别、贝叶斯判别不同。④距离判别可以看为贝叶斯判别的特殊情形。贝叶斯判别的判别规则是X,W(X)X,W(X)<lnd距离判别的判别规则是X,W(X)X,W(X)<0二者的区别在于阈值点。当21qq,)1|2()2|1(CC时,1d,0lnd。二者完全相同。4.7设有两个二元总体和,从中分别抽取样本计算得到.'.,,假设,试用距离判别法建立判别函数和判别规则。样品X=(6,0)’应属于哪个总体?解:=,=,==,,即样品X属于总体第五章5.1判别分析和聚类分析有何区别?答:即根据一定的判别准则,判定一个样本归属于哪一类。具体而言,设有n个样本,对每个样本测得p项指标(变量)的数据,已知每个样本属于k个类别(或总体)中的某一类,通过找出一个最优的划分,使得不同类别的样本尽可能地区别开,并判别该样本属于哪个总体。聚类分析是分析如何对样品(或变量)进行量化分类的问题。在聚类之前,我们并不知道总体,而是通过一次次的聚类,使相近的样品(或变量)聚合形成总体。通俗来讲,判别分析是在已知有多少类及是什么类的情况下进行分类,而聚类分析是在不知道类的情况下进行分类。5.2试述系统聚类的基本思想。答:系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。5.3对样品和变量进行聚类分析时,所构造的统计量分别是什么?简要说明为什么这样构造?答:对样品进行聚类分析时,用距离来测定样品之间的相似程度。因为我们把n个样本看作p维空间的n个点。点之间的距离即可代表样品间的相似度。常用的距离为(一)闵可夫斯基距离:1/1()()pqqijikjkkdqXXq取不同值,分为(1)绝对距离(1q),1(1)pijikjkkdXX(2)欧氏距离(2q),21/21(2)()pijikjkkdXX(3)切比雪夫距离(q),1()maxijikjkkpdXX(二)马氏距离11()pikjkijkikjkXXdLpXX.'.(三)兰氏距离对变量的相似性,我们更多地要了解变量的变化趋势或变化方向,因此用相关性进行衡量。将变量看作p维空间的向量,一般用(一)夹角余弦(二)相关系数5.4在进行系统聚类时,不同类间距离计算方法有何区别?选择距离公式应遵循哪些原则?答:设dij表示样品Xi与Xj之间距离,用Dij表示类Gi与Gj之间的距离。(1).最短距离法,minikjrkrijXGXGDdmin{,}kpkqDD(2)最长距离法,maxipjqpqijXGXGDd,maxikjrkrijXGXGDdmax{,}kpkqDD(3)中间距离法其中(4)重心法2()()pqpqpqDXXXX)(1qqpprrXnXnnX22222pqpqkrkpkqpqrrrnnnnDDDDnnn(5)类平均法221ipjjpqijXGXGpqDdnn221ikjrkrijXGXGkrDdnn22pqkpkqrrnnDDnn(6)可变类平均法其中是可变的且<121()()()ijijijdMXXΣXX12211cos()()pikjkkijppikjkkkXXXX12211()()()()pikijkjkijppikijkjkkXXXXrXXXXijGXGXijdDjjii,min22222121pqkqkpkrDDDD2222(1)()pqkrkpkqpqrrnnDDDDnn.'.(7)可变法22221()2krkpkqpqDDDD其中是可变的且<1(8)离差平方和法1()()tntittitttSXXXX2222kpkqkkrkpkqpqrkrkrknnnnnDDDDnnnnnn通常选择距离公式应注意遵循以下的基本原则:(1)要考虑所选择的距离公式在实际应用中有明确的意义。如欧氏距离就有非常明确的空间距离概念。马氏距离有消除量纲影响的作用。(2)要综合考虑对样本观测数据的预处理和将要采用的聚类分析方法。如在进行聚类分析之前已经对变量作了标准化处理,则通常就可采用欧氏距离。(3)要考虑研究对象的特点和计算量的大小。样品间距离公式的选择是一个比较复杂且带有一定主观性的问题,我们应根据研究对象的特点不同做出具体分折。实际中,聚类分析前不妨试探性地多选择几个距离公式分别进行聚类,然后对聚类分析的结果进行对比分析,以确定最合适的距离测度方法。5.5试述K均值法与系统聚类法的异同。答:相同:K—均值法和系统聚类法一样,都是以距离的远近亲疏为标准进行聚类的。不同:系统聚类对不同的类数产生一系列的聚类结果,而K—均值法只能产生指定类数的聚类结果。具体类数的确定,离不开实践经验的积累;有时也可以借助系统聚类法以一部分样品为对象进行聚类,其结果作为K—均值法确定类数的参考。5.6试述K均值法与系统聚类有何区别?试述有序聚类法的基本思想。答:K均值法的基本思想是将每一个样品分配给最近中心(均值)的类中。系统聚类对不同的类数产生一系列的聚类结果,而K—均值法只能产生指定类数的聚类结果。具体类数的确定,有时也可以借助系统聚类法以一部分样品为对象进行聚类,其结果作为K均值法确定类数的参考。有序聚类就是解决样品的次序不能变动时的聚类分析问题。如果用)()2()1(,,,nXXX表示n个有序的样品,则每一类必须是这样的形式,即)()1()(,,,jiiXXX,其中,1ni且nj,简记为},,1,{jiiGi。在同一类中的样品是次序相邻的。一般的步骤是(1)计算直径{D(i,j)}。(2)计算最小分类损失函数{L[p(l,k)]}。(3)确定分类个数k。(4)最优分类。5.7检测某类产品的重量,抽了六个样品,每个样品只测了一个指标,分别为1,2,3,6,9,11.试用最短距离法,重心法进行聚类分析。(1)用最短距离法进行聚类分析。采用绝对值距离,计算样品间距离阵0.'.102105430876301098520由上表易知中最小元素是于是将,,聚为一类,记为计算距离阵0306308520中最小元素是=2于是将,聚为一类,记为计算样本距离阵030630中最小元素是于是将,聚为一类,记为因此,.'.(2)用重心法进行聚类分析计算样品间平方距离阵0104102516906449369010081642540易知中最小元素是于是将,,聚为一类,记为计算距离阵01604990812540注:计算方法,其他以此类推。中最小元素是=4于是将,聚为一类,记为计算样本距离阵.'.016064160中最小元素是于是将,聚为一类,记为因此,第六章6.1试述主成分分析的基本思想。答:我们处理的问题多是多指标变量问题,由于多个变量之间往往存在着一定程度的相关性,人们希望能通过线性组合的方式从这些指标中尽可能快的提取信息。当第一个组合不能提取更多信息时,再考虑第二个线性组合。继续这个过程,直到提取的信息与原指标差不多时为止。这就是主成分分析的基本思想。6.2主成分分析的作用体现在何处?答:一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。以各个主成分为分量,就得到一个更低维的随机向量;主成分分析的作用就是在降低数据“维数”的同时又保留了原数据的大部分信息。6.3简述主成分分析中累积贡献率的具体含义。答:主成分分析把p个原始变量12,,,pXXX的总方差()trΣ分解成了p个相互独立的变量12,,,pYYY的方差之和1pkk。主成分分析的目的是减少变量的个数,所以一般不会使用所有p个主成分的,忽略一些带有较小方差的主成分将不会给总方差带来太大的影响。这里我们称1pkkkk为第k个主成分kY的贡献率。第一主成分的贡献率最大,这表明11YTX综合原始变量12,,,pXXX的能力最强,而23,,,pYYY的综合能力依次递减。若只取()mp个主成分,则称11pmmkkkk为主成分1,,mYY的累计贡献率,累计贡献率表明1,,mYY综合12,,,pXXX的能力。通常取m,使得累计贡献率达到一个较高的百分数(如85%以上)。6.4在主成分分析中“原变量方差之和等于新的变量的方差之和”是否正确?说明理由。答:这个说法是正确的。.'.,即原变量方差之和等于新的变量的方差之和6.5试述根据协差阵进行主成分分析和根据相关阵进行主成分分析的区别。答:从相关阵求得的主成分与协差阵求得的主成分一般情况是不相同的。从协方差矩阵出发的,其结果受变量单位的影响。主成分倾向于多归纳方差大的变量的信息,对于方差小的变量就可能体现得不够,也存在“大数吃小数”的问题。实际表明,这种差异有时很大。我们认为,如果各指标之间的数量级相差悬殊,特别是各指标有不同的物理量纲的话,较为合理的做法是使用R代替∑。对于研究经济问题所涉及的变量单位大都不统一,采用R代替∑后,可以看作是用标准化的数据做分析,这样使得主成分有现实经济意义,不仅便于剖析实际问题,又可以避免突出数值大的变量。6.6已知X=()’的协差阵为试进行主成分分析。解:=0计算得,当时,同理,计算得,时,易知相互正交单位化向量得,,.'.综上所述,第一主成分为第二主成分为第三主成分为6.7设X=()’的协方差阵(p为,0<p<1证明:为最大特征根,其对应的主成分为。证明:==,,为最大特征根当时,=.'.,,所以,第七章7.1试述因子分析与主成分分析的联系与区别。答:因子分析与主成分分析的联系是:①两种分析方法都是一种降维、简化数据的技术。②两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。因子分析也可以说成是主成分分析的逆问题。如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。因子分析与主成分分析的主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向,归纳重要信息。而因子分析是从显在变量去提炼潜在因子的过程。此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。7.2因子分析主要可应用于哪些方面?答:因子分析是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法。目前因子分析在心理学、社会学、经济学等学科中都有重要的应用。具体来说,①因子分析可以用于分类。如用考试分数将学生的学习状况予以分类;用空气中各种成分的比例对空气的优劣予以分类等等②因子分析可以用于探索潜在因素。即是探索未能观察的或不能观测的的潜在因素是什么,起的作用如何等。对我们进一步研究与探讨指示方向。在社会调查分析中十分常用。③因子分析的另一个作用是用于时空分解。如研究几个不同地点的不同日期的气象状况,就用因子分析将时间因素引起的变化和空间因素引起的变化分离开来从而判断各自的影响和变化规律。7.3简述因子模型中载荷矩阵A的统计意义。答:对于因子模型1122iiiijjimmiXaFaFaFaF1,2,,ip因子载荷阵为11121212221212(,,,)mmmpppmaaaaaaAAAaaaAiX与jF的协方差为:1Cov(,)Cov(,)mijikkijkXFaFF=1Cov(,)Cov(,)mikkjijkaFFF=ija.'.若对iX作标准化处理,=ija,因此ija一方面表示iX对jF的依赖程度;另一方面也反映了变量iX对公共因子jF的相对重要性。变量共同度2211,2,,miijjhaip2221122()()()()()iiiimmiDXaDFaDFaDFD22iih说明变量iX的方差由两部分组成:第一部分为共同度2ih,它描述了全部公共因子对变量iX的总方差所作的贡献,反映了公共因子对变量iX的影响程度。第二部分为特殊因子i对变量iX的方差的贡献,通常称为个性方差。而公共因子jF对X的贡献2211,2,,pjijigajm表示同一公共因子jF对各变量所提供的方差贡献之总和,它是衡量每一个公共因子相对重要性的一个尺度。7.4在进行因子分析时,为什么要进行因子旋转?最大方差因子旋转的基本思路是什么?答:因子分析的目标之一就是要对所提取的抽象因子的实际含义进行合理解释。但有时直接根据特征根、特征向量求得的因子载荷阵难以看出公共因子的含义。这种因子模型反而是不利于突出主要矛盾和矛盾的主要方面的,也很难对因子的实际背景进行合理的解释。这时需要通过因子旋转的方法,使每个变量仅在一个公共因子上有较大的载荷,而在其余的公共因子上的载荷比较小。最大方差旋转法是一种正交旋转的方法,其基本思路为:①A其中令***(),/ijpmijijiadahAAΓ211pjijiddp*A的第j列元素平方的相对方差可定义为2211()pjijjiVddp②12mVVVV最大方差旋转法就是选择正交矩阵Γ,使得矩阵*A所有m个列元素平方的相对方差之和达到最大。7.5试分析因子分析模型与线性回归模型的区别与联系。答:因子分析模型是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法的模型。而线性回归模型回归分析的目的是设法找出变量间的依存(数量)关系,用函数关系式表达出来。因子分析模型中每一个变量都可以表示成公共因子的线性函数与特殊因子之和。即1122iiiimmiXaFaFaF,(1,2,,ip)该模型可用矩阵表示为:XAFε而回归分析模型中多元线性回归方程模型为:其中是常数项,.'.是偏回归系数,是残差。因子模型满足:(1)mp;(2)(,)0CovFε,即公共因子与特殊因子是不相关的;(3)101()01FmDDFI,即各个公共因子不相关且方差为1;(4)212220()0pDDε,即各个特殊因子不相关,方差不要求相等。而回归分析模型满足(1)正态性:随机误差(即残差)e服从均值为0,方差为2的正态分布;(2)等方差:对于所有的自变量x,残差e的条件方差为2,且为常数;(3)独立性:在给定自变量x的条件下,残差e的条件期望值为0(本假设又称零均值假设);(4)无自相关性:各随机误差项e互不相关。两种模型的联系在于都是线性的。因子分析的过程就是一种线性变换。7.6设某客观现象可用X=()’来描述,在因子分析时,从约相关阵出发计算出特征值为由于,所以找前两个特征值所对应的公共因子即可,又知对应的正则化特征向量分别为(0.707,-0.316,0.632)’及(0,0.899,0.4470)’,要求:(1)计算因子载荷矩阵A,并建立因子模型。(2)计算共同度。(3)计算第一公因子对X的“贡献”。解:(1)根据题意,A==建立因子模型为,,(2),,(3)因为是从约相关阵计算的特征值,所以公共因子对X的“贡献”为。第八章相应分析8.1什么是相应分析?它与因子分析有何关系?答:相应分析也叫对应分析,通常意义下,是指两个定性变量的多种水平进行相应性研究。其特点是它所研究的变量可以是定性的。.'.相应分析与因子分析的关系是:在进行相应分析过程中,计算出过渡矩阵后,要分别对变量和样本进行因子分析。因此,因子分析是相应分析的基础。具体而言,式表明Zuj为相对于特征值的关于因素A各水平构成的协差阵的特征向量。从而建立了相应分析中R型因子分析和Q型因子分析的关系。8.2试述相应分析的基本思想。答:相应分析,是指对两个定性变量的多种水平进行分析。设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为()ijrckK。要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因素A和因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A、B的联系。8.3试述相应分析的基本步骤。答:(1)建立列联表设受制于某个载体总体的两个因素为A和B,其中因素A包含r个水平,因素B包含c个水平。对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为()ijrckK。(2)将原始的列联资料K=(kij)rc变换成矩阵Z=(zij)rc,使得zij对因素A和列因素B具有对等性。通过变换。得cΣZZ,rΣZZ。(3)对因素B进行因子分析。计算出cΣZZ的特征向量及其相应的特征向量计算出因素B的因子)(4)对因素A进行因子分析。计算出rΣZZ的特征向量及其相应的特征向量计算出因素A的因子(5)选取因素B的第一、第二公因子选取因素A的第一、第二公因子将B因素的c个水平,,A因素的r个水平同时反应到相同坐标轴的因子平面上上(6)根据因素A和因素B各个水平在平面图上的分布,描述两因素及各个水平之间的相关关系。.'.8.4在进行相应分析时,应注意哪些问题?答:要注意通过独立性检验判定是否有必要进行相应分析。因此在进行相应分析前应做独立性检验。独立性检验中,0H:因素A和因素B是独立的;1H:因素A和因素B不独立由上面的假设所构造的统计量为2211?[()]?()rcijijijijkEkEk211()rcijijkz其中....(/)/ijijijijzkkkkkk,拒绝区域为221[(1)(1)]rc应该注意几个问题。第一,这里的ijz是原始列联资料()ijrckK通过相应变换以后得到的资料阵()ijrczZ的元素。说明ijz与2统计量有着内在的联系。第二,关于因素B和因素A各水平构成的协差阵cΣ和rΣ,2()()/crtrtrkΣΣ,这里(.)tr表示矩阵的迹。第三,独立性检验只能判断因素A和因素B是否独立。如果因素A和因素B独立,则没有必要进行相应分析;如果因素A和因素B不独立,可以进一步通过相应分析考察两因素各个水平之间的相关关系。
本文档为【应用多元统计分析课后答案(3)】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: ¥15.0 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
is_916680
暂无简介~
格式:pdf
大小:706KB
软件:PDF阅读器
页数:0
分类:
上传时间:2020-09-18
浏览量:110