首页 应用数理统计—时序立体数据的主成分分析

应用数理统计—时序立体数据的主成分分析

举报
开通vip

应用数理统计—时序立体数据的主成分分析浅谈时序立体数据的主成分分析前面介绍的主成分分析方法,成功地实现了截面数据的最佳综合和简化。然而,在现实生活中,随着时间的发展于数据的积累,人们开始拥有大量按时间顺序排列的平面数据表序列,这样一组按时间顺序排放的数据表序列就像一个数据匣,被称为时序立体数据表。本章将介绍如何对这种多维动态数据系统进行立体式的综合简化,并在此基础上,迅速提取立体数据表中的重要信息,充分发掘其中的丰富内涵,从而简化扼要地把握系统的动态规律。第一节全局分析的概念时序立体数据表时一个按时间顺序排放的数据表序列。如果对每一张数据表分别进行主成...

应用数理统计—时序立体数据的主成分分析
浅谈时序立体数据的主成分分析前面介绍的主成分分析方法,成功地实现了截面数据的最佳综合和简化。然而,在现实生活中,随着时间的发展于数据的积累,人们开始拥有大量按时间顺序排列的平面数据表序列,这样一组按时间顺序排放的数据表序列就像一个数据匣,被称为时序立体数据表。本章将介绍如何对这种多维动态数据系统进行立体式的综合简化,并在此基础上,迅速提取立体数据表中的重要信息,充分发掘其中的丰富内涵,从而简化扼要地把握系统的动态规律。第一节全局分析的概念时序立体数据表时一个按时间顺序排放的数据表序列。如果对每一张数据表分别进行主成分分析,则不同的数据表有完全不同的简化空间,就无法保证系统分析的统一性、整体性和可比性。因此,对这种数据表进行主成分分析,得到一个统一的简化子空间。一、 全局概念假设有个样本,个指标,时间的跨度为。时序立体数据表,若以为变量的指标,在时刻数据表中对上列数据的分析称为全局分析。二、 全局变量全局群点在j指标上的取值分布被称为全局变量,表示为三、全局重心全局数据表的重心为权数应该根据不同时刻的重要性来决定,也可以等权,等权时,均值为:时刻t的数据表重心为四、全局方差全局变量的方差:五、全局协方差全局变量的协方差为:全局协方差矩阵:第二节全局主成分分析一、全局主成分分析的步骤为(1)  求全局相关系数矩阵(2)求的特征根不妨假设和对应的特征向量:第三节对经典主成分分析的继承性一、全局主成分一定对应于数据变易最大的方向二、全局主成分是对原始变量系统的最佳综合在全局主成分分析中,还可以证明,若全局数据表种有p个变量,如果想以一个综合变量来取代原来所有的全局变量,则第一个主成分F1就是最好的选择。这个结论可以推广到m维空间:三、全局分析与单张数据表分析的联系设j(j=1,2,…,m)是全局特征值(j=1,2,…,m)是第t时刻的数据表所计算的特征值上式反映了全局第h个主成分与单张数据表个主成分之间的数量关系。特别当h=1时:因此,如果各年数据表的重心在第一主成分上的投影不发生改变,则说明,第一主成分与单张数据表的主成分之间最相关。第四节精度分析一、 全局精度以数据变异的大小来恒量数据中的信息量如果变量已经被标准化,则精度为:二、数据表Xt的表现精度数据表Xt的表现精度是指群点在全局主成分上的近似精度。令是第t张表中的第i个样本在全局第h个主成分的得分。第五节数据主要特征的动态分析为了迅速把握多维动态数据群种的主要信息,还应该对数据系统的主要特征进行动态分析研究。数据群点有如下特征:(1)的总体水平(2)的主轴(3)的主轴上的分布偏差(4)中各样本点间的相对位置和排列顺序。一、总体水平第t年数据群点的总体水平为。可以从三个方面研究其动态数据信息。(1)的时序轨迹(2)对于1一p个变量指标,研究哪一个指标在1一T年间发生的变化最大。首先,j指标在1一T年间的变化可以用aj表示,有所有指标在1—T年的变化为a表示,有使cj最大的指标xj,在1—T年发生的变化最大,在经济系统分析中,过大过小的cj都应是分析人员关注的对象。(3)从1—T年,研究在哪一年发生了较大的变化。这是比值,比cj更加深入的分析。则说明j指标在t~t+1年间的变化比其它年间更大。二、主轴对第t年的数据表xt做平面主成分分析,可以得到一组主轴,对应的有特征值,分析是如何随时间变化的,可以了解数据的主要特征发展变化的历史过程。从前面的分析可以知道,是第t年数据变异最大的方向,数据在这个方向被拉得最长。如果研究国民生活水平的话,则在这一方向人们生活水平的差距最大,所以,是最能反映国民生活水平的主要特征。与对应的是主成分。数据的主要特征随时间的发展会发生变化,这个变化可以通过的变化过程来观察。特别对于第一、第二主轴(即h=1,2),以及后续含数据信息量较大的那些主轴,更应给予重点研究。三、方差的变化在数据表由x1,x2,…,xT的变化过程中,除了需要研究数据的主要特征随时间的变化以外,还要分析数据在主轴上的分布方差是否发生了较大的变化。分别从以下三个指标来观察数据在主轴散布范围发生的变化。(1)在h轴上,数据的分散程度的差分(2)比较在t+1年,哪个主轴的散布范围较大(3)比较1~T年间,哪个主轴的分散范围较大四、样本点间相对位置和排列顺序的变化随着时间的发展,群点在某一方向上的相对位置和排列顺序也会发生变化。例如,改革开放以来,我国沿海城市经济发展速度较其他地区的城市要快,特别在对外贸易方面,其发展更为显著。如果第一主轴反映了城市经济的综合实力,则在这个轴上可以看出,在不同的年份上,各城市由于发展速度不一,因此,相对位置和顺序都有变化,沿海城市的经济实力显然日趋向前。如何反映样本点间位置和顺序的变化呢?有一个要点必须注意,这就是必须在同一的轴上比较样本点的位置和顺序,因此,取全局主成分分析的第h主轴,它对所有时刻的数据表都是同一的。在其上的投影为1、在上的投影坐标是否有明显移动2、样本点排列顺序的改变下例是我国1998年和1999年城镇居民分地区的消费支出资料:X1:食品支出X2:衣着支出X3:家庭设备用品及服务支出X4:医疗保健支出X5:交通和通讯支出X6:娱乐教育文化支出X7:居住支出X8:杂项商品支出进行主成分分析,并比较全局主成分分析和单张数据表主成分分析的结果。EigenvaluesoftheCorrelationMatrix(全局主成分特征根)EigenvalueDifferenceProportionCumulativeA16.991256.443290.8739060.87391A20.547960.395310.0684950.94240A30.152660.030190.0190820.96148A40.122470.039720.0153090.97679A50.082750.020420.0103440.98714A60.062330.021900.0077920.99493A70.040440.040300.0050550.99998A80.00014.0.0000181.00000全局主成分特征向量A1A2A3A4A5A6A7A8X10.374493-.1722570.0301430.1362130.0768490.0623450.005073-.894875X20.346007-.4454110.0249560.5328520.4380700.136731-.2416230.358262X30.3119840.7107280.4116740.1643450.360232-.0555440.2538820.061138X40.362343-.1944250.2938680.105955-.6236040.3106540.4619670.185796X50.360705-.0969810.484438-.536079-.081534-.154719-.5485230.083447X60.3457510.425463-.516114-.016448-.2035760.488600-.3864440.057272X70.3647430.060889-.3321680.215494-.291244-.7840800.0021870.082907X80.358775-.186733-.362278-.5702540.3881050.0194250.4620620.124385EigenvaluesoftheCorrelationMatrix98年数据表的主成分分析EigenvalueDifferenceProportionCumulativeB17.105926.589490.8882400.88824B20.516430.391980.0645530.95279B30.124440.024300.0155550.96835B40.100140.023200.0125170.98087B50.076940.020310.0096170.99048B60.056620.037210.0070780.99756B70.019420.019320.0024270.99999B80.00010.0.0000121.00000Eigenvectors98年数据表的主成分分析B1B2B3B4B5B6B7B8X10.372150-.159966-.071551-.0574580.1023940.118105-.006808-.896111X20.349028-.418593-.335008-.1526090.5170270.3107460.2795720.354117X30.3127890.7295050.271016-.0344110.4964770.150524-.1511450.057958X40.365701-.1204550.051476-.389966-.4167590.320595-.6189330.193606X50.361312-.0923210.626102-.266618-.242140-.1698330.5514190.079394X60.3471550.403651-.4799120.280454-.4875650.1951880.3580380.059746X70.3643650.038843-.325100-.1549220.069968-.833079-.1753680.079806X80.352541-.2820220.2802520.8039970.027822-.055566-.2299180.120426EigenvaluesoftheCorrelationMatrix(99年数据表的主成分分析)EigenvalueDifferenceProportionCumulativeC16.943786.340700.8679730.86797C20.603080.443010.0753850.94336C30.160080.042350.0200100.96337C40.117730.029250.0147160.97808C50.088480.035560.0110610.98914C60.052920.019150.0066150.99576C70.033770.033610.0042210.99998C80.00015.0.0000191.00000Eigenvectors99年数据表的主成分分析C1C2C3C4C5C6C7C8X10.375326-.176598-.0252980.1422440.0430480.0535250.055225-.894037X20.342405-.456571-.1426110.6341270.2991710.174451-.0337740.361620X30.3110940.6877270.3324640.4100550.013385-.1198600.3641410.066550X40.360191-.2630510.143639-.224628-.6387150.3435340.4147700.178802X50.359409-.0984160.703325-.2378330.141298-.042767-.5301380.084078X60.3451830.435106-.413152-.2545140.1673650.591044-.2747880.056631X70.3657880.080977-.3883920.085724-.476896-.561740-.3896370.081534X80.365029-.112389-.177901-.4799530.474450-.4093970.4275570.128860 F1F2F398关于全局主成分的解释方差7.1054125487.105920.50922610.516430.1099522540.1244498关于全局主成分的贡献率0.8790453750.888240.06299890.0645330.0136027320.0243099关于全局主成分的解释方差6.943333796.943780.59732430.603080.1531859080.1600899关于全局主成分的贡献率0.8527125830.8679730.0733575530.0753850.01881280.020010红字为分年度数据表作主成分分析的方差和贡献率
本文档为【应用数理统计—时序立体数据的主成分分析】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
都绘匠人
国家注册城乡规划师,资深工程师,具备城乡规划领域多年从业经历
格式:ppt
大小:543KB
软件:PowerPoint
页数:39
分类:理学
上传时间:2022-04-20
浏览量:0