null 主成分分析(PCA)
具体例子PCA的基本原理
PCA的计算
步骤
新产品开发流程的步骤课题研究的五个步骤成本核算步骤微型课题研究步骤数控铣床操作步骤
PCA应用实例 主成分分析(PCA)
具体例子秦楠一、主成分分析的基本原理 一、主成分分析的基本原理 假定有n个样本,每个样本共有p个变量,构成一个n×p阶的数据矩阵(1) null
降维处理!!!
当p较大时,在p维空间中考察问
题
快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题
比较麻烦。
降维是用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的。
null定义:记x1,x2,…,xP为原变量指标,z1,z2,…,zm(m≤p)为新变量指标(2) null系数lij的确定原则:
① zi与zj( i≠j;i,j=1,2,…,m )相互无关;
② z1是x1,x2,…,xP的一切线性组合中方差最大者,z2是与z1不相关的x1,x2,…,xP的所有线性组合中方差最大者;
……
zm是与z1,z2,……,zm-1都不相关的x1,x2,…xP, 的所有线性组合中方差最大者。
则新变量指标z1,z2,…,zm分别称为原变量指标x1,x2,…,xP的第一,第二,…,第m主成分。
null 从以上的分析可以看出,主成分分析的实质就是确定原来变量xj(j=1,2 ,…, p)在诸主成分zi(i=1,2,…,m)上的载荷 lij( i=1,2,…,m; j=1,2 ,…,p)。
从数学上可以证明,载荷lij分别是相关矩阵的m个较大的特征值所对应的特征向量。 二、计算步骤 二、计算步骤 (一)计算相关系数矩阵
rij(i,j=1,2,…,p)为原变量xi与xj的相关系数, rij=rji,其计算
公式
小学单位换算公式大全免费下载公式下载行测公式大全下载excel公式下载逻辑回归公式下载
为:
(3) (4) null (二)计算特征值与特征向量:
① 解特征方程 ,求出特征值,并使其按大小顺序排列 ; ② 分别求出对应于特征值 的特征向量
,要求 =1,即 ,其中
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
示向量 的第j个分量。null③ 计算主成分贡献率及累计贡献率
▲贡献率:▲累计贡献率:
一般取累计贡献率达85—95%的特征值
所对应的第一、第二、…、第m(m≤p)个主成分。
null(6) ④各主成分的得分三、 主成分分析方法应用实例三、 主成分分析方法应用实例表1 某农业生态经济系统各区域单元的有关数据 nullnull步骤如下:
(1)将表1中的数据作
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
差标准化处理,然后将它们代入公式(4)计算相关系数矩阵(见表2)。
表2 相关系数矩阵 null (2)由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率(见表3)。由表3可知,第一,第二,第三主成分的累计贡献率已高达86.596%(大于85%),故只需要求出第一、第二、第三主成分z1,z2,z3即可。 null表3 特征值及主成分贡献率 null (3)对于特征值=4.6610,=2.0890,=1.0430分别求出其特征向量l1,l2,l3。null表4 主成分载荷 null ①第一主成分z1与x1,x5,x6,x7,x9呈显出较强的正相关,与x3呈显出较强的负相关,而这几个变量则综合反映了生态经济结构状况,因此可以认为第一主成分z1是生态经济结构的代表。
②第二主成分z2与x2,x4,x5呈显出较强的正相关,与x1呈显出较强的负相关,其中,除了x1为人口总数外,x2,x4,x5都反映了人均占有资源量的情况,因此可以认为第二主成分z2代表了人均资源量。
分析:null显然,用三个主成分z1、z2、z3代替原来9个变量(x1,x2,…,x9),描述农业生态经济系统,可以使问题更进一步简化、明了。
③第三主成分z3,与x8呈显出的正相关程度最高,其次是x6,而与x7呈负相关,因此可以认为第三主成分在一定程度上代表了农业经济结构。
null