首页 主成分分析法(PCA)

主成分分析法(PCA)

举报
开通vip

主成分分析法(PCA)null维度规约维度规约 主成分分析(PCA)null在模式识别中,一个常见的问题就是特征选择或特征提取,在理论上我们要选择与原始数据空间具有相同的维数。然而,我们希望设计一种变换使得数据集由维数较少的“有效”特征来表示。主成分分析主成分分析主成分分析(或称主分量分析,principal component analysis)由皮尔逊(Pearson,1901)首先引入,后来被霍特林(Hotelling,1933)发展了。 在PCA中,我们感兴趣的是找到一个从原d维输入空间到新的k维空间的具有最小信息损失的映射 X...

主成分分析法(PCA)
null维度规约维度规约 主成分分析(PCA)null在模式识别中,一个常见的问题就是特征选择或特征提取,在理论上我们要选择与原始数据空间具有相同的维数。然而,我们希望 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 一种变换使得数据集由维数较少的“有效”特征来表示。主成分分析主成分分析主成分分析(或称主分量分析,principal component analysis)由皮尔逊(Pearson,1901)首先引入,后来被霍特林(Hotelling,1933)发展了。 在PCA中,我们感兴趣的是找到一个从原d维输入空间到新的k维空间的具有最小信息损失的映射 X在方向w上的投影为 主成分分析(PCA) 主成分分析(PCA)一、主成分的定义及导出 二、主成分的性质 三、从相关阵出发求主成分一、主成分的定义及导出一、主成分的定义及导出设 为一个 维随机向量, 主成分是这样的 ,样本投影到 上之后被广泛散布,使得样本之间的差别变得最明显,即最大化方差。 设 希望在约束条件 下寻求向量 ,使 最大化 null写成拉格朗日问题 现在关于 求导并令其等于0,得到 如果 是 的特征向量, 是对应的特征值,则上式是成立的 null同时我们还得到 为了使方差最大,选择具有最大特征值的特征向量 ,因此,第一个主成分 是输入样本的协方差阵的具有最大特征值对应的特征向量 null第二个主成分 也应该最大化方差,具有单位长度,并且与 正交 对于第二个主成分,我们有 关于w2求导并令其为0,我们有 null上式两边乘以 其中 可知 ,并且可得null这表明w2应该是 的特征向量,具有第二大特征值 类似的,我们可以证明其它维被具有递减的特征值的特征向量给出null我们来看另一种推导: 如果我们建立一个矩阵C,其第i列是 的规范化的特征向量,则 ,并且 null其中, 是对象矩阵,其对角线元素是特征值 ,这称为 的谱分解 由于C是正交的,并且 ,我们在 的左右两边乘以 和 ,得到 我们知道如果 ,则 ,我们希望它等于一个对角矩阵,于是,可以令 null在实践中,即使所有的特征值都大于0,我们知道,某些特征值对方差的影响很小,并且可以丢失,因此,我们考虑例如贡献90%以上方差的前k个主要成分,当 降序排列时,由前k个主要成分贡献的方差比例为 null实践中,如果维是高度相关的,则只有很少一部分特征向量具有较大的特征值,k远比n小,并且可能得到很大的维度归约null总方差中属于主成分 的比例为 称为主成分 的贡献率。 第一主成分 的贡献率最大,表明它解释原始变量 的能力最强,而 的解释能力依次递减。 主成分分析的目的就是为了减少变量的个数,因而一般是不会使用所有 主成分的,忽略一些带有较小方差的主成分将不会给总方差带来大的影响。 null前 个主成分的贡献率之和 称为主成分 的累计贡献率,它表明 解释 的能力。 通常取较小的 k ,使得累计贡献达到一个较高的百分比(如80%~90%)。此时, 可用来代替 ,从而达到降维的目的,而信息的损失却不多。 主成分分析的应用主成分分析的应用在主成分分析中,我们首先应保证所提取的前几个主成分的累计贡献率达到一个较高的水平,其次对这些被提取的主成分必须都能够给出符合实际背景和意义的解释。 主成分的解释其含义一般多少带有点模糊性,不像原始变量的含义那么清楚、确切,这是变量降维过程中不得不付出的代价。null如果原始变量之间具有较高的相关性,则前面少数几个主成分的累计贡献率通常就能达到一个较高水平,也就是说,此时的累计贡献率通常较易得到满足。 主成分分析的困难之处主要在于要能够给出主成分的较好解释,所提取的主成分中如有一个主成分解释不了,整个主成分分析也就失败了。支持向量机(补充讲义)支持向量机(补充讲义)上节课,我们讨论了SVM的分类,这里简略地讨论如何将SVM推广到回归上 我们还是使用线性模型: null对于回归,我们使用差的平方作为误差: 对于支持向量机的回归,我们使用 null这意味着我们容忍高达 的误差,并且超出的误差具有线性而不是平方影响。这种误差函数更能抵制噪声,因而更加鲁棒 类似的,我们引入松弛变量来处理超过 的偏差 其中C是一个训练误差和惩罚项 之间的权衡null受限于null和我们做分类的 方法 快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载 一样,建立拉格朗日函数,然后取它的对偶问题(这里也可以使用核函数),与分类一样,我们也会得到一些支持向量,而回归线将用它们表示.
本文档为【主成分分析法(PCA)】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_581511
暂无简介~
格式:ppt
大小:362KB
软件:PowerPoint
页数:0
分类:互联网
上传时间:2013-12-29
浏览量:212