模式识别作业
报告
软件系统测试报告下载sgs报告如何下载关于路面塌陷情况报告535n,sgs报告怎么下载竣工报告下载
模式识别作业报告
组员:
2008302299 张翔 2008302300 赵建涛 2008302293 邵德立 2008302285 冯震坤
利用K-L变换进行特征提取 一、 实验目的
1. 熟悉K-L变换的方法,利用K-L变换提取特征,并用主成分进行分类;
2. 掌握类平均向量提取判别信息的方法,并学会如何用它进行分类;
3. 比较各种分类方法独特的优势以及相互之间的联系。 二、 实验要求
1. 用FAMALE.TXT和MALE.TXT的数据作为本次实验使用的样本集,利用
K-L变换对该样本集进行变换,与过去用Fisher线性判别方法或其它
方法得到的分类面进行比较,从而加深对所学内容的理解和感性认
识。
2. 利用类平均向量提取判别信息,考察投影后的样本分布,并用该投影
对样本进行分类。
3. 将上述投影和分布与以前各种分类情况进行比较,考察他们各自的特
点和相互关系。
三、 实验原理
K-L变换即主成分
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
PCA法,是一种以统计特性为基础,将高维数据降维却能留住主要能量的一种方法。它具有以下特点:
(1)由于K-L变换是正交线性变换,所以变换前后的方差总和不变,变换只是把原来的方差不等量的再分配到新的主成分图像中。
(2)第一主成分包含了总方差的绝大部分(一般在80%以上),其余各主成分的方差依次减小。
(3)可以证明,变换后各主成分之间的相关系数为零,也就是说各主成分间的内容是不同的,是“垂直”的。
(4)K-L变换在几何意义上相当于进行空间坐标的旋转,第一主成分取波谱空间中数据散布最大的方向;第二主成分则取与第一主成分正交且数据散布次大的方向,其余依此类推。
四、 实验框图
选取样本集
选取产生矩阵
对产生矩阵求取特征值和特征向量
最大特征值的特征向量 从类平均向量中提取判别信息
得到投影方向
训练样本 测试样本 其
他
分
类错误情况 错误情况 器
比较
判断分类器性能及差别
五、 实验步骤
1、 首先要选取产生矩阵,在这里,我们选取的产生矩阵是不分类
别的样本集的协方差矩阵。
2、 对产生矩阵求取特征值和特征向量。
3、 对特征值进行排序,因为这只是一个二维问题,所以我们可以
直接选取最大特征值对应的特征向量为投影方向,不存在计算
总的贡献率要超过99%的问题。
4、 对训练集分类别进行投影,获取投影后的值,并计算阈值。
5、 根据阈值和投影后的值的大小关系对样本集进行分类并考察
错误率,从而判断分类器总体性能。
6、 将第二步得出的特征值和特征向量带入类平均向量中提取判
别信息的公式,将最大值对应的特征向量作为投影方向,重复
4和5,考察分类器性能以及与上一个分类器的关系。 六、 实验结果与分析
1、 在不考虑类别信息的基础上,我们对整个样本集进行K-L变换
(即PCA),得到一个最佳投影方向,并用该投影方向对样本
集进行分类,考察它在分类中出现的错误。
从中我们可以看出K-L变换对样本集本身进行分类时,错误率为0.13,对小容量的测试集1进行分类时,错误率较高,超过了20%,对大容量的测试集进行分类时,错误率相对较小,仅为0.1047.而当我们单独对测试集1进行K-L变换,求取自己的投影方向时,我们发现这两种情况下得到的错误率相同,都为0.2286.而我们有考察了这两种情况下算出
的投影方向,两者并不相同。所以我们得出,这可能是因为测试集数据
不规范,样本容量太小所导致。
2、 利用类平均向量提取判别信息,选择最佳投影方向,并将样本
点向这个方向投影,从而对样本进行分类。
我们看到,从类平均向量中提取判别信息时,错误率同K-L变换的结果完全相同。因为这只是一个二维问题,我们将其降到一维,可见,在这个二维问题上,K-L变换选取的特征向量和从类平均向量中期提取的特征向量具有一致性。这也进一步说明了K-L变换的正确性。
3、 各种分类方法进行对比分析
同实验3中的Fisher识别方法相比较,我们发现对于样本集和测试集2的错误率都稳定在10%左右,而对于测试集1来说Fisher识别方法的错误率为17%,K-L变换的错误率相对较高,为22%。这可能是因为测试集1的样本数量太少,所以两种方法的错误率都较高,结果不是很稳定。而对于样本集和测试集2的实验,两者都比较稳定,这就充分说明了K-L变换的正确性。
七、 实验体会
这次实验相对来说不是很难,在我们充分掌握了K-L变换的内容之后,再做这个大作业就比较简单。刚开始我们对K-L变换的了解只限于理论知识,做完这个大作业,我觉得我们对它的理解程度就不只限于理论上的了解了,更是实践中的深入。这为我们做下一个人脸识别作业也夯实了基础。
八、 附件
部分程序代码:
load shujuku;
female=FEMALE';
male=MALE';
test1=test1';
test2=test2';
x1=mean(female,2);%1µÄ?ùÖµ
x2=mean(male,2);%2µÄ?ùÖµ
F=0;
for i=1:50
F=F+(female(:,i)-x1)*(female(:,i)-x1)';
end
F=F/50;%Ð,???î?ØÕó1
M=0;
for i=1:50
M=M+(male(:,i)-x2)*(male(:,i)-x2)';
end
M=M/50;%Ð,???î?ØÕó2
W=(F+M)/2;
if u(1,1)>u(2,2)
w=v(:,1);
else
w=v(:,2);
end
x=w'*female;
y=w'*male;
X=mean(x);
Y=mean(y);
panjue=(X+Y)/2;
error1=0;
for i=1:50
if x(i)>panjue
error1=error1+1;
else
end
if y(i)
j2 w=v(:,1);
elseif j1panjue
error2=error2+1;
else
end
if y(i)
本文档为【模式识别作业报告】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑,
图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。