首页 人脸识别技术研究本科毕业论文

人脸识别技术研究本科毕业论文

举报
开通vip

人脸识别技术研究本科毕业论文人脸识别技术研究 人脸识别技术研究 本科毕业论文格式要求一、论文的结构与要求毕业设计(论文)包括以下内容(按顺序):本科论文包括封面、目录、标题、内容摘要、关键词、正文、注释、参考文献等部分。如果需要,可以在正文前加“引言”,在参考文献后加“后记”。论文一律要求打印,不得手写。1.目录目录应独立成页,包括论文中全部章、节和主要级次的标题和所在页码。2.论文标题论文标题应当简短、明确,有概括性。论文标题应能体现论文的核心内容、法学专业的特点。论文标题不得超过25个汉字,不得设置副标题,不得使用标点符号,可以分二行书...

人脸识别技术研究本科毕业论文
人脸识别技术研究 人脸识别技术研究 本科毕业论文格式要求一、论文的结构与要求毕业设计(论文)包括以下内容(按顺序):本科论文包括封面、目录、标题、内容摘要、关键词、正文、注释、参考文献等部分。如果需要,可以在正文前加“引言”,在参考文献后加“后记”。论文一律要求打印,不得手写。1.目录目录应独立成页,包括论文中全部章、节和主要级次的标题和所在页码。2.论文标题论文标题应当简短、明确,有概括性。论文标题应能体现论文的核心内容、法学专业的特点。论文标题不得超过25个汉字,不得设置副标题,不得使用标点符号,可以分二行书写。论文标题用词必须规范,不得使用缩略语或外文缩写词(通用缩写除外,比如WTO等)。3.内容摘要内容摘要应扼要叙述论文的主要内容、特点,文字精练,是一篇具有独立性和完整性的短文,包括主要成果和结论性意见。摘要中不应使用公式、图表,不标注引用文献编号,并应避免将摘要撰写成目录式的内容介绍。内容摘要一般为200个汉字左右。4.关键词关键词是供检索用的主题词条,应采用能够覆盖论文主要内容的通用专业术语(参照相应的专业术语 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 ),一般列举3——5个,按照词条的外延层次从大到小排列,并应出现在内容摘要中。5.正文正文一般包括绪论(引论)、本论和结论等部分。正文字数本科不少于6000字,专科一般不少于5000字,正文必须从页首开始。*绪论(引论) 全文 企业安全文化建设方案企业安全文化建设导则安全文明施工及保证措施创建安全文明校园实施方案创建安全文明工地监理工作情况 的开始部分,不编写章节号。一般包括对写作目的、意义的说明,对所研究问题的认识并提出问题。*本论是全文的核心部分,应结构合理,层次清晰,重点突出,文字通顺简练。*结论是对主要成果的归纳,要突出创新点,以简练的文字对所做的主要工作进行评价。结论一般不超过500个汉字。正文一级及以下子标题格式如下:一、;(一);1.;(1);①。6.注释注释是对所创造的名词术语的解释或对引文出处的说明。注释采用脚注形式,用带圈数字表示序号,如注①、注②等,数量不少于10个,脚注少于10个的论文为不合格论文。7.参考文献参考文献是论文的不可缺少的组成部分,是作者在写作过程中使用过的文章、著作名录。参考文献应以近期发表或出版的与法学专业密切相关的学术著作和学术期刊文献为主,数量不少于6篇,参考文献少于6篇的论文成绩评定为不合格。产品说明、技术标准、未公开出版或发表的研究论文等不列为参考文献,有确需说明的可以在后记中予以说明。二、打印装订要求论文必须使用标准A4打印纸打印,一律左侧装订,并至少印制3份。页面上、下边距各2.5厘米,左右边距各2.2厘米,并按论文装订顺序要求如下:1.封面封面包括《广西广播电视大学关于毕业设计(论文)评审表》(封面、附录4)、《学生毕业设计(论文)评审表》(封2)、《广西广播电视大学关于毕业设计(论文)答辩申报表》(封3、附录5)。 2.目录目录列至论文正文的三级及以上标题所在页码,内容打印要求与正文相同。目录页不设页码。3.内容摘要摘要标题按照正文一级子标题要求处理,摘要内容按照正文要求处理。4.关键词索引关键词与内容摘要同处一页,位于内容摘要之后,另起一行并以“关键词:”开头(采用黑体),后跟3~5个关键词(采用宋体),词间空1字,即两个字节,其他要求同正文。5.正文正文必须从内容提要页开始,并设置为第1页。页码在页末居中打印,其他要求同正文(如正文第5页格式为“―5―”)。论文标题为标准三号黑体字,居中,单倍行间距;论文一级子标题为标准四号黑体字,居中,20磅行间距;正文一律使用标准小四号宋体字,段落开头空两个字,行间距为固定值20磅;正文中的插图应与文字紧密配合,文图相符,内容正确,绘制规范。插图按章编号并置于插图的正下方,插图不命名,如第二章的第三个插图序号为“图2—3”,插图序号使用标准五号宋体字;正文中的插表不加左右边线。插表按章编号并置于插表的左上方,插表不命名,如第二章的第三个插表序号为“表2—3”,插表序号使用标准五号宋体字。6、 参考文献按照GB7714—87《文后参考文献著录规则》规定的格式打印,内容打印要求与论文正文相同。参考文献从页首开始,格式如下:(1)著作图书文献序号 作者 《书名》,出版地:出版者,出版年份及版次(第一版省略)如:[4] 劳凯声 《教育法论》,南京:江苏教育出版社,2001(2)译著图书文献序号 作者 《书名》,出版地:出版者,出版年份及版次(第一版省略)(3)学术刊物文献序号 作者 《文章名》,《学术刊物名》,年卷(期)如:[5]周汉华 《变法模式与中国立法法》,《中国社会科学》,2000(1)(4)学术会议文献序号 作者 《文章名》,编者名,会议名称,会议地址,年份,出版地,出版者,出版年(5)学位论文类参考文献序号 作者 《学位论文题目》,学校和学位论文级别,答辩年份(6)西文文献著录格式同中文,实词的首字母大写,其余小写。参考文献作者人数较多者只列前三名,中间用逗号分隔,多于三人的后面加“等”字(西文加“etc.”)。学术会议若出版论文集者,在会议名称后加“论文集”字样;未出版论文集者省去“出版者”、“出版年”项;会议地址与出版地相同的省略“出版地”,会议年份与出版年相同的省略“出版年”。三、毕业设计(论文)装袋要求毕业设计(论文)是专业教学的重要内容,必须规范管理,统一毕业设计(论文)材料装袋要求:1、论文稿本。经指导的提纲,一稿、二稿和装订好的正稿。2、过程记录表。包括指导教师指导记录表,学生毕业设计(论文)评审表(答辩过程记录表)等;3、相关材料。法专业要求的其他材料,如法学社会调查报告等。中国环境教育立法研究内容摘要摘要:目前,我国学术界对环境教育立法问题的研究还处于起步阶段,有关环境教育的法律规范也很不完善,影响和限制了我国环境教育的大力推行和良好普及,实质上是制约了我国解决环境问题的能力和可持续发展的进程。本文从环境问题的现状入手,阐释了环境教育立法的必要性和可行性,介绍了其他国家和地区的环境教育立法实践,在总结国内外先进经验的基础上,提出了对我国环境教育立法的构想。以期通过加强教育立法的途径,实现我国环境教育的普及,为改善解决我国环境问题的能力和可持续发展的进程创造条件。关键词:环境问题环境教育环境教育立法 一、环境问题、环境教育与环境教育立法(一)环境问题马克思说:“人靠自然界生活,这就是说,自然界是为了不致死亡而必须不断与之交往。所谓人的肉体生活和精神生活同自然界相联系,也就等于说自然界同自身相联系,因为人是自然界的一部分。” 生存与发展是人类社会最基本的主题。在人类与环境不断地相互影响和作用中,环境问题始终是伴随着人类的活动产生和发展的。不幸的是,在相当长的时期内,人类过分强调了作为自然主人的一面,夸大了人的主观能动性作用,忽视甚至忘却自然界的惩罚。环境问题并非始于今日,早在200年前的第一次工业革命时期就产生了环境问题。到了本世纪50年代,环境事件不断出现和加剧。到了70~80年代则出现了全球性的环境危机。目前全球人口正以每年9 000万的速度增长,预计到21世纪中期,世界人口将达到100亿。 人口无节制地增长,给地球的生态环境和有限的自然资源带来了沉重的压力。联合国列出了威胁人类生存的全球十大环境问题:全球气候变暖;臭氧层的损耗和破坏;酸雨蔓延;水资源危机;生物多样性减少;大气污染;有毒有害化学物质污染与危险废物越境转移;森林面积锐减;土地荒漠化;海洋污染。随着我国社会经济的迅速发展,环境保护与经济发展之间的矛盾日益凸显。20世纪最后几年有三件震撼国人的大事足以说明我国环境问题的严重性,已显示出环境破坏给人类带来的灾难性的报复。一是1997年创纪录(227天)的黄河断流;二是1998年的长江大水灾;三是2000年波及北京等地的频繁的沙尘暴。专家指出了目前困扰中国环境的十大问题。1、大气污染问题2004年我国二氧化硫排放量为1 995万吨,居世界第一位。据专家测算,要满足全国天气的环境容量要求,二氧化硫排放量要在现有基础上至少削减40%。此外,2004年中国烟尘排放量为1 165万吨,工业粉尘的排放量为1 092万吨。大气污染是中国目前面临的第一大环境问题。2、水环境污染问题中国七大水系的污染程度依次是:辽河、海河、淮河、黄河、松花江、珠江、长江,其中,42%的水质超过3类标准(不能做饮用水源),全国有36%的城市河段为劣质5类水质,丧失使用功能。大型淡水湖泊(水库)和城市湖泊水质普遍较差,75%以上的湖泊富营养化加剧,主要由氮、磷污染引起。3、垃圾处理问题中国全国工业固体废物年产生量达8.2亿吨,综合利用率约为46%。全国城市生活垃圾年产生量为1.4亿吨,达到无害化处理要求的不到10%。塑料包装物和农膜导致的白色污染已蔓延全国各地。(二)环境教育与环境问题的关系1、环境教育的发展历程环境教育的起源,一直可以追溯到19世纪末20世纪初的自然研究(Natural Study)。当时在学校开展自然研究的基本目的是教育学生通过亲身观察和参与,了解和评价自然环境。到20世纪上叶,人们认识到保护生态和自然环境的重要性,保护运动(Conservation movement)在社会中形成,学校教育在自然研究的基础上引入了自然保护的教育内容,这就是环境教育的萌芽。(1)国外环境教育的发展历程1972年在瑞典首都斯德哥尔摩召开的“世界人类环境会议”是环境教育发展的一个里程碑。为了响应斯德哥尔摩会议的第96条建议,联合国教科文组织和联合国环境规划署于1975年颁布了国际环境教育 计划 项目进度计划表范例计划下载计划下载计划下载课程教学计划下载 (IEEP),其目的是在环境教育领域内,促进经验和信息的交流、研究和实验、人员培训、课程和相应教材的开发及国际合作。1975年,在前南斯拉夫的贝尔格莱德召开的国际环境教育会议,通过了《贝尔格莱德宪章:环境教育的全球纲领》。该宪章根据环境教育的性质和目标,指出环境教育是“进一步认识和关心经济、社会、政治和生态在城乡地区的相互依赖性;为每一个人提供获得保护环境的知识和价值观、态度、责任感和技能;创造个人、群体和整个社会行为的新模式。”此后,《贝尔格莱德宪章》成为世界各国制定环境教育纲要与章程的重要依据之一。而环境教育的普及对环境相关法律的立法、执法都可起到相当大的辅助作用。大力开展环境教育,使环境意识特别是环境保护法律意识深入人心,使人们认识到环境问题不仅是社会问题,更是可以涉及到每个人切身利益和法律责任、社会责任的问题,认识到环境问题和法律责任的关系,更好地使环境保护法律成为预防环境问题发生的利剑,这样可以达到依法治理环境和人们自觉保护环境的目的。二、中国环境教育立法的必要性和可行性(一)中国环境教育立法的必要性当一种社会关系需要用立法来调整,说明这种社会关系的重要性。中国环境教育专门立法是否必要,则完全取决于以下前提:(1)环境教育的重要性;(2)环境教育立法对社会经济发展的重要作用。五、结论21世纪是环境世纪,公众的环境意识通过环境教育来建立。根据我国人口多,地区经济水平差异大,公民受教育程度不一的现状,要使公众的环境保护意识提高到一个比较高的水平,实现社会——经济——环境的协调发展,尽早达到国家的可持续发展目标,构建和谐社会,通过立法机关制定完善的、具有可操作性的《环境教育法》不失为一个有效的方法。希望对促进我国环境教育法律体系的建立提供一些有益的参考。 识和关心经济、社会、政治和生态在城乡地区的相互依赖性;为每一个人提供获得保护环境的知识和价值观、态度、责任感和技能;创造个人、群体和整个社会行为的新模式。”此后,《贝尔格莱德宪章》成为世界各国制定环境教育纲要与章程的重要依据之一。而环境教育的普及对环境相关法律的立法、执法都可起到相当大的辅助作用。大力开展环境教育,使环境意识特别是环境保护法律意识深入人心,使人们认识到环境问题不仅是社会问题,更是可以涉及到每个人切身利益和法律责任、社会责任的问题,认识到环境问题和法律责任的关系,更好地使环境保护法律成为预防环境问题发生的利剑,这样可以达到依法治理环境和人们自觉保护环境的目的。二、中国环境教育立法的必要性和可行性(一)中国环境教育立法的必要性当一种社会关系需要用立法来调整,说明这种社会关系的重要性。中国环境教育专门立法是否必要,则完全取决于以下前提:(1)环境教育的重要性;(2)环境教育立法我国环境教育法律体系的建立提供一些有益的参考。 人脸识别技术研究 摘 要 人脸识别是一个具有很高理论和应用价值的研究课题。人脸是人类视觉中最为普遍的模式,它所反映的视觉信息在人与人的交流和交往中有着及其重要的作用意义。人脸的特殊性,使得人脸识别技术成为最具潜力的身份识别方式。人脸识别技术应用广泛,并且日益受到人们的广泛关注并成为模式识别领域研究的热点。同时人脸识别又是一个复杂和困难的课题,其原因有:人脸是由复杂的三维曲面构成的可变形体,难以用数学描述;所有的人脸结构高度相似,而人脸图像又易受年龄和成像条件的影响。人脸识别涉及的技术很多,其中关键的是特征提取和分类方法,本文就以此为重点进行了相关研究。 主要工作包括以下几个方面: 1.在人脸图像特征提取方面,提出了一利”有效的基于ICA的人脸整体特征提取方法; 2.在优化ICA算法方面,提出了一种改进的FastICA算法,该算法通过减少耗时的雅可比矩阵求逆的次数,进一步加快了收敛速度; 3.建立了SVM/HMM的混合人脸模型。 关键词:人脸识别主分量分析;独立分量分析;隐马尔可夫模型;支持向量机 Abstract Face recognition has very lagre academic and praetieal values. In daily lief,people kowing each other uses at most of person’s face.Face is the most familiar model in human vision.The visual inofmration refleeted by face has important meaning and impact between people’s intercommunion and intercourse. Because of its extensive and applied realm,face recognition technique has got the extensive concern with study in near three decades and become the most potential method of identity recognition. At the same time,it is difficult to implement face recognition using computers. First,human face is a deformable object composed of complex 3D curve surfaces,Which is hard to be represented in form of mathematics. Secondly faces of different persons have the similar strueture,and the face images are greatly dependent on ages and photography conditions.This paper mainly study face extraction and class method,which concept can be summarized as ofllows. Because face image is liable to impact of varieties and face is nonrigid and similar Accurate face recognition is stilldifficult.There is still lone distance between face recognition and praetieality.The progress of computer technology,pattern recognition,human intelligent and biologic psyehology,vision mechanism surely promote face recognition develop. Keywords:face reeognition,Principle Component Analysis,Independent Component Analysis,Hidden Markov Models,Support Vector Maehines 目 录 6 第1章 引 言 6 1.1人脸识别技术的应用与难点 6 1.1.1 人脸识别技术的广泛应用 8 1.1.2人脸识别技术的难点 8 1.2人脸识别技术的发展与现状 9 1.2.1人脸识别技术发展的三个阶段 9 1.2.2国内外发展现状 10 1.3人脸识别的研究内容与主要方法 10 1.3.1人脸识别的研究内容 11 1.3.2人脸识别的视觉机理 11 1.3.3人脸识别系统的组成 12 1.3.4主要的人脸识别方法 16 1.4人脸识别测试数据库 17 1.5本文的主要内容 18 第2章 基于主分量分析的人脸识别方法 18 2.1引言 18 2.2主分量分析的理论基础 19 2.2.1多维统计数据的线性变换 20 2.2.2主分量分析方法 21 2.3基于主分量分析的人脸识别方法 21 2.3.1基于主分量分析的人脸特征提取 22 2.3.2基于主分量分析的人脸分类识别 24 2.4实验结果及分析 27 2.5本章小结 28 第3章 基于独立分量分析的人脸识别方法 28 3.1引言 28 3.2独立分量分析的理论基础 28 3.2.1独立分量分析与盲源分离 29 3.2.2独立分量分析的线性模型 30 3.3基于独立分量分析的人脸识别方法 31 3.3.1人脸图像的预处理 32 3.3.2基于独立分量分析的人脸特征提取 34 3.3.3独立分量的排序及选择 35 3.3.4基于ICA系数的人脸分类识别 35 3.4独立分量分析的算法研究 36 3.4.1 Informax算法 37 3.4.2 Fast ICA算法及其改进 39 3.5实验结果及分析 41 3.6 本章小结 44 第4章 基于隐马尔可夫模型的人脸识别方法 44 4.1 引言 44 4.2 隐马尔可夫模型的理论基础 44 4.2.1马尔可夫链 46 4.2.2隐马尔可夫模型 47 4.2.3 隐马尔可夫模型中的三大问题 48 4.2.4隐马尔可夫模型的类型 48 4.3 基于隐马尔可夫模型的人脸识别方法概述 48 4.3.1 基于HMM人脸识别的基本原理 49 4.3.2 基于HMM人脸识别的系统概述 49 4.4基于一维隐马尔可夫模型的人脸识别方法 50 4.4.1特征提取 50 4.4.2模型训练 52 4.4.3分类识别 52 4.5 基于伪二维隐马尔可夫模型的人脸识别方法 53 4.6 基于I以特征和SMV/1翎以的人脸识别方法 54 4.7 实验结果及分析 56 4.8 本章小结 57 第5章 结束语 57 5.1人脸识别方法评估 57 5.1.1 人脸识别方法评估的性能指标 58 5.1.2 本文中人脸识别方法的评估结果 59 5.2 本文工作的总结及进一步研究方向的展望 59 5.2.1 本文的主要工作 60 5.2.2进一步研究方向的展望 62 参考文献 第1章 引 言 1.1人脸识别技术的应用与难点 人脸是自然界存在的一种特殊的、复杂的视觉模式,它包含着极其丰富的信息。首先,人脸具有一定的不变性和唯一性,人脸识别是人类在进行身份确认时使用的最为普遍的一种方式,其次,人脸图像还能提供一个人的性别、年龄、种族等有关信息。人类在人脸识别中所表现出来的能力是令人惊异的,但是让计算机能够识别人脸,却是非常困难的问题。迄今为止,人脸识别的认知过程和内在机理仍然是一个未解之谜,如何实现一个自动的人脸识别系统仍然是一个悬而未决的难题。 从上个世纪六十年代以来,随着计算机和电子技术的迅猛发展,人们开始利用计算机视觉和模式识别等技术对人脸识别进行研究。近年来,随着相关技术的不断发展和实际需求的日益增加,人脸识别已经引起了越来越多的关注,成为了信息处理和人工智能等领域研究的热点之一,新的研究成果和实用系统也不断涌现。 1.1.1 人脸识别技术的广泛应用 一项技术的问世和发展与人类的迫切需求是密切相关的,飞速发展的社会经济和科学技术使得人类对安全(包括人身安全、隐私保护等)的认识越来越重视。人脸识别的一个重要应用就是人类的身份识别。一般来说,人类的身份识别方式分为三类: a.特殊物品,包括各种证件和凭证,如身份证、驾驶执照、房门钥匙、印章等; b.特殊知识,包括各种密码、口令和暗号等; c.人类生物特征,包括各种人类的生理和行为特征,如人脸、指纹、手形、掌纹、虹膜、DNA、签名、语音等。 前两类识别方式属于传统的身份识别技术,其特点是方便、快捷,但致命的缺点是安全性差、易伪造、易窃取。特殊物品可能被丢失、偷盗和复制,特殊知识容易被遗忘、混淆和泄露。相比较而言,由于生物特征是人的内在属性,具有很强的自身稳定性和个体差异性,因此生物特征是身份识别的最理想依据。基于以上相对独特的生物特征,结合计算机技术,发展了众多的基于人类生物特征的身份识别技术,如NDA识别技术、指纹识别技术、虹膜识别技术、语音识别技术和人脸识别技术等。表1-1为各种生物识别技术的综合比较。 表1-1 各种生物特征识别技术的综合比较 生物识别技术在上个世纪己经有了一定的发展,其中指纹识别技术己经趋近成熟,但人脸识别技术的研究目前还处于起步阶段。指纹、虹膜、掌纹等识别技术都需要被识别者的配合,有的识别技术还需要添置复杂昂贵的设备。人脸识别则可以用已有的照片或是摄像头远距离捕捉图像,无须特殊的采集设备,系统的成本低。并且自动人脸识别可以在当事人毫无察觉的情况下即完成身份确认识别工作,这对反恐怖活动等有非常重大的意义。由于人脸识别技术具有如此之多的优势,因此它的应用前景非常广阔,已成为最具潜力的生物特征识别技术之一。本文将人脸识别技术的各种应用及其特点总结在表1-2中。 表1-2 人脸识别技术的应用 人脸识别最初的应用源于公安部门关于罪犯照片的存档管理和刑侦破案。现在该技术在安全系统、商业领域和日常生活中都有很多应用,主要有以下几类应用: 1.刑侦破案。当公安部门获得罪犯的照片后,可以利用人脸识别技术,在存储罪 犯照片的数据库中找出最相像的人作为嫌疑犯,极大的节省了破案的时间和人力物力。还有一种应用就是根据目击证人的描述,先由专业人员画出草图,然后用此图到库里去找嫌疑犯。罪犯数据库往往很大,由几千幅图像组成。如果这项搜索工作由人工完成,不仅效率低,而且容易出错,因为人在看了上百幅人脸图像后,记忆力会下降,而由计算机来完成则不会出现此问题。 2.证件验证。身份证、驾驶执照以及其他很多证件上都有照片;现在这些证件多由人工验证完成。如果应用人脸识别技术,这项工作就可以交给机计算机完成,从而实现自动化及智能管理。当前普遍使用的另一类证件是用符号或者条形码标记的,比如信用卡。这类卡的安全性比较低,可能遗失、被窃取,使用场合(比如自动提款机)的安全性也比较差。如果在这类卡上加上人脸的特征信息,则会大大改善其安全性能。 3.入口控制。需要入口控制的范围很广,它可以是重要人物居住的住所、保存重要信息的单位,只要人类觉得安全性比较重要的地点都可以进行入口控制,比较常用的检查手段是核查证件。人员出入频繁时,保安人员再三检查证件是很麻烦的,而且证件安全性也不高。在一些保密要求非常严格的部门,除了证件外,已经使用了生物特征识别手段,如指纹识别、掌纹识别、虹膜识别和语音识别等。人脸识别与这些技术相比,具有直接、方便和友好的特点。当前计算机系统的安全管理也备受重视,通常使用由字符和数字组成的口令(Password)进行使用者的身份验证,但口令可能被遗忘,或被破解,如果将人脸作为口令,则既方便又安全。 4.视频监控。在银行、公司、公共场所等处设有24小时的视频监控,如何对视频图像进行筛选分析,就需要用到人脸检测、跟踪和识别技术。 除了以上应用外,人脸识别技术还可以用于视频会议、机器人的智能化研究等方面。尤其从美国9.11事件后,人的身份识别问题更是提升到了国家安全的角度,如何利用人脸信息迅速确定一个人的身份成了各个国家重点研究的技术。 1.1.2人脸识别技术的难点 虽然人类可以毫不困难地根据人脸来辨别一个人,但是利用计算机进行完全自动的人脸识别,仍存在许多困难。人脸模式的差异性使得人脸识别成为一个非常困难的问题,表现在以下方面: 1.人脸表情复杂,人脸具有多样的变化能力,人的脸上分布着五十多块面部肌肉,这些肌肉的运动导致不同面部表情的出现,会造成人脸特征的显著改变; 2.人脸随年龄而改变,随着年龄的增长,皱纹的出现和面部肌肉的松弛使得人脸的结构和纹理都将发生改变; 3.人脸有易变化的附加物,例如改变发型,蓄留胡须或者佩戴帽子和眼镜等饰物; 4.人脸特征遮掩,人脸全部、部分遮掩将会造成错误识别; 5.人脸图像的畸变,由于光照、视角、摄取角度不同,可能会造成图像的灰度畸变、角度旋转等,降低了图像质量,增大了识别难度。 所以很难从有限张人脸图像中提取出反映人脸内在的、本质的特征。另外人脸识别还涉及模式识别、图像处理、计算机视觉、生理学和心理学等学科领域。这诸多因素使得人脸识别至今仍是一个有待深入研究,极富挑战性的课题。同时一个成功的、具有商用价值的快速的人脸识别系统将会给社会带来极大的影响。 1.2人脸识别技术的发展与现状 人脸识别的研究可以追溯到20世纪60年代末,最早的研究见于文献[1]。Bledsoe以人脸特征点的间距、比率等参数为特征,建成了一个半自动的人脸识别系统。人脸识别的发展大致经过了三个阶段,其中伴随发展了多样的人脸识别技术。 1.2.1人脸识别技术发展的三个阶段 第一阶段一非自动识别阶段:主要研究如何提取人脸识别所需的特征。通过简单的语句描述人脸数据库成为待识别人脸设计逼真的摹写来提高面部识别率。这是需要手工干预的阶段。此阶段以Bertillon、Allen和Parke为代表。在Bertillon系统中,用了一个简单的语句与数据库中的某一张脸相联系,同时与指纹识别相结合,提供了一个较强的识别系统。为了提高面部识别率,Allen为待识别人脸设计了一种有效逼真的摹写[2],Parke则用计算机实现了这一想法[3],并且产生了较高质量的人脸灰度图模型。在此阶段,识别过程全部依赖于操作人员,所以不是一种自动识别的系统。 第二阶段一人机交互阶段:这一阶段虽然实现了一定的自动化,但还需要操作员的某些先验知识,仍然不是一个完全自动的识别系统。此阶段的代表性工作有:Goldstion、Harmon和Lesk等人用几何特征参数来表示人脸正面图像[4]。他们采用21维特征矢量表示人脸面部特征,并设计了基于这一表示法的识别系统。Kaya和Kobayashi则采用了统计识别的方法,用欧氏距离来表示人脸特征[5],例如嘴和鼻子之间的距离,嘴唇的高度,两眼之间的距离等。更进一步的,T.Kanad设计了快速且有一定知识引导的半自动回溯识别系统[6],创造性的运用积分投影法从单幅图像上计算出一组脸部特征参数,再利用模式分类技术与标准人脸相匹配。Kanad的系统实现了快速、实时的处理,是一个很大的进步。总的来说,上述方法都需要利用操作员的某些先验知识,始终摆脱不了人的干预。 第三阶段一自动识别阶段:这一阶段真正实现了机器自动识别,产生了众多人脸识别方法,出现了多种机器全自动识别系统。近十余年来,随着高速度、高性能计算机的发展,人脸识别方法有了较大的突破,提出了多种机器全自动识别系统[7]。近年来,人脸识别技术研究也非常活跃,除了基于K一L变换的特征脸方法与奇异值特征为代表的代数特征方法取得了发展外[8][9],人工神经网络[10][11]、隐马尔可夫模型·小波变换等也在人脸识别研究中得到了广泛的应用[12][13],而且出现了不少人脸识别的新方法[14][15][16]。本文将在1.3节介绍人脸识别的主要内容与方法。 1.2.2国内外发展现状 目前,国外对人脸识别问题的研究比较多,其中比较著名的有MTI、CMU、Cornell和Rockfeller等,MPEG标准组织也已经建立了专门的人脸识别草案小组。国际上发表的相关论文数量也大幅度增长,EIEE的著名国际会议,如EIEE International Conference on Automatic Face and Gesture Recognition、 International Conference on Image Processing、Conference on Computer Vision and Pattern Recognition等,每年都有大量关于人脸识别的论文。截至2005年3月,EIEE/IEE全文数据库中收录的关于“face”的文章8916篇,其中有关“face recognition”的3280篇,约占36.8%,并且每年的文献呈急剧上升趋势。同样在工程索引El中,至2005年3月,共有81657篇有关“face”的文献,数目是惊人的,并且2000年后快速增长。国内对人脸识别领域的研究起步较国外晚,但近十年来呈现飞速发展,据中国期刊网统计,1996年至2005年3月,有关“人脸”的文献1467篇,其中人脸识别领域的文章494篇,并且再近几年获得快速增长,也预示人脸识别领域得到快速发展。目前国内大部分高校有人从事人脸识别相关的研究,其中技术比较先进的有中科院自动化所、清华大学、浙江大学等。 1.3人脸识别的研究内容与主要方法 自动人脸识别技术(AFR)就是利用计算机技术,根据数据库的人脸图像,分析提取出有效的识别信息,用来“辨认”身份的技术。人脸识别技术的研究始于六十年代末七十年代初,其研究领域涉及图像处理、计算机视觉、模式识别、计算机智能等领域,是伴随着现代化计算机技术、数据库技术发展起来的综合交叉学科。 1.3.1人脸识别的研究内容 人脸识别的研究范围广义上来讲大致包括以下五个方面的内容。 1.人脸定位和检测(Face Detection):即从在动态的场景与复杂的背景中检测出人脸的存在并且确定其位置,最后分离出来。这一任务主要受到光照、噪声、面部倾斜以及各种各样遮挡的影响。 2.人脸表征(Face Representation)(也称人脸特征提取):即采用某种表示方法表示检测出人脸与数据库中的己知人脸。通常的表示方法包括几何特征(如欧氏距离、曲率、角度)、代数特征(如矩阵特征向量)、固定特征模板等。 3.人脸识别(Face Identification):即将待识别的人脸与数据库中已知人脸比较,得出相关信息。这一过程的核心是选择适当的人脸表征方式与匹配策略。 4.表情姿态分析(Expression/Gesture Analysis):即对待识别人脸的表情或姿态信息进行分析,并对其加以归类。 5.生理分类(Physical Classification):即对待识别人脸的生理特征进行分析,得出其年龄、性别等相关信息,或者从几幅相关的图像推导出希望得到的人脸图像,如从父母图像推导出孩子的脸部图像和基于年龄增长的人脸图像估算等。 人脸识别的研究内容,从生物特征技术的应用前景来分类,包括以下两个方面:人脸验证与人脸识别。 1.人脸验证(Face Verification/Authentication):即是回答“是不是某人?(Am I whom I claim I am?)”的问题。它是给定一幅待识别人脸图像,判别它是否是“某人”的问题,属于“一对一”的两类模式分类问题,主要用于安全系统的身份验证。 2.人脸识别(Face Identification/Recognition):即是回答“是谁?(Who am I?)”的问题。它是给定一幅待识别人脸图像,在已有的人脸数据库中,判别它的身份的问题。它是个“一对多”的多类模式分类问题,通常所说的人脸识别即指此类问题,这也是本文的主要研究内容。 1.3.2人脸识别的视觉机理 近几年的研究表明[17],人类视觉数据处理是多层次的过程,其中最低层的视觉过程(视网膜功能)起到信息转储作用,即将大量图像数据转换为较为抽象的信息,这一任务由视网膜中的两类细胞完成:低层次的细胞对空间的响应与小波变换作用类似,高层次的细胞则依据低层次细胞的响应,而作出具体的线、面乃至物体模式的响应。这表明在视觉处理过程中,神经元并不是随便的、不可靠的把视觉图像的光照强度投射到感觉中枢,它们可以检测模式单元,区分物体的深度,排除无关的变化因素,并组成一个令人感兴趣的层次结构。人脸识别不仅有着以上普通视觉过程的特点,而且具有以下独特之处[18-22][23]。 1.人脸识别是大脑中一个特有的过程。针对人脸识别,大脑中存在一个专门的处理过程; 2.在人脸感知与识别过程中,局部特征与整体特征均起作用。若存在明显的局部特征,整体特征将不起作用; 3.不同的局部特征作用对识别的贡献也不同。在正面人脸图像中,头发、人脸轮廓、眼睛以及嘴巴对识别和记忆有着重要影响,鼻子的作用则不是很重要。但在侧面人脸识别中,鼻子对特征点的匹配很有作用。通常来讲人脸的上部比下部对识别作用更大些; 4.不同空间频率上信息的作用不同。低频信息代表了整体的描述,高频信息包含了局部的细节。对于性别的判断,仅利用低频信息就足够了,对于身份识别没有高频信息就无法完成; 5.光照对视觉有影响。有实验表明,从人脸底部打光会导致识别困难; 6.动态信息比静态信息更利于识别。研究还发现,对熟悉的人脸,人类的识别能力在动态场景中要高于静态场景; 7.十岁以下的儿童识别人脸较多的采用显著特征,而较少的使用整体分析; 8.不同的种族。性别的人脸识别的难易程度不同,这可能因为不同类型的人脸图像具有不同的特征; 9.面部表情的分析与人脸识别并行处理。通过对脑部受损的病人研究表明,表情的分析与识别虽有联系,但总体来说是分开处理的。 人脸识别是一种复杂的信息处理任务,它的研究涉及计算机技术、心理学和神经生理学。视觉机理、心理学和神经生理学的研究结果无疑将非常有益于人脸识别技术的发展,这些结论对于设计有效的识别方法起到了一定启发作用。但除少数文献外[24],机器识别人脸的研究还是独立于心理学和神经生理学的研究的。 1.3.3人脸识别系统的组成 在人脸识别技术发展的几十年中,研究者们提出了多种多样的人脸识别方法,但大部分的人脸识别系统主要由三部分组成:图像预处理、特征提取和人脸的分类识别。一个完整的自动人脸识别系统还包括人脸检测定位和数据库的组织等模块,如图1-1。其中人脸检测和人脸识别是整个自动人脸识别系统中非常重要的两个技术环节,并且相对独立。下面分别介绍这两个环节。 图1-1人脸识别系统框图 人脸检测与定位 检测图像中是否有人脸,若有,将其从背景中分割出来,并确定其在图像中的位置。在某些可以控制拍摄条件的场合,如警察拍罪犯照片时将人脸限定在标尺内,此时人脸的定位很简单。证件照背景简单,定位也比较容易。在另一些情况下,人脸在图像中的位置预先是未知的,比如在复杂背景下拍摄的照片,这时人脸的检测与定位将受以下因素的影响: 1.人脸在图像中的位置、角度、不固定尺寸以及光照的影响; 2.发型、眼镜、胡须以及人脸的表情变化等; 3.图像中的噪声等。 特征提取与人脸识别 特征提取之前一般需要做几何归一化和灰度归一化的工作。前者是指根据人脸定位结果将图像中的人脸变化到同一位置和大小;后者是指对图像进行光照补偿等处理,以克服光照变化的影响,光照补偿能够一定程度的克服光照变化的影响而提高识别率。提取出待识别的人脸特征之后,即可进行特征匹配。这个过程是一对多或者一对一的匹配过程,前者是确定输入图像为图像库中的哪一个人(即人脸识别),后者是验证输入图像的人的身份是否属实(即人脸验证)。 以上两个环节的独立性很强。在许多特定场合下人脸的检测与定位相对比较容易,因此“特征提取与人脸识别环节”得到了更广泛和深入的研究。近几年随着人们越来越关心各种复杂的情形下的人脸自动识别系统以及多功能感知研究的兴起,人脸检测与定位才作为一个独立的模式识别问题得到了较多的重视。本文主要研究人脸的特征提取与分类识别的问题。 1.3.4主要的人脸识别方法 人脸识别技术作为模式识别领域的一个研究热点,每年都有许多相应的研究成果发表,并且涌现出各种各样的识别方法,可以说信息处理领域的各种新方法的研究和算法的改进都尝试在人脸识别中得到应用。文献[25][26]对近十年来人脸识别领域取得的成果进行了总结。人脸识别方法的分类,根据研究角度的不同,可以有不同的分类方法,这是研究人脸识别方法首先遇到的问题。本文在深入研究国内外人脸识别技术的发展和研究成果的同时,将已有的不同的分类方法做一个比较,目的是希望能从不同角度认识人脸识别问题,在较全面的了解各种方法优缺点的基础上,给本文的人脸识别方法提供研究方向。 根据输入图像中人脸的角度,人脸识别技术可分为基于正面、侧面、倾斜人脸图像的人脸识别。由于实际情况的要求,对人脸正面模式的研究最多,这也是本文的研究内容。 根据图像来源的不同,人脸识别技术可分为两大类:静态人脸识别和动态人脸识别。静态人脸识别,即人脸来源为稳定的二维图像如照片。如果人脸的来源是一段视频图像,则人脸识别就属于动态人脸识别。在头部运动和表情变化状态下的人脸识别都可以看作动态人脸识别,如视频监视中的人脸识别。动态人脸识别具有更大的难度:首先,视频输出的图像质量较差:其次,背景较复杂,目前对动态人脸识别的研究还局限于简单背景,较少人物的情况,对静态人脸识别的研究比较多。本文的研究也是基于静止图像的。 根据人脸识别技术的发展历史,人脸识别方法大致可分为基于几何特征的人脸识别方法、基于模板匹配的人脸识别方法和基于模型的人脸识别方法。 a.基于几何特征的人脸识别方法 这是人脸识别技术发展中,应用最早的方法。该方法是通过提取人脸的几何特征,包括人脸部件的归一化的点间距离、比率以及人脸的一些特征点,如眼角、嘴角、鼻尖等部位所构成的二维拓扑结构进行识别的方法。所构造的几何特征既要清晰区分不同对象人脸的差异,又要对光照背景条件不敏感,常规的几何特征量很难满足这些要求。因此该方法识别效果不理想。 b.基于模板匹配的人脸识别方法 基于模板匹配的方法,主要是利用计算模板和图像灰度的自相关性来实现识别功能。一般基于人脸的全局特征,利用人脸模板和相关参数如灰度的相关性来进行检测和识别的。Berto在[27]中将基于几何模型的人脸识别方法和模板匹配进行了全面比较后,得出结论:前者具有识别速度快和内存要求小的优点,但在识别率上后者要优于前者。增加几何特征对于基于几何特征的人脸识别方法只能轻微的提高识别率,因为要提高几何特征的提取质量本身就十分困难,而且随着图像质量的下降和人脸遮挡的引入,基于几何特征的人脸识别效果会大幅下降。总之,认为模板匹配法要优于几何特征法。 c.基于模型的人脸识别方法 通过统计分析和匹配学习找出人脸和非人脸,以及不同人脸之间的联系。该方法包括特征脸法(Eigenface)、神经网络方法(NN)、隐马尔可夫模型方法(HMM)和支持向量机(SVM)等方法。和模板匹配的方法相比,基于模型方法的模板是通过样本学习获得,而非人为设定。所以该方法,从原理上更为先进合理,实验中也表现出更好的识别效果。 根据人脸表征方式(即特征提取)的不同,还可以将人脸识别技术分为三大类:基于几何特征的识别方法、基于代数特征的识别方法和基于连接机制的识别方法。 a.基于几何特征的人脸识别方法 该方法在上文中已有阐述,它将人脸用一个几何特征矢量表示,用模式识别中层次聚类的思想设计分类器达到识别目的。该方法的困难在于没有形成一个统一的、优秀的特征提取标准。由于人面部的模式千变万化,即使是同一个人的面部图像,由于时间、光照、摄影机角度等不同,也很难用一个统一的模式来表达,造成了特征提取的困难。不过,由于现在各种优秀特征提取算法(如动态模板、活动轮廓等)的提出,使得人脸的几何特征描述越来越充分。而且在表情分析方面,人脸的几何特征仍然是最有力的判据。 b.基于代数特征的人脸识别方法 这类识别法仍然是将人脸用特征矢量表示,只不过用的是代数特征矢量。该方法在实际应用中取得了一定的成功[28]。由于代数特征矢量(即人脸图像向各种人脸子空间的投影)具有一定的稳定性,识别系统对不同的倾斜角度,乃至不同的表情均有一定的鲁棒性。所以,也说明了这种方法对表情的描述不够充分,难以用于表情分析。 c.基于连接机制的人脸识别方法 这类识别法将人脸直接用灰度图(二维矩阵)表征,利用了神经网络(Neural Network,NN)的学习能力及分类能力[29][30]。这种方法的优势在于保存了人脸图像中的纹理信息及细微的形状信息,同时避免了较为复杂的特征提取工作。而且,由于图像被整体输入,符合格氏塔(Gestalt)心理学中对人类识别能力的解释。与前两种识别方法相比,基于连接机制的识别法具有以下明显不同:信息处理方式是并行而非串行;编码存储方式是分布式。但由于原始灰度图像数据量十分庞大,因此神经元数目通常很多,训练时间很长。另外,完全基于神经网络的识别法在现有的计算机系统(冯一诺伊曼结构)上也有其内在的局限性。神经网络虽然有较强的归纳能力,但当样本数目大量增加时,其性能可能会严重下降。 本文根据人脸表征方法与特征综合方式的不同,认为将人脸识别方法分为基于几何特征的方法、基于模板匹配的方法和基于统计学习的方法,比较合适。此分类方法即符合人脸识别技术发展的历史,又将人脸特征提取与分类识别有机的结合在一起。识别人脸主要依据那些在不同个体之间存在较大差异,而对于同一个人比较稳定的特征,具体的特征形式和综合方式(分类方式)的不同决定了识别方法的不同。图1-2列出了主要的人脸特征与综合方法。早期静态人脸识别方法研究较多的是基于几何特征的方法和基于模板匹配方法。目前,静止图像的人脸识别方法主要是基于样本通过统计学习识别人脸的方法,主要研究方向有:基于代数特征的识别方法,包括特征脸(Eigenface)方法[8]和隐马尔可夫模型(HMM)方法[31];基于连接机制的识别方法,包括一般的神经网络方法和弹性图匹配(Elastic Graph Matching)方法[32],以及以上方法的一些综合方法。基于统计学习的方法属于基于整体的研究方法,它主要考虑了模式的整体属性。因为基于整体的人脸识别不仅保留了人脸部件的拓扑关系,而且也保留了各部件本身的信息。文献[27]认为基于整个人脸的分析要优于基于部件的分析,理由是前者保留了更多信息。对于基于整个人脸的识别而言,由于把整个人脸图像作为模式,那么光照、视角以及人脸尺寸会对人脸识别有很大的影响,因此如何能够有效的去掉这些干扰就尤为关键。神经网络的方法在人脸识别上有其独到的优势,即它避免了复杂的特征提取工作,可以通过学习的过程获得其它方法难以实现的关于人脸识别的规律和规则的隐性表达。但是NN方法通常需要将人脸作为一个一维向量输入,因此输入节点庞大,降维就显得尤为重要。根据文献[32]对于自组织神经网络方法的分析,认为可采用自组织神经网络的P个节点来表达原始的N个输入(Pm),降维后仍保存了数据中的主要信息。主分量分析是一种正交变换,在多维数据统计分析中是一个应用广泛的工具。 假设原始向量特征维数为n,即xi=(xi1,xi2,…,xni)T,i=1,2,…,N,要求构造N个新的特征yl,y2,…,yn,并使它们满足以下的条件: a.每个新特征是原有特征的线性组合,即 (2-4) b. 各个新变量之间是不相关的,即相关系数为零: (2-5) c. wi使yi的能量达到极大,i=1,2,…,N 可以证明满足条件的城为样本的协方差矩阵Sx=E{XXT},对应于λi特征值的正交规范化的特征向量ui,满足以上条件的新特征y1,y2,…,yn分别称为样本点的第1,2,…,N个主分量。令W=(ul,u2,…,un)T,且满足正交归一化,即 (2-6) 经过Y=WTX的变换之后,因为X的协方差矩阵SX为实对称阵必然与一个对角阵相似,所以对应于Y的协方差矩阵如下式: (2-7) 这就是说,新特征y1,y2, …,yn两两之间的协方差为零,即它们是不相关的。由于yi也是零均值,每个特征的方差数值E{yi2}在一定意义下反映了它所包含的能量即信息量。由前面叙述可知,所有这些映射矢量作为基向量,便构成主分量分析对应的变换矩阵W={w1,w2,…,wm,…,wn,}T其中前几个基向量wl,w2,…,wm,对应能量占主导地位的几个主分量的映射方向,现将余下的基向量置零,得到W΄={wl,w2,…,wm,0,0,…,0}T。利用W΄对信号进行近似恢复,得到x΄=W΄W΄ Tx。其中W΄ Tx为所选择的前m个主分量。重构信号的均方误差为E{||x-x΄||2}。当选择m个主分量去重构原信号时,由于原信号的维数n>m,所以从信号维数的角度来讲PCA起到了对信号降维的作用。在很多情况下,有效的降维会使得在最大程度保持原信号中所蕴涵的信息的情况下,大大降低运算复杂度。譬如在进行人脸识别应用中,输入的人脸图像的维数往往很高,采用P以方法对其进行特征提取可以降低样本的维数,从而降低计算复杂度,提高了计算速度。 主分量分析是是一种基于统计特征的最佳正交变换,称其为最佳变换是因为它具有优良的性质,使变换后产生的新的分量正交或不相关。主分量分析也是一种最小均方误差(MSE)意义下的最优变换[39]。也就是说,变换后的信号能量主要集中在前几个主分量中,而由这少数几个主分量张成的子空间去重构原信号,逼近效果从最小均方误差意义下是最优的。主分量分析使变换矢量更趋确定,能量更趋集中等,这使得它在特征提取、数据压缩等方面都有着及其重要的作用。 2.3基于主分量分析的人脸识别方法 2.3.1基于主分量分析的人脸特征提取 任何基于统计学习的模式识别系统都包括两个过程,一个是训练阶段(training Process),二是测试阶段(testing process),且两个阶段都需要特征提取,应用CAP的人脸识别系统也不例外。假定在训练阶段,数据库中有K个人,每个人有M幅人脸灰度图像,其中每一幅图像都用NxN的二维数组I(x,y)来表示,数组元素表示象素点的灰度值。同样,每一幅图像都可以视为一个N2xI的向量。因此,它等同于N2维的人脸象素域空间中的一个点。设xij表示一个N2xI的向量来表示数据库中第i个人的第j幅图像(0≤i≤k-1,0≥j≥M-1)然后,定义平均人脸μ如下: (2-8) 表示了每一幅人脸与平均人脸的差值,它是零均值的。它们组成了一个N2xMK的矩阵, =( 00, 01, …, K-1,M-1), PCA方法就是要找到对应于矩阵 EMBED Equation.3 T 的前m个较大特征λi 的正交规范化的特征向量μi : (2-9) 因为 EMBED Equation.3 T 是N2xN2 的矩阵,求它的N2个特征值的计算量非常大。一般而言,训练过程中人脸数据库里的图像数目MxK比人脸空间的维度N2要小,所以我们可以先求得 T 见的正交规范化的特征向量城μi΄: (2-10) 在式(2-10)两边左乘 ,然后与式(2-9)比较,我们可以得到: (2-11) 这些特征向量,称为特征脸,构成了人脸空间的一个子空间的正交基,这个子空间就是通常所说的特征空间。特征空间有训练图像的协方差的特征向量构成,将数据库中的每一幅人脸x从人脸空间转化到特征空间: (2-12) 既然每一幅人脸都可以用特征空间里的向量y=(w0,wl,…,wm-1)T,利用最近邻法就可以在特征空间里进行人脸识别。在训练阶段,数据库中的所有人脸xij到特征空间为,那么,第i个人在特征空间里的平均向量为: (2-13) 在测试阶段,给出测试人脸,首先,将按照同样的步骤式(2-12)转化到特征空间,得到在特征空间各坐标上的系数向量。然后,利用最近邻法则将判定为求得dj最小的一类: (2-14) 综上所述,基于主分量分析的人脸识别方法的具体步骤如下: a. 初始化,获得人脸图像的训练集并计算特征脸,定义为人脸空间; b. 输入新的人脸图像,将其映射到特征脸空间,得到一组坐标系数; c. 通过检查图像与人脸空间的距离判断它是否为人脸; d. 若为人脸,根据坐标系数判断它是否为数据库中的某个人。 2.3.2基于主分量分析的人脸分类识别 人脸图像被投影到特征空间中后,剩下的任务就是如何利用待识别人脸图像在此特征子空间的投影系数,实现分类识别了。此任务由两部分构成:一是相似性测量;二是分类器设计。传统的分类识别是基于欧氏距离的最近邻分类方法,实验证明效果并不理想。因为欧氏距离容易受到图像光线、噪声等整体干扰因素的影响。分类器选取与特征提取一样也是模式分类中的一个重要环节,不同的分类器对不同特征空间的分类效果优劣相差很大。本文采用两个坐标向量夹角的余弦值作为相似测度以及采用SVM分类器。实验证明比传统的基于欧氏距离的最近邻法效果好。具体方法如下。 相似性测量 假设为待测试人脸图像的PCA系数向量,即PCA特征,为训练人脸库中的样本特征,二者欧氏距离计算公式如下: (2-15) 其中n为特征向量的维数。 相应的的角度距离(Cosine istnaee)如下式: (2-16) 分类器设计 分类器的功能是先计算出c判别函数gj(x),再从中选出对应判别函数最大值的类作为结果。分类器的核心是预先定义的判别函数,根据其判别函数定义的不同可分为基于距离的分类器(如最近邻法)、基于概率的分类器和基于智能方法的分类器(如SVM)。另外,根据分类器的输出结果的多少,大致可分为两类分类器和多类分类器。多类分类器可由两类分类器按某种策略组合而成。 最近邻分类器是由Cover和Hart于1968年提出的[40],至今仍是模式识别非参数法中最重要的方法之一。假定有c模式类别{ωi,i=1,2,…,c}每类有标明类别的Ni 个样本xji(i=1,2, …, Ni)。类的判别函数定义为: (2-17) 其中xik 的角标i表示ωi类,k表示ωi类Ni个样本中的第k个。按照式(2-17),决策规则可以写为,若 (2-18) 则决策x∈ωj 。这一决策方法称为最近邻法(Nearest neighbor)。其直观解释是相当简单的,就是说对未知样本x1 只要比较x与个未知类别的样本之间的欧氏距离或者角度距离,并决策:为与离它最近的样本同类。此方法三直接基于模式样本建立判决函数的方法。 支持向量机(Support Vecor Machuines,SVM) 源于统计学习理论,它使用结构风险最小化(RSM)原理构造决策超平面使每一类数据之间的分类间隔最大。SMV是从线性可分情况下的最优分类面(Optimal HypePrlnae) 提出的。最优分类面要求分类面不仅能将两类无误的分开,而且要求两类的分类空隙最大。前者是保证经验风险最小,而后者的作用是使推广性的界中的置信范围最小,从而使实际风险最小。 对于非线性分类,首先使用一非线性映射ƒ把数据从原空间X映射到高维特征空间Z,使数据在高维空间线性可分,从而可以在特征空间Z上建立最优分类面。高维特征空间Z维数可能很高,但是因为在线性情况下只用到了原空间的点积运算,所以在非线性空间也只考虑在高维特征空间Z的点积运算ƒ(x)∙ ƒ(y)=K(x,y) 称为核函数。也就是说只需选择一个核函数使其成为特征空间Z的一个点积,即存在函数满足 (2-19) 径向基形式的内积函数和人的视觉特性很类似,所以在实验中,本文选择了参数为δ2=0.3的径向基函数学习机器: (2-20) SVM最初是用来解决两类问题的识别问题,本文将其改进,使它能解决人脸识别这样的多类模式识别问题。改进方法理论基础是,N类分类问题(N>2)和两类分类问题之间存在一定的对应关系,即如果一个分类问题N类可分,则这N类中的任何两类间一定可分;反之,在一个N类分类问题中,如果己知其任意两两可分,则通过一定的组合法则,可由两两可分来最终实现N类可分。所以可以将支持向量基与二叉决策树的基本思想结合起来构成多类的分类器。本文采用了如图2-2的SMV决策结构。 图2-2 SVM分类器结构 2.4实验结果及分析 在ORL、Manchester、Yale和FERTE标准人脸库中分别测试基于主分量分析的人脸识别方法,重点比较了改进的相似度测量和分类器对识别性能的影响。预处理阶段将不同尺寸大小的图像,都统一成60x50每象素8比特的图像。以上人脸库在引言1.4节中己有介绍。在ORL人脸库中,本文选取了40人每人5幅图像作为训练集,余下5幅构成测试集。有关其他人脸库的训练集和测试集的选取,参考表2-1,其中FERTE人脸库中,同一人的图像数目不同(3~13不等),本文只选择了30个拥有正面图像数目(含一定角度偏侧面的图像)6幅以上对象的图像。 表2.1训练集与测试集的组成 本章实验主要测试了传统特征脸法、改进相似测度(用角度距离代替欧氏距离)的特征脸法和相似测度和分类器都加以改进(用SMV代替最近邻法)的特征脸法的识别性能,实验结果如表2-2。 表2-2 特征脸法在不同人脸库中的识别性能比较 由实验结果分析可得,基于角度的相似性测度优于基于欧氏距离的相似性测度,这点在Yale人脸库中尤为明显,识别率将近提高了4%,这说明角度距离更适合人脸识别这样的任务。在分类器的改进方面,SVM分类器要优于最近邻法,但是没有相似测度的改进表现的明显。同时由于SVM分类器远比最近邻分类器复杂的多,所以在实际应用中,应综合加以考虑。在不同人脸库中的实验表明,相似性测度和分类器的改进虽然一定程度上改善了特征脸的识别效果,但是总的来说,特征脸的识别率并不高,表现在以下方面:在ORL人脸库中,图像质量较好,背景均为黑色,统一的光照条件下,识别率最高可达84.7%;Manchester人脸库中的图像比ORL人脸库,背景变化略多些,但由于背景占图像很少一部 分,并且光照条件也有所限制,所以识别效果基本和ORL相当。与以上人脸库相比,Yale人脸库的特点就是光照变化明显,如图2-3。 图2.3 YALE人脸库中错误识别示例 (a)列为错误识别示例 (b)列为正确识别结果 所以在Yale库中,识别率明显下降了约15%,FERTE人脸库中的图像接近真实情况,变化因素比较多,所以识别率是最低的。分析实验结果本文得出以下结论:基于主分量分析的人脸特征提取,易受光照等因素影响(即对能量敏感),对细节不敏感,识别效果不理想,PCA提取的人脸特征,并不适合于人脸识别。相似度测量和分类方法的改进,未能根本改善特征脸法的识别性能,基于PCA的人脸特征提取方法存在理论上的缺陷。 CPA提取人脸特征存在不足,但由于P以是最小均方误差下的正交变换,极大的保留了人脸图像的能量,Manchester人脸数据库中的重构实验证实了这点,如图2.4。并且CPA运算速度快,所以是较好的降维方法。人脸本质的、细节的特征可由后续特征提取来完成,比如本文下一章所提出的基于独立分量分析的人脸特征提取方法。 图2-4 Manchester人脸数据库中的重构实验 (a)列为部分遮掩的图像(b)列为重构图像(c)列为未经遮掩处理的原图 2.5本章小结 特征脸法是一种简单、快速、实用的基于变换域系数的算法。“改进后的特征脸法一定程度上提高了它的性能,该方法存在如下优点: a.图像的原始灰度数据直接用来学习和识别,不需要任何低级或中级处理; b.通过低维子空间表示高维数据,有效的对数据进行了压缩; c.不需要人脸的先验和几何知识; d.与基于几何特征和基于模板匹配的方法相比,识别简单有效。 但是,由于特征脸法在本质上依赖于训练集和测试集图像的灰度相关度,所以它有着很大的局限性,表现在以下方面: a.对尺度变化很敏感,识别前必须进行尺度归一化处理,而且由于PCA在图像空间是线性的,它不能处理几何变化; b.只能处理正面人脸图像,在姿态、发型和光照等发生变化时识别率明显下降,对光照条件的改变尤为敏感; c.要求背景单一,对于复杂变化背景,需要先进行复杂的图像分割处理; d.扩展性差。训练库中添加新的图像,必须重新计算训练库的特征向量。 综上所述,基于主分量分析的人脸识别方法,并没有提取出反映人脸本质的,内在的特征,人脸识别期待新的特征提取方法。 第3章 基于独立分量分析的人脸识别方法 3.1引言 独立分量分析(Independent Component Analysis,ICA) 是近年才发展起来的一种基于统计理论的信号处理技术,该方法的目的是将观察到的数据进行线性变换,使其分解成统计独立的分量。CIA与PCA同属于基于子空间的特征提取方法,即用低维的子空间参数描述高维的数据特征。在PCA中,首先考虑的是如何保留信号的最大能量,在最小均方误差的准则下重构数据,并且要求主分量两两正交。而ICA的基本思想是用基函数来表示一个随机变量集合,其基向量是统计独立的,或者尽可能的独立。ICA的概念可以看为是PCA的一种扩展。目前ICA主要应用于特征提取[43]、盲源信号分离[44]、语音信号分析[45]、图像处理[46]和人脸识别[47]等。 特征脸法应用用传统的PCA方法提取人脸特征,该方法只能考虑图像数据间的二阶统计特性,未能利用高阶统计信息,同时要求提取的人脸特征两两正交。与PCA不同,基于ICA的特征提取方法得到的独立图像基,能够反映像素间的高阶统计特性,并且不要求向量基两两正交。在人脸识别中,重要的人脸信息一般存在于象素间的高阶统计信息中,所以ICA可以看作是值得期待的人脸特征提取方法。 本章首先简要介绍了ICA的理论基础,包括ICA的起源和ICA的线性模型;然后介绍了基于ICA人脸识别方法,以及独立元的选择和改进的ICA快速算法;最后分析基于ICA人脸识别的实验结果。 3.2独立分量分析的理论基础 独立分量分析作为一种新的多维信号处理方法,主要用于揭示和提取多维统计信号中的潜在成分,是在具有较长研究历史的盲源分离问题(Blind Source Separation,BSS)[36]中涌现出的新的信号分析技术,二者联系紧密。ICA与传统的多维信号分析方法截然不同的是,经ICA处理得到的各个分量不仅去除了相关性,还是相互统计独立的,并且是非高斯分布的。ICA在许多方面对传统方法的重要突破使得其越来越成为信号处理中一个极具潜力的分析工具。 3.2.1独立分量分析与盲源分离 ICA源于盲源分离问题的解决,该问题是信号处理中一个传统而又极具挑战性的课题。盲源分离是指仅从观测的混合信号(通常是多个传感器的输出)中恢复独立的源信号,这里的“盲”是有两层含义:其一是指源信号是不可观测的;其二指混合系统是事先未知的。在科学研究和工程应用中,很大观测信号都可以假设成是不可见的源信号的混合。所谓的“鸡尾酒会”问题(cocktail Party Problem)就是一个典型的例子,简单来说就是当很多人(作为不同的源信号)同时在一个房间里说话时,声音信号由一组麦克风记录下来,这样每个麦克风记录的信号是所有人声音的一个混合,也就是我们所说的观测信号。接下来的问题是:如何从这组观测信号中提取每个说话者的声音信号,即源信号。由于输入输出两端的连接权值是未知的,所以属于盲源分离的范畴。如果这些连接权值是己知的,或者说混合矩阵是已知的,则上面的问题就退化成简单的求逆过程,即求混合矩阵的逆矩阵。但是在更多的情况下,我们无法获取混合系统的先验知识,这就要求我们从观测信号来推断这个混合矩阵,实现盲源分离。 ICA技术正是为了解决盲源分离问题而不断发展起来的,并成为阵列信号处理和数据分析中的有力工具。将ICA应用在盲源分离中,能够从混合信号中重现不可观测的源信号成分,所利用的仅仅是假设源信号统计独立这样一个容易满足的先验条件。与传统的基于二阶统计特性的方法(比如PCA等)相比,ICA不仅可以去除各分量之间的一、二阶相关性,同时还具有发掘并去除数据间的高阶相关信息的能力,使得输出分量相互独立。 目前ICA在诸如语音识别、通信、生物医学信号处理等很多领域都得到了极大的重视。针对人脸识别中的人脸图像样本和人脸特征向量之间的关系,符合盲源分离中的观测向量和源信号间的关系,本文尝试将其应用到人脸识别的特征提取中,取得了良好的实验结果。 3.2.2独立分量分析的线性模型 ICA的起始点基于一个非常简单的假设,假设存在N个相互独立的源信号,写成矩阵形式为S=(s1,s2,…,sN)T,独立表示有下式成立: (3-1) 以及N个观测信号,表示成矩阵形式为X=(x1,x2,…,xN)T。同时假设观测信号是由源信号线性混合而成。 (3-2) 写出矩阵形式就是: (3-3) 其中A为称为混合矩阵,由混合系数组成。对照式(3-2),矩阵A的每个行向量中的N个元素作为N个源信号的加权系数对源信号进行混合,即得到对应的一个观测信号。 ICA的基本目标就是寻找一个线性变换W,称之为分离矩阵。该矩阵使得观测信号X经过线性变换后,输出信号Y=(y1,y2,…,yN)T向量间尽可能的相互独立,表示成矩阵形式就是: (3-4) 输出Y就是源信号S的一个估计,上述的ICA模型如图3-1所示。 图3-1 ICA模型的原理图 但是从盲源分离的观点看,Y中各个分量与S相比存在次序的不同以及对应分量幅度相差一个常数项的可能,这称之为ICA问题的不确定性,造成这种不确定性的原因是由于没有关于独立源的先验知识。在线性变换中,为了便于说明其原理,均假设变换前后数据维数相等。在实际应用中,当观测信号维数m大于源信号维数n时,总可以通过降维的方法使得m=n,所以这种假设不失一般性。 ICA、PCA和SVD均属于线性变换技术,但是后两者只能按能量大小对数据进行分解,消除数据之间的二阶相关性,而ICA能够消除输入数据之间的高阶相关性。在图像中,可以提取的特征很多,特征之间存在相关性,并且重要特征一般隐藏在高阶统计特性中,因此使用ICA方法能够约减特征维数,并且使特征保持高阶相互独立,而不像PCA和SVD只能消除二阶相关性。 3.3基于独立分量分析的人脸识别方法 一般情况下,人脸识别过程可以分三步完成:预处理、特征提取和分类识别。基于ICA的人脸识别方法也不例外。ICA涉及的预处理的方法除了传统的几何归一化,灰度归一化外,还有中心化和白化的过程,本节将主要阐述这两种预处理方法。将工以应用到人脸的特征提取中,则ICA问题可以描述如下:观测的数据矢量就是人脸的训练样本,令xi为一个人脸图像样本,则由n个训练图像构成训练集X=(sl,x2,…,xN)T是相同数目的独立源信号S=(s1,s2,…,sN)T经过混合矩阵A线性混合而成,如式(3-3)。 在人脸识别中,ICA的研究目的是从仅有的观测数据(人脸图像)X出发寻找一个分离矩阵W,使得Y=WX的各个分量统计独立。图3-2给出了人脸图像CIA的原理图,X中的人脸图片被认为是S中统计独立源的线性组合,A是未知的混合矩阵,W是ICA算法估计得到的分离矩阵,Y就是ICA提取的人脸特征空间。 图3-2 人脸图像的ICA原理图 在获得ICA人脸特征空间Y后,就可以给出人脸的特征表示,如图3-3,其中(b1,b2,…,bN)为ICA系数,即用人脸在特征空间Y上的投影来表示人脸。 图3-3 人脸图像的ICA特征表示 3.3.1人脸图像的预处理 将ICA应用于人脸识别,随机向量即待训练的人脸图像。矩阵运算中,每幅人脸图像就是一个行向量,行向量的维数为其包含的像点数。在对图像进行ICA前,必须对图像进行预处理。 最基本的预处理是将X减去其均值,得到均值为零的X,如下式: (3-5) 此过程称为中心化,仅仅为了简化运算。在估计出混合矩阵 后,中心化得到的源信号 可以重新获得它的均值 (3-6) 在应用ICA之前,还有一个重要的预处理就是将观测数据白化。所谓白化,是指各分量间互不相关,且每个分量的能量是归一化的,即 (3-7) (3-8) 根据统计独立的概念,不相关是独立的必要条件,而不是一个充分条件。源信号就是白化信号,对于独立的源信号S=(sl,s2,…,sN)T,各分量必然是不相关的,所以有: (3-9) 因为在ICA的输出结果中,被提取出分量的幅度具有不确定性,某个分量s1乘上一个系数所产生的作用,只需让混合矩阵A对应的列向量a1除以一个相同的数就可抵消。所以简单起见,不妨假设独立源的能量是归一的。 (3-10) 其中U是由E{XXT }的特征向量组成的正交矩阵,是由特征值组成的对角阵,。白化对应的变换矩阵就是,称之为白化矩阵。白化后的数据为: (3-11) 其中可由其对角线上的特征值开平方求得,,可以验证,过程如下: (3-12) (3-13) (3-14) (3-15) 由白化数据计算得到混合矩阵为,由混合矩阵的定义得到: (3.16) 数据的白化使得新的混合矩阵是正交的,如下式: (3-17) 由于的正交性,需要估计的参数由一般矩阵包含的N2个元素,减少到正交矩阵包含的N(N-1)/2个元素,元素个数几乎减少了一半。由此可见,白化这种常规方法作为ICA的预处理可以有效的降低问题的复杂度,降低了过学习(Overlearning)的可能性(这是ICA中可能遇到的问题),而且运算简单。下文中所指的X、A均指经过预处理的、。 3.3.2基于独立分量分析的人脸特征提取 本文2.2.2节可知,PCA方法有以下优点: a.可以完全去除原始样本间的相关性; b.进行数据压缩时,所得到的均方误差最小,而且该均方误差等于所舍去的特征值之和; c.若将n个特征值按大小顺序排列λ1≥λ2≥…≥λn,那么将λm+1,λm+2,…,λn舍去后,余下的λ1,λ2,…,λm就保留了最大的能量,样本经过K一L变换之后,仍保留原样本的最大能量。 PCA所获得特征空间能够很好的表示人脸,但是此特征空间是二阶不相关的,高阶仍然相关,而且它所提取的特征向量只呈现出人脸的形状。在人脸识别这样的应用中,由于人脸几何特征以及人脸部件的特殊性,如果提取的特征具有区域性和高阶不相关性,那么识别率将获得提高。而这正是ICA方法的理论优势所在。本文3.2.2节可知,由ICA算法提取的特征空间的特征向量个数总是和输入样本数据的个数相当,所以当输入样本个数非常庞大时,会造成严重计算负担。由图3-2可知,假设X中的人脸图像是一组未知统计独立源的线性组合,所以即使用X中人脸图像的某种其他线性组合来取代原始人脸图像不会有什么影响。这为本文在对图像数据进行ICA之前,采用PCA降维提供了理论基础。 本文采用训练图像数据的前m个主元(principle component一PC)近似原数据。由于PCA的局限性,此m个主元仍包含象点间的高阶统计特性,此特性只能由ICA分离出来。设Pm表示前m个特征值对应的特征向量组成的矩阵,每个主分量为一列。PmT包含原训练样本矩阵X的最可能多的能量,认为它近似于X。对PmT执行ICA算法如下: (3-18) 基于Pm可以得到X中一组零均值图像的主分量表示: (3-19) 则X的在最小均方误差准则下的近似重构为: (3-20) 由ICA算法训练得到分离矩阵W: (3-21) 其中为白化矩阵,得到源信号的估计Y (3-22) 因此可以得到: (3-23) 式(3.24)表示,矩阵每一行包含的系数就是由统计独立的特征图像Y线性组合构成的系数。于是,人脸图像的独立分量表示可由如下矩阵中的行向量给出: (3-24) 对待识别的人脸图像,基于独立分量表示为: (3-25) 这样高维的人脸图像数据,经过以PCA为基础的ICA提取特征后,就可以在低维的ICA特征空间进行识别分类了。 3.3.3独立分量的排序及选择 PCA提取的特征向量对应不同的特征值λi,并且按照特征值的大小排序。若要使得重构数据满足最小均方误差准则,选择前m个特征值对应的特征向量即可。由本文3.2.2节可知,经ICA提取的独立分量存在排序的不确定性,所以选择独立分量存在困难。本节根据特征不同的分类能力(Class discriminability)选择独立分量,也就是说选择的独立分量满足下列原则:既可以反映同一个人不同图像间的相似性;又能反映不同人图像之间的差异性。本文通过ICA估计得到的混合矩阵A来选择独立分量子集。所采用的原则是是选择A中那些类内散布与类间散布比率最小的那些混合特征所对应的独立分量。 假设训练中我们采用了N个人的人脸图像,每人具有M张。组成训练矩阵时,每人的M张图像相邻,以方便计算。混合矩阵B给出的是每个独立分量的加权系数。aij表示A中第i行,第j列的元素,则下式中的表示第j列的类内距离的均值。 (3-26) 第j列的类间距离的均值,如下式 (3-27) 其中, (3-28) 向量的分类能力γj由类内距离和类间距离的比率给出: (3-29) 由特征选择的原则可知,γj的值越大,分类能力就越强。我们按照γj值的大小,按降序重新排列A的列向量和S的行向量,得到A΄和S΄。选择A΄的前k列和相应S΄的前k行相乘就获得了新的人脸特征。该特征既能描述同一对象人脸图像间的相似性,又能区别不同对象的人脸。 3.3.4基于ICA系数的人脸分类识别 本文基于ICA获得的最适合人脸识别的特征子空间之后,就可以利用待识别的人脸图像在此特征空间的投影系数(即ICA系数)进行分类识别了。传统的欧氏距离容易受到图像光线、噪声等整体干扰因素的影响。鉴于改进的相似测度提高了特征脸法的识别性能,本文也采用两个坐标向量夹角的余弦值作为相似测度,然后以最近邻法或SVM分类器,进行人脸识别,实验结果表明与欧氏距离相比,角度距离更适合人脸识别的结果依然成立,SVM可以一定程度上改善识别效果,但不如相似性测度的改进那般明显。 3.4独立分量分析的算法研究 相比PCA的简单快捷,ICA存在以下不足:反复运算,运算速度慢,难收敛。由本文3.2.2节I以的线性模型的描述可知,ICA问题的求解即寻找一个适合观测矢量X的变换,使得变换后的新矢量Y成为各分量相互独立的随机矢量。判别信号是否相互独立,实际是很困难的。因为多维随机过程的相互独立,涉及各分量之间所有阶次的统计量如高阶累积量,而要估计三阶以上的统计量计算量就较大。近年来,研究人员发展了很多有效的工以算法,可参考文献[50][51]。 目前主要的ICA算法,大致可分为两类:第一类基于高阶累积量,使所谓的比较函数最大值或最小值的求解。此类算法的问题在于需要计算复杂的矩阵和张量函数。第二类基于随机梯度函数,主要采用自适应算法,主要不足在于收敛慢。其中信息最大化(Informax)方法是应用最早,也是最广泛的ICA算法。本文尝试将基于定点(fixed一point)迭代的FastICA算法应用与人脸识别的特征提取中,该方法运算效率高,收敛快,在盲源分离中获得了成功的应用。 ICA方法的具体实现包括两个方面,一是确定目标函数,二是选择优化算法。由3.2节ICA的基础理论可知,工以以统计独立为基本原则,所以如何衡量独立性是一切ICA算法必须面临的根本问题,这就要求选择一个恰当的目标函数。对于同一个目标函数可以不同的优化算法。常见的优化算法主要有梯度法以及牛顿迭代法等。ICA算法的优劣不仅取决于目标函数的选择,而且还与优化算法的性能有着很大的关系。衡量一个优化算法的主要性能指标有收敛速度,占用内存情况,稳定性。 3.4.1 Informax算法 1995年Bell和sejnowski提出的Informax算法[52]是一种自组织神经网络算法,该算法的目标函数是输出分量的联合微分嫡,当网络选择适合的非线性函数时,它的最大化可以导致互信息最小。Informax算法的推导是基于一个简单的神经网络结构,砰为网络权值,代表分离系统,分离系统的输出与网络输出之间逐个存在单个分量的非线性映射zi=gi(yi),g(∙)=(g1(∙),g2(∙),…,gN(∙))T。Informax认为判断输出分量独立性的对照问题相当于使得输出联合墒H(z)最大。H(z)最大化意味互信息I(y)最小化,即网络输出各分量统计独立。 最大化H(z)取决于两个参数:一是非线性函数gi(yi),一是网络权值的更新。在Informax算法中,gi(yi)一般选取为logistic函数,即 (3-30) 网络的连接权值W,通过随机梯度法得到。Informax算法的具体迭代过程如下。 根据概率论中有关随机变量函数的计算方法,以及信息论中有关联合墒的定义可知 (3-31) 等式两边对W求导: (3-32) 式(3.33)中左边第一项H(x)与W无关,故求导为零,第二项为下式。 (3-33) 此外,第三项中令 (3-34) 其中 (3-35) 称为评价函数(Score function)。将式(3-33)和式(3-34)代入式(3-35)可得到: (3-36) 得到一个梯度更新值: (3-37) 其中η为学习率或称为步长因子。由于式(3-37)中的矩阵求逆极大程度上影响了算法的收敛速度,所以式(3-37)右乘WTW得到原联合嫡梯度的相对梯度 (3-38) 所以w的学习规则如下: (3-39) 其中步长因子影响着收敛速度和收敛的准确性,所以取值非常关键。Informax算法属于传统的ICA算法,它只有线性的收敛速度,并且该算法需要在学习的同时人工调整步长参数,使得算法收敛,所以操作起来不是很方便。 3.4.2 Fast ICA算法及其改进 FastICA算法源于在盲源分离中的成功应用,该算法的基本原理在于通过系统学习寻找一个方向,即单位矢量w,使得其投影wTX具有最大的非高斯性。非高斯性采用负墒J来衡量。假设H(y)为随机变量y的墒,根据最大嫡定理[48],在所有具有相同协方差矩阵的分布中,高斯分布的嫡最大。ICA的线性模型中,观测信号是多个独立源信号的线性组合,所以其高斯性比源信号的高斯性要强。换言之,源信号就是ICA希望估计出的非高斯性比观测信号要强的信号,即非高斯性越强就越独立,这就为ICA分离信号提供了依据。 负嫡定义如下: (3-40) 其中为具有和y同方差的高斯随机变量。根据最大嫡定理,高斯变量在所有相同方差的随机变量中,嫡最大,所以非高斯性最大即负嫡J(y)最大。采用基于最大嫡原理的负嫡近似 (3-41) 其中,Ki为一正常数,Gi为非二次函数,它的选取可参考文献[52],v为均值为零、方差为一的高斯变量。只使用一个非二次方程式G的负嫡近似如下: (3-42) FastICA算法利用定点迭代(Fixed-Point iteration)来寻求负嫡的最大值,也可以看作是近似的牛顿迭代的推广。该算法每次只从观测信号中分离出一个独立分量,下列过程为计算一个分量的定点算法。 首先,在E{G(wTX)}的某种优化下,可以得到wTX的负嫡近似的最大值。根据Kuhn一Tuckert条件[53],在约束条件E{wTX}=||w||2=1下,E{G(wTx)}的优化(极值点)在下述条件下得到: (3-43) 其中g为G的导数,β=E{w0TXg(w0TX)},w0为w在极值点的取值。式(3-43)用牛顿迭代法(Newton,method)求解。设式(3-43)的左边为F(w),其雅可比矩阵(Jacobian matrix)J(w)由下式得到: (3-44) 己知数据是球化的,可得到以下近似: (3-45) 则雅可比矩阵是非奇异对角阵,逆矩阵存在,用此时w的值代替w0,求得β的近似值。下式为非线性方程的牛顿迭代法近似求解: (3-46) 则FastICA的基本步骤如下: a.选择初始随机权值w0; b.(3-47) c. (3-48) 4. 重复步骤2、3直至收敛。收敛意味着w的更新值与原值趋近方向相同,此迭代算法必收敛,证明见参考文献[53]。 本文对FastICA的改进,基于以下考虑,分析迭代过程中的中间结果发现,雅可比矩阵的数值变化不大,并且迭代过程中最耗时的环节为雅可比矩阵求逆,如能减少雅可比矩阵求逆的次数,必将达到加快运算速度的目的。一般对牛顿迭代法的改进为每次使用同一个雅可比矩阵的逆。 令: (3-49) 则: (3-50) 但该方法使得FasliCA算法的收敛速度受到了极大影响。本文以此受到启发,将此迭代过程改为每m次迭代求一次雅可比矩阵的逆,过程如下: (3-51) (3-52) (3-53) 以上改进减少了矩阵求逆的次数,又保证了收敛,换一个角度看,如果它的迭代次数与牛顿法相同,则它的收敛阶为m+1阶[56]。 作为特例,当m=2时(m至少为2),上述改进的迭代过程如下: (3-54) 将F(wk)和J(wk)的内容代入式(3-54),即得到改进的FastICA(M一FastICA)算法的迭代过程,其基本形式如下: a.选择初始随机权值w0; b.利用式(3-54)更新wk+1; c. (3-55) d.重复步骤2、3直至收敛,这样就估算出了一个独立分量。 此迭代方式,具有3阶的收敛速度。当m取值不同,有更快的收敛速度。利用同样的迭代过程,将式(3-47)改为矩阵形式,可以得到FastICA算法的类似神经网络的并行FastICA算法,可并行估计出所有的分量。 本文的FastICA的改进算法,由于将若干次雅可比矩阵求逆一次完成,所以极大的减少了运算量,加快了收敛速度。值得注意的是,FastICA算法必须事先对输入数据X进行球化,此过程己由图像预处理完成。 3.5实验结果及分析 本节主要在ORL人脸库和Yale人脸库中测试基于ICA的人脸识别方法的性能,训练库与测试库的组成参照第二章的2.4节,实验内容主要包括以下几个方面。 a.不同的特征提取方法(PCA与ICA)所提取的特征,分类能力的比较; b.用角度距离代替欧氏距离和用SVM分类器代替最近邻法对识别性能的影响; c.不同的ICA算法(Informax、FastICA、M-FastICA)的收敛速度的比较; 首先为了比较ICA和PCA所提取特征的分类能力,本文采用3.3.3节介绍的γ指标,因为它既可以反映除同一个人不同图像间的相似性,又能反映不同人图像之间的差异性,计算结果如图3.4(训练集为ORL人脸库)。其中横轴为提取排在前面的特征的数目(参考3.3.3节),纵轴为对应的γ的值。实验结果说明,ICA的特征选择要优于PCA的特征选择,所提取的特征分类能力比PCA特征强。 为了比较不同的特征选择在人脸识别中的影响,本文测试了在不同数目特征选择下的识别率,如图3.5(训练集为ORL人脸库)。图中,ICA的特征选择可以一定程度的提高识别性能,在选择特征个数为40(人脸库的对象个数)时,识别率达到最高值。之后,识别率迅速下降。与ICA不同,基于PCA的特征选择,随着特征数目的减少,识别率一定是减少的。实验结果表明:PCA提取人脸特征,特征值大的特征向量(即特征脸),并不一定是分类性能最好的特征。本文中所选择的ICA特征,排在前面的是分类性能最强的人脸特征。 图3-4 PCA和ICA提取的特征的分类能力比较 图3-5特征选取对识别率的影响 本文2.4节中,比较了相似度测量和分类器的改进对特征脸法的影响,下面给出以上两个方面的改进对基于ICA人脸识别方法的影响,如表3-1。 表3-1相似性测度和分类器的改进对基于ICA人脸识别方法的影响 实验表明在人脸识别中角度的相似性测度优于欧氏距离,结论依然成立。实验结果同时指出ICA的人脸特征提取方法对分类器选择不敏感。基于ICA的人脸识别方法的鲁棒性优于PCA方法,识别率也提高了。与特征脸法在不同人脸库中的测试结果(参考表2.1)比较可知,基于ICA的人脸识别方法在Yale人脸库中,识别率获得了较大提高(近10%)。Yale人脸库的主要特点是光照变化明显,所以得出结论基于ICA的人脸识别方法对光照变化不敏感。 ICA的不足在于运算速度慢,难收敛,本文将FastICA算法应用到人脸特征提取中,并将其关键步骤加以改进,下面的实验将主要比较本文采用的ICA快速算法与传统ICA算法(Informax)的运算性能比较,在ORL人脸库中的获得相应识别效果时的不同ICA算法的迭代次数如表3-2。 表3-2不同ICA算法的迭代次数比较表 必须要说明的是Informax算法的70次迭代次数是步长因子μ取值0.0008、0.0007、0.0006、0.0005、0.0004、0.0003、0.0002、0.0001、0.00005和0.00003时,迭代次数为7的总和。该算法的收敛需要不断调整学习速率和每次的迭代次数,对比识别结果获得。可见Informax算法需要人工参与调整收敛速度,运算复杂。相比FastICA算法和M一FastICA算法则不需要调整学习速度,整个过程是完全自动化的。实验结果表明,这两种算法与传统ICA算法相比,减少了迭代次数、加快了收敛速度、提高了算法的自动化程度。 3.6 本章小结 常见的线性变换技术,如PCA、SVD、投影法等,都是建立在协方差矩阵的基础上,所以这些分析方法仅限于二阶统计特性。在这些方法中,PCA应用最为广泛。经PCA方法得到的各个分量是互不相关的,换言之,PCA去除了信号间的二阶相关性。但是经过了PCA方法处理,各分量之间仍有可能存在着高阶统计意义上的相关信息。统计独立[48]是ICA中的一个核心概念,也是ICA模型的个最基本的假设。统计独立要求高阶统计不相关,所有它是一种更加苛刻的条件,正因为此,ICA方法成为PCA的一个推广。ICA与PCA方法相比,有着明显的优点表现在以下方面: a. ICA去除训练信号的高阶统计量的相关性,而PCA方法则仅仅能够去除二阶统计相关性,ICA的特征提取和压缩能力更高; b. ICA基向量比PCA基向量在空间上更局部化,而局部特征对人脸的识别很重要。ICA更侧重于提取人脸的细节特征,突出的是人脸之间的“差异”,而PCA方法更注重于人脸在低维空间的重建,突出的是人脸的二次表达,重在人脸的共性信息的保留; c. 本章的实验结果和文献[49]的实验都表明,基于ICA独立分量的识别精度比PCA主分量要高。 针对ICA得到的独立元排序的不确定性,给特征选择造成了一定困难,本文引入特征的分类能力γ,以此作为特征排序选择的依据,所获得的特征集合能较好的描述类间差异,又能描述类内的相似性。 针对ICA算法运算速度慢,收敛难的不足,本文将FastICA算法作为ICA快速算法,并且进一步优化关键迭代环节,提出了改进的FastICA算法。该算法在不影响识别性能的前提下,加快了运算速度。M-FastICA算法有以下优点。 a. M一FastICA收敛阶最多可达到m+l阶[56-57],而FastICA算法的收敛阶是2至3阶的[53],一般ICA算法其收敛是线性的[53],因此,M一FastICA算法有非常快的收敛速度; b. 同Informax算法相比,M一FastICA算法不需要选择步长因子参数,算法更易实现,也更可靠; c. 大多数ICA算法是并行计算出整个混合矩阵的,而FastICA算法既有并行算法,又可以一次只估算一个独立分量,这样可以选择某个需要估计的独立分量,提高了算法的效率和灵活性; d. M-FastICA算法加快了FastICA的收敛速度,同时继承了FastICA并行、分布式、计算简单、需要内存小等优点[53]。 与特征脸法容易受到光照等因素影响相比,基于ICA的人脸识别方法对光照变化具有一定的鲁棒性,对人脸细节敏感。这与ICA去除了特征间的二阶相关性,获得了相互独立的基向量,所以ICA提取的特征对高阶统计量敏感的理论分析是相符合的。实验结果同时表明基于ICA的人脸识别方法对表情变化敏感,如图3-6。图中(a)列待识别图像因为表情变化大,而未能正确识别。ICA的这一特点己应用在人脸的表情分析中[53]。 图3.6Yale人脸库中错误识别示例 (a)列为错误识别示例(b)列为正确识别结果 基于ICA的人脸识别方法与基于PCA的人脸识别方法一样,未能利用人脸结构方面的相似性。本文在下一章将HMM应用到人脸建模中,因为该模型较好利用了人脸具有的相似结构,并且当观测值在一定范围变化时,对应状态不变,同时该模型具有分类器功能。 第4章 基于隐马尔可夫模型的人脸识别方法 4.1 引言 隐马尔可夫模型(Hidden Markov Models,HMM),起源于二十世纪六十年代后期,属于信号统计理论模型,能够很好的处理随机时序数据的识别与检测。PCA与ICA作为统计理论的信号处理技术,目的是将观察到的数据进行某种线性变换,从而用低维的子空间参数描述高维的数据特征。隐马尔可夫模型是将随机时序数据的统计特性,用一个模型的参数来描述,模型参数通过训练样本的统计学习获得。HMM最早应用在语音识别中,若将时序序列看成应用对象的特征序列,HMM也可以应用到其他领域,如音频处理、手写体识别、图像与视觉处理等,参考Olivier所写的“Ten years of HMMs”[58]。 最早将HMM应用于人脸识别的文献可参见[59-60],根据人脸由上至下各个区域具有自然不变的顺序,这一稳定的相似共性,个人特征仅表现在上述组成部分的形状及其相互连接关系不同,即可用一个一维HMM(1D-HMM)表示人脸。进一步研究表明人脸水平方向从左至右也具有相对稳定的空间结构,因此可将沿垂直方向划分的状态分别扩充为一个1D-HMM,共同组成了一个P2D-HMM。该模型可以更加精确的描述和定义具体人脸的个人特征,是较好的描述和识别人脸的数学模型。 采用P2D-HMM进行人脸识别时,精确度增加了很多,识别率提高了,训练和识别的复杂度也增加了很多,所以考虑继续改善其模型结构。支持向量机(Support Vector Mahcines,SVM)源于统计学习理论,它使用结构风险最小化(SRM)原理构造决策超平面使每一类数据之间的分类间隔最大。所以本文使用SVM取代高斯分布函数或者状态映射矩阵建立与HMM的混合模型,每个人脸器官通过VSM进行识别,混合模型的总体结构仅相当于一个1D-HMM,减少了训练识别的时间,但获得了与P2D-HMM相当的识别精度。 本章首先介绍了HMM是如何由Markov链发展而来的,并且介绍了二者的区别和MHM的基本理论,包括HMM的模型和HMM中涉及的三大问题;其次介绍了基于HMM人脸识别方法的基本原理和系统概况;然后分别介绍了基于1D-HMM的人脸识别方法、基于P2D-HMM的人脸识别方法以及基于ICA特征和SVM/HMM的人脸识别方法,本章最后比较了不同模型的识别性能。 4.2 隐马尔可夫模型的理论基础 隐马尔可夫模型属于信号统计理论模型,能够很好的处理随机时序数据的识别与预测。HMM是由马尔可夫链(Markov链)发展而来的。 4.2.1马尔可夫链 马尔可夫链是马尔可夫随机过程的特殊情况,即Markov链是状态和时间参数都离散的Markov过程。从数学上,可以给出如下定义: 随机序列Xn,在任一时刻n,它可以处在状态θ1,θ2,…,θN,且它在m+k时刻所处的状态为qm+k的概率,只与它在m时刻的状态qm有关,而与m时刻以前它所处状态无关,既有: (4-1) (4-2) 其中,ql,q2,…,qm,…,qm+1∈ (θ1,θ2,…,θN)。 则称Xn为Markov链,并且称 (4-3) 为k步转移概率,当pij(m,m+k)与m无关时,称这个Markov链为齐次Markov链,此时 (4-4) 以后若无特别申明,Markov链就是指齐次Markov链。当k=1时,pij(1)称为一步转移概率,简称为转移概率,记为aij,所有转移概率aij,1≤i,j≤N可以构成一个转移矩阵,即 (4-5) 且有 (4-6) 由于k步转移概率Pij(k)可由转移概率aij得到,因此,描述Markov链的最重要参数就是转移概率矩阵A。但A矩阵还决定不了初始分布,即由A求不出q1=θi的概率,这样,完全描述Markov链,除A矩阵外,还必须引入初始概率矢量∏=(π1,…,πN),其中 (4-7) 显然有 (4-8) 实际中,Markov链的每一个状态对应于一个可观测到的物理事件,比如天气预测中的雨、晴、雪等,那么根据这个天气预报的Markov链模型,可以计算出各种天气(即状态)在某一时刻出现的概率。但更普遍的情况下,实际的状态并不能直接观测到,所以隐马尔可夫模型由此发展起来。 4.2.2隐马尔可夫模型 隐马尔可夫模型是在马尔可夫链的基础之上发展起来的。由于实际问题比Markov链模型描述的更为复杂,观察到的事件并不是与状态一一对应的,而是通过一组概率分布相联系,这样的模型就称之为HMM。HMM是一个双重随机过程,其一是Markov链,它是最基本的随机过程,描述状态的转移。另一个随机过程描述状态和观察值之间的统计对应关系。这样,以观察者的角度,只能看到观察值,而非Markov链模型中的观察值与状态一一对应的关系,因此,不能直接看到状态,而是通过一个随机过程去感知状态的存在及其特性。 HMM可看作由两层构成: a. 隐含层,它由有限个状态,状态转移矩阵A和初始状态概率分布∏组成; b. 映射层,它表示每个状态对应观测数据的映射,可以用状态变换矩阵B,或者一系列概率密度函数表示,分别对应离散的HMM和连续的HMM。根据人脸至上而下,从左至右下具有的共性结构,本文采用1D-HMM和P2D-HMM描述人脸,下面分别介绍组成1D-HMM和P2D-HMM的主要参数。 1D-HMM由N,A,B,∏参数组成,简写为λ={N,A,B,∏}。各参数的含义如下: • N,表示模型的状态个数; • A={aij},其中1≤i,j≤N,表示状态转移概率矩阵; • B={bj(∙)},其中1≤j≤N,表示输出概率函数; • ∏={πj},其中1≤j≤N,表示初始状态概率分布。 己知模型λ,观察序列O=o1…oT,Q为所有可能状态序列的集合,观察序列的联合概率计算如下式: (4-9) P2D-HMM可看作是1D-HMM的扩充,即在1D-HMM的每个状态中嵌入一个1D-HMM,该状态被改称为超状态。P2D-HMM由N,A,∏,Λ参数组成,简写为兄={N,A,∏,Λ}。各参数的含义如下: • N,表示垂直方向超状态的个数; • A={aKJ},其中1≤k,j≤N,表示超状态转移概率矩阵; • ∏={πJ},其中1≤j≤N,表示超状态的初始概率分布; • Λ={λJ},其中1≤j≤N,表示嵌入每个超状态的ID-HMM,每个λJ都具有一标准的1D-HMM所必需的参数; • NJ,表示状态个数; • Aj={aKjJ},其中1≤k,i≤NJ,表示状态转移概率矩阵; • BJ={bij(∙)},其中1≤i≤NJ,表示输出概率函数; • ∏J={π1J},其中1≤i≤NJ,表示初始状态概率分布。 已知模型λ,观察序列O=o11…oTrTs,QY为垂直方向的所以可能状态,QXj为超状态j对应的水平方向的所以可能状态,联合概率的计算如下式: (4-10) 其中, 4.2.3 隐马尔可夫模型中的三大问题 欲使所建立的隐马尔可夫模型能解决实际问题,以下三个问题必须加以解决: 问题1: 己知观察序列O和模型λ={N,A,B,∏ },如何计算由此模型产生此观察序列的概率P{O|λ}? 问题2:己知观察序列O和模型λ={N,A,B,∏},如何确定一个合理的状态序列,使其能最佳的产生O,即如何选择最佳的状态序列Q=q1,q2,…,qT? 问题3:如何根据观察序列不断修正模型参数A,B,∏,使P{O|λ}最大? 问题1实质上是一个模型评估问题,因为P{O|λ}反映了观察序列与模型吻合的程度。在模式识别中,可以通过计算、比较P{O|λ},从多个模型参数中选择出与观察序列匹配的最好的那个模型,这也是HMM用于模式识别的原理所在。为了解决这个问题,前人已研究出了“前向一后向”算法(Forward-Backward Algorithm)。 问题2的关键在于选用怎样的最佳准则来决定状态的转移。一种可能的最佳准则是:选择状态qi,使它们在各t时刻都是最可能的状态,即 (4-11) 有时存在这样的问题:如出现不允许的转移,即aij=0,那么,对这些i和j所得到的状态序列就是不可能状态序列。也就是说,上式得到的解只是在每个时刻决定一个最可能的状态,而没有考虑整体结构,相邻时间的状态和观察序列的长度等问题。针对这个缺点要求人们研究一种在最佳状态序列基础上的整体约束的最佳准则,并用此准则找出一条最好的状态序列。目前,解决这个问题的最好 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 是Vietbri算法。 问题3实质上就是如何训练模型,估计、优化模型参数的问题。这个问题在三个问题中最难,因为没有解析法可用来求解最大似然模型,所以只能使用叠代法(如:Baum一Welch算法)或使用最佳梯度法。 在4.4和4.5节中,本文将以不同HMM的人脸识别方法为例具体介绍“前向一后向算法”、Vitebri算法和Baum-Welch算法在模式识别中的具体应用,有关以上三种算法的详细内容可以参考文献[60]。 4.2.4隐马尔可夫模型的类型 根据观测值的取值不同,HMM可分为离散的和连续的。本文4.2.2节介绍的HMM,如果其观测值是M个离散可数的观察值中的一个,则称之为离散HMM,某个状态qj对应的观察值的统计特性是由一组概率bJK,k=1,…,M来描述。连续的MMH,指观察值的可能取值只能用一个概率密度函数bJ(q)表示。 根据状态转移的类型不同,HMM可分为遍历的(Ergodic)和从左到右的(Left-to-right,又称从上至下的Top-to-bottom)。前者表示状态转移是任意的,可以到本身和其他所有状态,如图4-1(a)。后者表示状态转移只限于本身和下一个状态,如图4-1(b)。人脸由于各个区域(头发、额头、眼睛、鼻子和嘴巴)具有自然不变的顺序,通常采用从左到右型的HMM。 图4-1几种典型的马尔可夫链示意图 (a)四状态遍历型马尔可夫链(b)四状态由左至右型马尔可夫链 4.3 基于隐马尔可夫模型的人脸识别方法概述 4.3.1 基于HMM人脸识别的基本原理 根据人脸由上至下各个区域(头发、额头、眼睛、鼻子和嘴巴)具有自然不变的顺序,个人特征仅表现在上述组成部分的形状及其相互连接关系不同,即可用一个1D-HMM表示人脸,如图4-2(a)。上述人脸5个部分的人脸特征对应HMM的状态序列,状态的出现及其转移可用模型中的概率矩阵描述,提取图像的象素点亮度值(或其他特征)作为观测序列。对于既定的人脸,所对应的HMM应当是唯一的。进一步研究表明人脸水平方向从左至右也具有相对稳定的空间结构,因此可将沿垂直方向划分的状态分别扩充为一个1D-HMM。垂直方向的状态就称为超状态,水平方向嵌入的状态就称为子状态,共同组成了一个P2D-HMM,如图4-2(b) 图4-2 用HMM建立人脸模型的基本原理图 (a)1D−HMM人脸模型 (b)P2D−HMM人脸模型 4.3.2 基于HMM人脸识别的系统概述 基于HMM的人脸识别系统,必须首先选择HMM的结构(是1D-HMM,还是P2D-HMM)。HMM的结构不同使得特征提取、模型训练和识别中基本算法和系统结构都会有所不同,但关于图像的预处理和最后的决策方法都是相同的。本文首先介绍对输入图像的预处理和决策方法,关于特征提取、模型训练的具体算法将在基于1D-HMM和P2D-HMM人脸识别方法时分别介绍。图4-3为基于HMM人脸识别系统的原理图,其中“Common HMM”代表人脸的普遍结构,由训练集中所有人脸图像获得,它的作用主要有以下两个方面:一作为各个对象的人脸模型训练的初始化参数,可以极大提高收敛速度;二是完成对人脸库中不存在的新对象(New Sub ject)的拒识(Re ject)。 如果输入的是一幅彩色图像,比如RGB颜色模式图像,预处理阶段首先将其转换为YCbCr颜色模型,然后进行肤色初筛,得到人脸的可能区域,最后归一化成方块灰度图像后,就可以用条状或块状窗进行一定步长的遍历扫描,提取特征序列了。本文采用层次结构的判决来完成人脸的识别,如图4-4。首先通过计算特征序列O在“Common HMM”模型参λcommon下的概率P(O|λcommon),判别是否人脸。若是,再计算特征序列在各个对象MHM模型参数λi下的概率P(O|λi ),与P(O|λcommon) 比较,判别是否库中己有对象的人脸,若是,输出max{P(O|λi)}的对象标号i。 图4-3人脸识别系统原理图 图4.4层次结构的决策原理图 4.4基于一维隐马尔可夫模型的人脸识别方法 上文介绍了用HMM建立人脸模型的基本原理和基于MHM人脸识别系统的概况,以下介绍关于基于1D-HMM人脸特征提取、模型训练的具体算法。 4.4.1特征提取 1D-HMM对人脸图像区域提取观察序列,采用条状窗口从上至下的遍历扫描,如图4-5。文献[70]采用每个窗口所含象素的灰度值作为观察向量,维数太高,且对影响识别的光线、角度等因素敏感。所以本文选取每个窗口的K-L变换(即PCA)系数作为观察向量。也可以提取二维离散傅立叶变换(即2D-DCT)系数作为观察向量。考虑到K-L变换系数是均方误差意义下的最佳变换,实验中识别效果比2D-DCT系数略好些,参见[60][61]。所以本文在结构较简单的1D-HMM人脸识别中提取CPA系数作为观察向量。而在基于P2D-HMM人脸识别中,本文提取2D-DCT系数作为特征向量,主要鉴于与JPGE图像压缩标准兼容,且有快速算法。 图4-5 条状窗口对图像从上至下的遍历扫面示意图 图4-6 由左至右依次为头发,额头,眼睛,鼻子和嘴对应的典型KLT系数 条状窗口扫描得到的象素灰度值,排列成一列向量,维数为LxX,所有的M个样本构成(LxX)xM的矩阵。求得它的协方差矩阵和前十个最大的特征根,重新构造特征空间。提取的特征就为扫描窗所含象素灰度值在这个特征空间的投影的系数。图4-6就是对应人脸特征区域(如头发、额头、眼睛、鼻子和嘴)的典型观察向量。 4.4.2模型训练 扫描整幅图像得到T个观察向量,构成观察序列。为了使得观察序列能与真实的状态转移对应起来,还必须对用Viterbi算法和K均值聚类对序列分段。Viterbi算法用来寻找观测序列O=(ol,o2,…,oT)对应的最佳状态序列Q=(q1,q2,…,qT),并且计算在最佳状态序列条件下的概率。定义变量: (4-12) 具体算法如下: a.初始化: (4-13) b.递推: (4-14) (4-15) c. 终止: (4-16) d. 最佳状态序列: (4-17) 本文将已分段的序列输入初始化的HMM,首先用Forward-Backward算法求得前向概率αi(j)和后向概率βi(j),再用Buam-welch算法进行反复参数重估直至收敛,这样就得到训练人脸样本的HMM。重估过程如下:定义ξi(i,j)表示在己知观察序列O和模型λ的情况下,t时刻处于状态i,t+1时刻处于状态j的概率,定义γi(i)为给定观察序列O和模型λ的条件下。t时刻处于状态i的概率。表示在观察序列中,从状态i出发的状态转移次数的期望,表示观察序列中,从状态i到j的状态转移次数的期望,可知 (4-18) (4-19) 模型中的三个参数的重估结果如下式: (4-20) 然后计算P(O|λ),反复重估参数至收敛,得到训练样本的1D-HMM人脸模型。 4.4.3分类识别 HMM本身就是一个分类器。以ORL人脸库为例,首先划分训练集和测试集,然后将训练集中的图像分对象分别训练,得到每个对象的人脸HMM模型。人脸识别时,测试集中任取一幅图像,先通过条状窗扫描获得观测序列,即提取的人脸特征,然后用Forward-Backward算法计算待测区域提取的观察向量在不同对象的1D-HMM参数下的概率,实际中一般用Viterbi算法计算概率,这样运算速度比较快。最后通过比较概率的大小即可作出决策。 分析基于1D-HMM的人脸识别过程,影响识别效果可能有以下因素:状态数N、窗口宽度L,扫描重叠宽度M。文献[62]就以上因素对人脸识别性能进行了详细比较和分析,本文也认为取5个状态分别对应人脸的前额、眼睛、鼻子、嘴和下巴,描述和代表人脸的宏观特征理论是比较合理的,识别性能也最好。并且对于窗口宽度L,只要重叠宽度M足够大,对识别性能影响不大。重叠宽度大,识别效果好,通常取M=L-1。本文的识别系统最终选取N=5、L=8、M=7的扫描方式。 4.5 基于伪二维隐马尔可夫模型的人脸识别方法 P2D-HMM最早应用在字符识别中,参见[63],后来证明用它描述二维图像也是行之有效的。图4-2所示的拓扑结构说明了用P2D-HMM建立人脸模型的原理,它和用1D-HMM人脸模型的区别在于它不但能表现人脸从上至下的空间结构,还能表现水平方向从左至右的空间结构,表现在HMM结构中使用1D-HMM替代超状态的概率分布。同时因为水平方向的状态变化仅限于超状态内,所以分析处理比真正二维的隐马尔可夫模型(2D-HMM)简单。文献[62]中曾对不同状态数的模型人脸识别性能进行了详细比较和分析。本文选取5个超状态分别对应人脸的宏观特征,每个超状态内嵌入的状态分别提取人脸的局部区域特征,嵌入状态数取(3,6,6,6,3)的结构具有较好的识别精度,如图4-2(b)。 图4-7块状窗对图像从左到右、从上至下的遍历扫描示意图 X为图像的水平像素点总数; Y为图像的垂直像素点总数; M为从上到下遍历扫描的步长; Q为从左到右遍历扫描的步一长; L为从上至下扫描的块状窗口在垂直方向的长度; P为从上至下扫描的块状窗口在水平方向的长度; T为遍历扫描的窗口数; 为了更好的提取人脸的二维空间特征,P2D-HMM观察序列采用块状窗遍历扫描方法,如图4-7。在人脸图像和可能含人脸的待检测区域,用含象素点数为PxL的扫描窗从左到右、由上至下滑动,获取观察图像块。相邻窗口在垂直方向和水平方向分别有M行、Q列重叠。如果直接取采样窗内的象素点灰度值构造观察向量,同样存在维数太大,易受噪声干扰的缺点。本文选取8x8的扫描窗,做2D-DCT变换,得到8x8的2D-DCT系数。DCT变换如下式: (4.21) 用三角窗取DCT系数矩阵的前15个系数,就得到了一个观察向量。若采用16x16的扫描窗,得到的识别效果与8x8相近,但是8x8的扫描窗与JEPG标准兼容,观察向量维数少。这样提取DCT系数作为观察向量,对JPEG压缩的人脸图像可以直接在压缩域进行识别,无需解压,如图4-8。 图4-8压缩域上人脸识别示意图 本文训练时采用75%的重叠扫描,M=8,Q=6。识别时,重叠扫描为零,直接使用压缩域的参数,获得较好的识别效果,这与文献[64]所讨论的相符。训练基于P2D-HMM的人脸模型和训练1D-HMM的人脸模型类似,用块状窗遍历扫描得到观察序列后,对观察序列进行Viterbi分段,Buam-Welch算法重估参数。由于P2D-HMM在每个超状态中嵌入了一个1D-HMM,所以具体算法有所不同,可参考文献[61]。 4.6 基于I以特征和SMV/1翎以的人脸识别方法 采用P2D-HMM进行人脸识别时,精确度增加了很多,识别率最高可达100%,见文献[64](基于ORL人脸库)。但是因为它将16-30个子状态嵌入到4~5个超状态中,训练和识别的复杂度也增加了很多。将SVM引入HMM,建立SVM/HMM的混合人脸识别模型可以简化P2D-HMM的结构,同时保证识别精度不变。 SVM源于统计学习理论,它使用结构风险最小化(SRM)原理构造决策超平面使每一类数据之间的分类间隔最大。与HMM和ANN相比,SVM具有以下优势:训练过程中,分类模型自动构造,不需要事先指定;SVM可以在小样本训练前提下完成;采用SRM原理,SVM训练的结果使其识别的实际风险小,而非仅仅经验风险小。SVM/HMM的混合模型最早使用在语音识别中,见文献[65]。我们将SVM/HMM应用于人脸识别,用SVM的输出取代高斯分布函数或者状态映射矩阵(离散码本)建立与HMM的混合模型。每个人脸器官通过SVM进行分类,混合模型相当于一个1D-HMM。所以在保证识别率的前提下,SVM/HMM模型较简练,减少了分析识别的时间。 由于ICA提取的人脸特征与PCA相比更能反映人脸的本质特征,本文提取人脸器官ICA特征作为SVM分类器的输入。用ICA提取训练样本的高维特征的前提,必须使得样本的维数相等,样本个数大于样本的维数。我们将ORL人脸库中的400幅分辨率为90x112象素点的人脸图像归整50x60像宽度的人脸区域,按照14、8、10、18个象素宽度分别提取下巴(含嘴巴)、鼻子、眼睛、前额区域。再将区域归整为25x30大小图像块,再展开成750维的矢量。400幅人脸生成F=1600x750的人脸器官空间。对该空间进行ICA,参见[66],就可以得到人脸器官的36个人脸器官基,组成人脸器官基空间。人脸器宫矢量x在人脸器官基空间上的投影即为所提取人脸器官的ICA特征。 基于SVM/HMM的人脸识别模型的条状窗扫描和训练与ID--HMM模型相似,见图4-5。经过预处理的图像经过条状窗扫描,Viterbi和k均值分段、区域归整、工以特征提取后,输入SVM分类器。SVM最初只解决二类模式识别问题,本文采用二叉树结构解决SVM多类模式识别的问题,参考文献[67]。SVM的输出为特征矢量与待识别器官支持向量之间的距离。根据文献[68],将距离转换成概率输出,就完成了用SVM替代混合高斯分布的过程。关于SVM的基本理论,可以参见[69]。 4.7 实验结果及分析 本节实验主要有两方面内容,首先要比较不同的HMM(1D-HMM、P2D-HMM和SVM/HMM)在人脸识别中的性能,其次是基于HMM的人脸识别方法与传统人脸识别方法的性能比较。本节主要采用ORL和Yale人脸库中的训练集和测试集,参考2.4节。实验结果如表4-1。实验结果表明,HMM用于人脸建模极大提高了人脸识别方法的识别率,并且对姿态和环境的变化具有较好的鲁棒性,特别是对面部有一定角度旋转的图像也能正确识别,如图4-9。通过对不同HMM识别性能比较可知,基于P2D-HMM的人脸识别方法识别率是最高的,同时P2D-HMM的运算量也是最大的,表中T为特征序列长度,N为状态总数。建立SVV和HMM的混合模型,结构上与1D-HMM相当,识别率和P2D-HMM相差无几,所以综合性能SVM/HMM最好。 本文将基于HMM的人脸识别方法与其他的人脸识别方法,如特征脸方法(Eigenface)、弹性模型匹配方法(Elastic matching)、概率决策的神经网络方法(PDNN)、卷积神经网络(convolutional NN)等,在ORL人脸库中,进行了性能比较(实验用电脑为PVI1.4G)。选择ORL人脸库,因为它的应用最为广泛,实验结果多,结果如表4.2。 表4-1基于HMM人脸识别方法性能比较 图4-9基于HMM人脸识别方法在ORL库中正确识别的示例图像 (左)侧图中人脸有左右偏转变化(右)侧图中人脸有上下偏转变化 表4-2基于H恻人脸识别方法和其他人脸识别方法的性能比较 本文基于HMM的人脸识别方法与传统的人脸方法相比,显示出了较高的识别率,与个别方法相比可能未达到所记载的最高的识别率,但基于HMM人脸识别系统通过逐步完善人脸模型,识别快速准确,所以本系统的总体性能还是有一定的优越性的。值得一提的是,考虑到HMM即可解决二类模式识别问题,又可解决多类模式识别问题。所以基于MHM的人脸识别系统既可以完成人脸检测,有可以完成人脸识别,如系统原理图4-3。因为人脸检测与识别都需要训练出相应的HMM模型,一类用以区别“人脸”和“非人脸”,即“ConnflonHMM”(一般人脸HMM);另一类区分各个不同对象的“人脸”,称为“Subjct HMM”(对象HMM)。这两类模型可以相互利用,比如将不同对象的模型,引入人脸检测中,可以完成新对象的拒识,将代表人脸普遍结构的“Common HMM”引入各个对象的人脸模型的训练中,作为初始化参数,可以极大提高收敛速度。为了将二者有机的结合在一起,本文的人脸识别系统采用了层次机构的决策机制,如图4-4。由于本文主要讨论人脸识别技术研究,所以人脸检测部分就不重点讨论了。 4.8 本章小结 本章将HMM应用到人脸建模中,该人脸识别方法较好的利用了人脸的相似性结构,并将人脸统计特征体现为HMM的状态转移概率。基于1D-HMM恻描述二维人脸的不足,本文采用最初在字符识别中获得成功应用的P2D-HMM描述人脸模型,识别精度获得了极大提高,同时P2D-HMM相对1D-HMM结构复杂了很多,运算量也增大了,所以本文进一步改善HMM模型,建立了SVM/HMM的混合模型。该混合模型在保证识别率的前提下,简化了系统结构。 本文在特征选择方法也做了一些有效的尝试,例如提取KLT系数和DCT系数代替象素灰度值组成HMM的观测序列,并且所提取DCT系数与JPRG兼容,可以直接在压缩域识别人脸。 基于PCA和ICA的人脸识别方法主要是从特征提取的角度研究人脸识别方法,通过提取高维的人脸图像的低维统计特征,达到对人脸图像进行分类识别的目的,其中并未利用人脸本身具有的结构信息。基于HMM的人脸识别方法将人脸特征提取和分类识别有机的结合在一起,而且HMM允许观测序列在一定范围内变化,对应的状态不变,所以基于HMM研究人脸识别技术在理论上具有优势,以此设计的识别系统还具有一定的自动化程度。 第5章 结束语 5.1人脸识别方法评估 脸识别方法的评估是自动人脸识别领域中很重要的一项内容,要衡量一个方法及算法的好坏首先必须要有一个统一的评价方法及数据库。由于人脸识别的方法理论和技术研究的历史不是很长,目前国际上还没有统一的评估标准及测试数据库。为此,本节主要介绍本文采用的人脸识别方法的评价指标,有关标准人脸库方面的介绍参考引言中1.4节。 5.1.1 人脸识别方法评估的性能指标 人脸识别技术是一项实用技术,因此考察各种人脸识别方法的性能也要从实用角度出发。由于人脸识别技术首先是一种分类技术,因此正确识别率是研究人脸识别算法首先要考虑的性能指标,另外,还要考虑人脸识别技术的实时性问题。同时,人脸识别算法所设计的人脸特征库对存储空间的要求也对该技术的应用有一定的影响。 a.识别率 在人脸识别问题中,有两个概念与识别率相关:正识率和拒识率。前者指人脸识别系统正确识别出身份信息的图像占测试人脸图像总数的百分比。后者指,若该图像不属于人脸库中的人脸模式,而识别系统识别出该图像非库中对象的所有图像占测试人脸图像总数的百分比。二者均为正确识别。在实际应用中,拒识人脸通常通过设置拒识门限完成。在通常的人脸识别方法研究中,大多数人脸识别系统都没给出拒识人脸,将拒识门限设为无穷大,即给定一待识别人脸图像,在己知人脸库中找到和该人脸最相近的人脸,而不考虑该人脸是否应该是人脸库中的已知人脸。 b.计算时间 由于人脸识别技术的实际应用实时性要求比较高,因此计算时间是人脸识别技术中一个重要指标。计算时间主要有两方面:一是训练阶段,人脸识别系统需要的时间;另一个是识别阶段,人脸识别系统需要的时间。通常情况下,由于人脸识别系统的训练为离线训练,因此,人脸识别系统设计阶段需要的时间可以不考虑。但识别时间却相当重要,它直接影响到人脸识别系统的实时性,对人脸识别系统是否可以应用于实践,起着决定性作用。 c.数据存储量 在计算机人脸识别系统中,人脸库的存储也是一个不能不考虑的问题。存储大量的人脸数据将会给人脸识别系统造成一定的负担,因此,在开展人脸识别算法研究时,有时也要考虑数据存储量的大小。 d.可扩展性 在人脸识别系统的实际应用中,往往需要不断对己知人脸库进行修改,或册」除某些人脸模式,或添加某些人脸模式。因此,对已知人脸库的动态维护也是研究人脸识别技术中需要考虑的一个问题。 其他的性能指标还有自动化程度,对待识别人脸图像的限制和硬件要求等。尽管上述的评价标准在一定程度上反映了人脸识别系统的某些性能指标,但它们还远远不能令人满意。造成困难的一个重要原因在于选取评价标准关系到人们对人脸识别技术的客观需要,人们对图像内容的主观理解也妨碍了在人脸识别技术研究中定义一个完全客观的评价标准。与评价标准具有同等意义的是建立一个统一的、大规模的测试数据集。FERTE人脸库是至今为止规模最大、覆盖面最广的人脸数据库,可遗憾的是它对美国以外的用户测试是封闭的。 5.1.2 本文中人脸识别方法的评估结果 下面基于以上性能指标和不同人脸库中测试实验的结果,对本文重点研究的特征脸法、基于ICA的人脸识别方法和基于HMM的人脸识别方法,进行定性的分析比较,结果如表5-1和表5-2。 表5-1不同人脸识别方法的性能比较 表5.2不同人脸识别方法的鲁棒性比较 根据综合分析得出以下结论: a.以上三种方法中识别率最高的是基于HMM的人脸识别方法,最差的是特征脸法; b.计算时间最短的是特征脸法,其次是基于ICA(包括FastICA及其改进算法)的人脸算法,最后是基于HMM的人脸识别方法; c.数据存储量的比较,基于ICA的人脸识别方法较小(最少为训练对象的个数),特征脸法较大(最少可达图像的数目),基于HMM的人脸识别方法数据存储量的大小视采用的HMM结构而定; d.PCA和ICA提取人脸特征必须对整个人脸库进行线性变化,所以当需要添加新图像时,就必须重新计算训练集的特征,可扩展性较差,相比之下,基于HMM的型训练,有新图像加入时,只需增加该对象的观察序列长度即可,可扩展性较好; e.基于HMM的人脸识别方法,由于其HMM模型还可以用于人脸检测,所以可以建成包括人脸检测与人脸识别的全自动人脸识别系统,有一定的自动化水平,特征脸和基于ICA的人脸识别方法,仅依靠PCA和ICA提取的人脸特征,实现图像的检测是困难的。 f.对光照变化,特征脸法最为敏感,其他两种方法次之; g.对图像尺寸,特征脸法和基于ICA的人脸识别方法都要求统一的图像尺寸,相比之下基于HMM的人脸识别方法对尺寸没有统一的要求; f.对表情变化,特征脸法和基于ICA的人脸识别方法都比较敏感,基于HMM的方法次之; g.对人脸一定角度的偏转,基于HMM的人脸识别方法鲁棒性最好,其他两种方法次之。以上的结论仅供参考,由于研究人员所使用的电脑配置不同,软件编译环境不同,程序优化程度不同以及测试方法采用人脸库的不同都会造成实验结果的改变,并且一些性能指标还没有统一的定量的表示,所以只能给出比较定性的比较结果。开发一个在所有可能的变化情况下都能正确进行人脸识别的系统是非常困难的。因为几乎所有人脸识别的研究都是在一定约束条件下进行的,如光照、表情和姿态变化等受到一定限制,所以,人脸识别方法的研究必须根据实际需要选择合适的方法。 5.2 本文工作的总结及进一步研究方向的展望 5.2.1 本文的主要工作 人脸识别是一个具有很高理论价值和应用价值的研究课题。人脸识别涉及的研究内容非常广泛,包括人脸检测、人脸识别、表情识别、口形识别、视点跟踪、人脸编码以及人脸图像合成等方面。本文重点研究了基于静止图像的正面人脸识别方法,并对关键的特征提取和分类识别环节进行了有效的改进,主要内容列举在表5-3中。论文的主要工作包括以下几个方面: a.在人脸图像特征提取方面,提出了一种基于ICA的人脸整体特征提取方法。ICA是一种有效的独立特征提取方法[78-80],它可以看成是传统PCA方法的改进,由于特征的独立性有利于提高特征的识别效果,因此基于ICA的特征提取方法要优于传统的PCA方法。基于分类能力的独立分量的选择,能进一步在ICA特征中提取出类间距离大,类内距离小,即分类能力强的特征。因此基于ICA的人脸识别效果要优于传统的特征脸法。基于HMM的人脸识别方法将人脸的统计特性用HMM的参数来描述,与PVA和ICA提取人脸特征不同,并且HMM较好的利用了人脸的结构信息,也可以看作是特征提取的一种有效方式。 b.与传统的基于PCA的人脸特征提取方法相比,ICA提取特征的高阶独立性有助于提高识别的性能,但是传统的ICA算法(Informax算法)存在迭代次数多、收敛困难、需要人工参与的缺点。本文在ICA的算法研究方面,将在盲源分离中获得成功应用的FastICA算法引入人脸的特征提取中。该算法所需存储量小,收敛快,并且不需要调整步长因子。本文提出了一种改进的FastICA算法,该算法将通过减少耗时的计算雅可比矩阵逆矩阵的次数,进一步加快了收敛速度。改进的FastICA算法,除了继承了FastICA并行、分布式、计算简单、不需要人工调整步长因子等优点外,识别性能未受影响。 c.提取人脸特征后,接下来的相似性测度和分类器的设计就显得尤为重要。本文提出用角度距离代替传统的欧氏距离,该距离更适合高维空间,向量相似性的描述,也更适合人脸识别。而在分类器设计方面,SVM和传统的最近邻法相比一定程度上的改进了识别性能,但是实验结果表明基于PCA和ICA的人脸特征,对分类器的改进不是很敏感。基于HMM的人脸识别方法在HMM中应用了“前向一后向”算法和Viterbi算法,进行分类判决,取得了比较好的识别结果,所以HMM是一种比较好的分类器。本文将1D-HMM结构简单,训练识别快速和P2D-HMM的二维扭曲能力可以精确描述人脸的优点相结合,建立了SVM/HMM的混合模型。该混合模型获得了与P2D-HMM相应的识别效果,但系统复杂度仅与1D-HMM相当,是一种理想的描述人脸的模型。 表5.3本文对人脸识别方法的改进(*表示) 5.2.2进一步研究方向的展望 人脸识别是一个具有巨大挑战力的课题,虽然近十几年来得到了非常大的关注,也取得了很多的研究成果,但是仍然没有在本质上有很大的突破。人脸识别要成为一门实用的技术,准确快速的检测并分割出人脸部分,有效的变化补偿、特征描述和准确的分类将成为今后的研究主题。 a.准确的人脸检测是提高人脸识别性能的前提。由于各种因素的影响以及人脸模式的多样性,人脸图像的空间分布非常复杂,有限的样本集难以覆盖全部人脸图像子空间,在高维空间建立准确的分布模型又很困难。因此,如何有效的描述人脸子空间的分布很重要。而且,由于图像的背景可能很复杂,如何有效的区分类似人脸的区域和真正的人脸区域很重要。而当前方法的误检率一般较多,如何提高检测率的同时降低误检率也很重要; b.人脸局部和整体信息的相互结合能有效的描述人脸的特征,如何更好组合局部与整体的特征得深入研究。本文将特征的类内距离和类间距离的比值作为衡量特征分类能力的一种度量,在提取特征的过程中,就可以不断通过这个度量来选择最适合人脸识别的特征,这也是一种思路; c.不同的人脸特征提取方式有不同的特点,不同的分类器产生的分类结果也不一样。因此,多特征融和和多分类器的融和的方法也是改善识别性能的一个手段,如何将获得的各种信息最大限度、有机地集成起来加以利用,这是一个具有普遍意义的研究课题,而且也是有效提高系统识别效率的手段; d.三维形变模型可以处理多种变化因素,具有很好的发展前景。已有研究表明,对各种变化因素采用模拟或补偿的方法可以获得较好的效果,目前很多方法只能处理一两种变化因素,因此如何同时或依次补偿这些变化仍值得研究; e.视频或者序列图像能提供更多信息,如何有效的利用这些信息是一个重要的研究方向; f.大多数自动人脸识别技术具有实时要求,因此,新的算法不但要保证一定的识别率,还要快速、有效且易于实现; g.最后,需要指出的是人脸识别算法的评估标准也是人脸识别技术很重要的方面。 由于人脸对象的非刚体性,人脸之间的相似性以及各种变化因素的影响,准确的人脸识别仍较困难。随着图像处理、模式识别、人工智能以及生物心理学、视觉机制的研究进展,人脸识别也将会获得更大的发展。人脸识别的复杂性使得仅仅单独使用任何一种现有的方法都不可能取得很好的识别效果。利用先验知识,如何将各种方法有效的综合是人脸识别研究的必然趋势。如何将人脸识别与语音识别、指纹识别、虹膜识别等其它生物特征识别系统结合在一起提高识别效率,这也是生物特征识别技术的发展方向。 参考文献 [1]W Bledsoe.man-machine facial recognition. Panoramic Research Ine.Palo Alto,CA,1966(22):245-249 [2] AllenAL.Personal DeseriPtions.London:Butterworth,1950 [3]Parker F I.ComPuter Generated Animation of Faces,Proceedings ACM Conefrence,1972(l):451-457 [4] Goldstion R J,Harmon L D,Lesk A B.Mna-manchine interaction in human face identification·BellSyst.Teeh.Jounral,1972(51):399-427 [5] Kaya,Y KobayashiK.A Basic Study on Human Reeognitioh.In Frontiers of patterr Recognition,NewYork:Aeademie,1971,265-289 [6]Kanda T.Picture Processing system by computernad recognition of human face,PDh.Dissertation].Kyoto:KyotoUniversity,1973 [7]Smaal A and Iyengar P A:Automatic recognition and analysis of human faces nad facial experssion:asurvey,pattern Reeognition,1992,25(l):65-77 [8]Turk M nad Pentlnad A.Eigenfaes for recognition.J.Cognitive Neuroseience.1991,3(1):71-86 [9] 彭辉,张长水等.基于K-L变换的人脸自动识别方法.清华大学学报(自然科学版),1997,37(3):67-70 [10]Juell P Marsh R. A Hierarchieal neural network for human face deteetion.Pattem Recognition,1996,29(5):751-757 [11]Intrator N el al.Face recognition using a hybrid supervised unsupervised neural network,patterRecognitionLetters,1996,17(l):67-76 [12]Mnajunath B S,Chellappa R.:A feature based approach to face recognition.Proe.IEEE ComPoetrSoe.Con.fonCVPR,1992,373-378 [13]高西奇,周烘祥,何振亚,基于小波变换的主元分析人脸图像识别.东南大学学报,1996,26(2):137-141 [14]AdiniY,Mosed Y,Ullman S.Face reeognition: The Problem of compensating for ehnages in illumination direetion.IEEE Trans.Pattern Anal.MaehineIntell.,1997,19(7):312-317 [15]Lam K M and Yan H:An analytie-holistic approach for face recognition based on a single frontal view,IEEE Trnas.Pattern Anal.Maehine Intell.,1998,20(7):673-687 [16]Wishkott L,et al.:Face recognition by elastic bunch graph matching.IEEE Trnas.Pattern Anal.MaehineIntell.,1997,19(7):412-416 [17]Baron R J.:Mechnaisms of human facial recognition.Int J Mna Mnachine Studies,1981(15): 137-178 [18] Samal A,Iyengar P A.Automatie reeognition and analysis for human face and afeial exPerssing:Asuvrey.Pattern Reeognition,1992(25):65-77 [19]Baron R.Menehanisms of human facial recognition.Int.J.Mna-maehine Sutdies,1989(2):283-31 [20] Buree V Reeognizing faces.London:Erlbaum,1988 [21]Biehsel M.Pereeeiving and recognizing faces,Mind and Lnaguage,1990:342-364 [22]Ellis H et al.AsPeets of face Proeessing,Dordreeht:Nijho,ff1986(3):456-462 [23]金忠.人脸图像特征提取与维数研究,[博士学位论文],南京:南京理工大学,1999 [24]Bmnelli R and Poggio T:HyPerBF networks for gender classifieation.Proe.DRRPA,Image Understnading,WbkrshoP,1992:311-314 [25]Ming-Hsuan Yang,David J.Kriegman,and Naerndra Ahuja,Deteeting Faees in Images A Suvrey,IEEE Transactions on Pattern Analysis and Maehine Intelligenee,Januyar2002,24(l):34-58 [26] Chellappa R.,Wilson C.L.Sirohey S.,Human and machine recognition of face:A suvrey Proe IEEE,1995,83(5):705-740 [27]Berto R,Poggio T,Face recognition:Feature versus templates,IEEE Trnas.OnAPMI,1993,15(10),1042-1052 [28]Ziquna Hong,Algebarix feature extaretion of imgae for recognition.Pattern Recognition,1991,24(3):211-219 [29]Nkamaura O,Mathur S,Minami,T Indentification of human faces based on isodensity maps·Pattern Reeognition,1991,24(3):263-272 [30]Lades M,Vorbuggen J,Buhnlann J et al,Distortion invariant object reeognition in the dymnaic link arehieteurte.IEEE Trnas.on Compuetrs,1991,42(3):300-311 [31]Samaria F,Young S,HMM-based architecture for face indentifieation.Image and Vision Computing,1994,12(8):123-129 [32]Jun Zhnag,Yong Yan,Martin Lades,Face recognition: Eigenface,Elastic Matching,nad Neural Nets,Proeeedings of the IEEE,1998,85(9):1422-1435 [33]Kibry M and Siorvich L.:APPlieation of the KL Procedure for the charaecterization of human faces,IEEE Trnas.Pattern and Machine Intell.1990,12(1):103-108. [34]Turk M and Pentland A: Face Reeognition using eigenafees,In Proceeding of the IEEE ComPuter Soeiety Coneference on ComPuter Vision and Pattere Reeognition,1994,586-591. [35]Pentlnad A etc.:View-based modular eigensPaces for face reeognition.Pore.IEEE Conf.on CVPR,1994,84-91 [36]J.F Cardoso.Bliind Signal Separation Statistical Principle.Proceedings of the IEEE.special issue on blind identification and estimation.1998,9(10):2009-2025 [37]J.F.Cardoso.Source separation using higher order momenis.The Proe.ICASSP,1998:2109-2112 [38] M.C.Jones,R.Sibson.What is Projeetion Pursuit? J.of the Royal Statistical Society,ser.A.1978,150:l-36 [39] 胡广书编著.数字信号处理.北京:清华大学出版社,1997:107-109 [40] 边肇祺,张学工等编著.模式识别(第二版),北京:清华大学出版社,2000:136-140 [41]Yarmbor W.,DraPer B.and Beveridge J.R.: Analysis of PCA-based Face Reeognition Algorithms:Eigenvector Seleetion and Distnace Measures,Second Workrshop on Empirieal Evaluation Methods in ComPuter Vision,2000:369-345 [42]A.Hyvarinen and E.Oja:IndePendent ComPonent Analysis:Algorithms and aPPlieation.Neural Networks.2000,13(4-5):411-430 [43]KharurenJ.Hyvariene A.Vigario R.et al.Applieation of neural blind separation to signal and image poreessing,1999(3):423-431 [44]Cdaroso J.F.Lbaeld B.H.Equivariant adaptive source seParation.IEEE Trans.On Signal Processing,1996,44(12):3017-3030 [45]Torkkola K. Blind separation for audio signals are we there get?P roc.Int.workshoP on independent component analysis and signal separation(ICA’99),1999,239-244 [46]BellA.J.Seijnowski The independent component of natural scenes are edge filters.Vision Research,1997,37(23):3327-3338 [47]Yuen.P,Lar J.h.: Face representation using independent component analysis.Pattem Recognition2001,34(3):545-553 [48] 张贤达,现代信号处理.北京:清华大学出版社,1995 [49]0.Oeniz,M.Castrillon,M.Hemendez.Face Reeognition using IndePendent ComPonent Analysis and Support Veetor Maehines.Availbale from Http://www.lbl.gov/Publieations [50] A.Hyvarinen,J.Kahtunen,E.Oja IndePendent ComPonent Analysis.Wiley,New-YOrk(2001) [51]T.-W.Lee Independent Component Analysis:Theory and APPlieations.Boston,MA:Kluwer,1998 [52] A.J.Bell and T.J.Sejnowski An inofrmation-mxaization approach to blind separation and blind deconvolution.Neural comPutation,1995,7(6):1129-115 [53]A.Hyvarinen.Fast and robust fixed-Point algorithlnS for independent comPonentanalysis.IEEE Trans·Neural Networks,1999,10(3):626-634 [54]M.S.Bartlett J.R.Movellan,T.J.Sejnowski.Face recognition by independent component analysis.IEEE,Transaction on Neural Networks,2002(13):1450-1464 [55]S.Amari,A.Ciehoeki,and H.H.Yang:A new learning algoritllm for blind signal seParation.Advance in Neural Inofrmation Proeessing Systems Cambridge,MA:MIT Press,1996(8):129-135 [56] 蒋长锦.科学计算和C程序集[M].安徽:中国科技大学出版社,1998 [57] 关治、陈景良.数值计算方法.北京:清华大学出版社,1998 [58]http://www-sigensrfr/cappe/docs/hmmbibhtml [59]Samaria F.and Young S.,HMM based architecture for face identification,Image and Computer Vision,Octobor 1994(12):537-583 [60]A.V.Nefian and M.H.Hayes Face deteetion and recognition using Hidden Makrov Models,in Intenrational Conefrence on Image Proeessing,(l):141-145 [61]Nefina,A.V,Hayes,M.H.,Ⅲ.Mxaimum likelihood training of the embedded HMM for face deteetion and reeognition Image Proeessing,2000.Proeeedings 2000 Intemational Conefernce,2000(l):33-36 [62]Smaaria F.Face recognition using hidden markov models,PhDthesis,Univ.ofCmabridge,1994 [63]Kuo S.and Agazzi O.Keyword sPotting in Poorly Printed doeuments using Pseudo 2-dHidden Markov Models.IEEE Transactions on Pattern Analysis and Machine Intelligenee,1994(2):321-332 [64]Stefen Eiekeler,Steafn Mille,and Gerhard Rigoll·Reeognition of JPEG ComPressed Face Image Based on Statistical Methods.Image and Vision ComPuting Joumal,SPeeial Issue on Facial Image Analysis,Mareh 2000,18(4):279-287 [65]Ganpaathiraju,J Hamaker and J Pieone.Hybrid Svm/HMM Arehitectures for SPeeeh Reeognition.ProcICSIP 2000:213-230 [66]M.S.Bartlett,H M Lades and T J Sejnowski.IndePendent component representations for face recognition·proc·SPIE Conf on Humna Vision and Eleeortnic ImagingⅢ,1998(3299):528-539 [67]GuodongGuo,Li,S.Z.,KPaluk Chan,Face reeognition by support vector machines,Automatic Face and Gesture Reeognition,2000.Proceedings Fourth IEEE Intenrational Conefrence,2000:196-201 [68]Platt,J C.Porbabilistic OutPuts for Support Veetor Machines for PatternReeognition.Uafyyad,Edito.rBoston:Kluwer Aeademie Publisher,1999 [69]Osuna.E,FrundR,and GirosiF.Training Suprort Veetor Maehines:An APPlieation to Face Deteetion.Proe.IEEE Conf.ComPuter Vision and Pattern Reeongition,1997:130-136. [70] Smaaria F.,Harter A.Parameterisation of a static model for human face identifieation. Proeeedings of IEEE WorkshoP on APPlieations of ComPuter Vision,Sarasota,Florida,DeCember1994 [71]RajagoPalna A.,K.Kumar,J.Karlekar:Finding Faces in Photogrpahs,Pore.Sixth IEEE Int,lConf.ComPuter Vision.1998:640-645 [72]Peomon.IndePendent ComPonent Analysis:A New ConeePt.Signal Proeessing,1994(36):287-314 [73]Eiekeler S.Face databasere rtieval using Pseudo 2D hidden Markov models.Automatic Face and Gesutre Recognition.2002.Proeeedings Fifth IEEE Intenrational Conefreneeon,20-21Mya2002:58-63. [74] J.Zhnag,Y.Yan,M.Ldaes.Face reeognition:Eigenafce,elastic matehing,and neural nets,Proeeedings of the IEEE.1997,85(9):1423-1435 [75]S.-H.Lin,S-Y.Kung,L-J.Lin,Face recognitiond/eteetion by probabilistic deeision-based neural newtork:IEEE Transaetions on Neural Networks1997,8(l):114-132 [76]S.Lwarence,C.L Giles,A.C.Tsoi,A.D.Baek.Face reeognition:a convolutional neural newtork approaeh.IEEE Trnasaetions on Neural Networks.1997,8(l):98-113 [77]NefinaA..V,HayesⅢM.H.Hidden Makrov Models for face recognition.porcessingof Intenrational Conefrence on Aeousties,SPeeeh,and Signal Proeessing(ICASSP),Seattle,Mya1998:2721-272 [78]CommonP.IndePendent component analysis:a new concept? Singal Proeessing,1994,6(3):287-314 [79]Bell A J,sejnowski T J.An inofmration-mxaimization approach to blind separation and blind deeonvolution,Neural ComPutation,1995,7(6):1004-1034 [80]Hyvirinen A.Survey on IndePendent ComPonent Analysis.Neural ComPuting Surveys,1999(2):94-128 [81]Rabiner L R.A Tutorial on Hidden Markov Models and Seleeted APPlieations in Speech Reeognition.Poreeedings of the IEEE,1989,77(2):257-286 毕业设计(论文)原创性声明和使用授权说明 原创性声明 本人郑重承诺:所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得 及其它教育机构的学位或学历而使用过的材料。对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。 作 者 签 名:       日  期:        ​​​​​​​​​​​​ 指导教师签名:        日  期:        使用授权说明 本人完全了解 大学关于收集、保存、使用毕业设计(论文)的规定,即:按照学校要求提交毕业设计(论文)的印刷本和电子版本;学校有权保存毕业设计(论文)的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的前提下,学校可以公布论文的部分或全部内容。 作者签名:        日  期:        ​​​​​​​​​​​​ 学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。 作者签名: 日期: 年 月 日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权      大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 涉密论文按学校规定处理。 作者签名: 日期: 年 月 日 导师签名: 日期: 年 月 日 指导教师评阅书 指导教师评价: 一、撰写(设计)过程 1、学生在论文(设计)过程中的治学态度、工作精神 □ 优 □ 良 □ 中 □ 及格 □ 不及格 2、学生掌握专业知识、技能的扎实程度 □ 优 □ 良 □ 中 □ 及格 □ 不及格 3、学生综合运用所学知识和专业技能分析和解决问题的能力 □ 优 □ 良 □ 中 □ 及格 □ 不及格 4、研究方法的科学性;技术线路的可行性; 设计方案 关于薪酬设计方案通用技术作品设计方案停车场设计方案多媒体教室设计方案农贸市场设计方案 的合理性 □ 优 □ 良 □ 中 □ 及格 □ 不及格 5、完成毕业论文(设计)期间的出勤情况 □ 优 □ 良 □ 中 □ 及格 □ 不及格 二、论文(设计)质量 1、论文(设计)的整体结构是否符合撰写规范? □ 优 □ 良 □ 中 □ 及格 □ 不及格 2、是否完成指定的论文(设计)任务(包括装订及附件)? □ 优 □ 良 □ 中 □ 及格 □ 不及格 三、论文(设计)水平 1、论文(设计)的理论意义或对解决实际问题的指导意义 □ 优 □ 良 □ 中 □ 及格 □ 不及格 2、论文的观念是否有新意?设计是否有创意? □ 优 □ 良 □ 中 □ 及格 □ 不及格 3、论文(设计说明书)所体现的整体水平 □ 优 □ 良 □ 中 □ 及格 □ 不及格 建议成绩:□ 优 □ 良 □ 中 □ 及格 □ 不及格 (在所选等级前的□内画“√”) 指导教师: (签名) 单位: (盖章) 年 月 日 评阅教师评阅书 评阅教师评价: 一、论文(设计)质量 1、论文(设计)的整体结构是否符合撰写规范? □ 优 □ 良 □ 中 □ 及格 □ 不及格 2、是否完成指定的论文(设计)任务(包括装订及附件)? □ 优 □ 良 □ 中 □ 及格 □ 不及格 二、论文(设计)水平 1、论文(设计)的理论意义或对解决实际问题的指导意义 □ 优 □ 良 □ 中 □ 及格 □ 不及格 2、论文的观念是否有新意?设计是否有创意? □ 优 □ 良 □ 中 □ 及格 □ 不及格 3、论文(设计说明书)所体现的整体水平 □ 优 □ 良 □ 中 □ 及格 □ 不及格 建议成绩:□ 优 □ 良 □ 中 □ 及格 □ 不及格 (在所选等级前的□内画“√”) 评阅教师: (签名) 单位: (盖章) 年 月 日 教研室(或答辩小组)及教学系意见 教研室(或答辩小组)评价: 一、答辩过程 1、毕业论文(设计)的基本要点和见解的叙述情况 □ 优 □ 良 □ 中 □ 及格 □ 不及格 2、对答辩问题的反应、理解、表达情况 □ 优 □ 良 □ 中 □ 及格 □ 不及格 3、学生答辩过程中的精神状态 □ 优 □ 良 □ 中 □ 及格 □ 不及格 二、论文(设计)质量 1、论文(设计)的整体结构是否符合撰写规范? □ 优 □ 良 □ 中 □ 及格 □ 不及格 2、是否完成指定的论文(设计)任务(包括装订及附件)? □ 优 □ 良 □ 中 □ 及格 □ 不及格 三、论文(设计)水平 1、论文(设计)的理论意义或对解决实际问题的指导意义 □ 优 □ 良 □ 中 □ 及格 □ 不及格 2、论文的观念是否有新意?设计是否有创意? □ 优 □ 良 □ 中 □ 及格 □ 不及格 3、论文(设计说明书)所体现的整体水平 □ 优 □ 良 □ 中 □ 及格 □ 不及格 评定成绩:□ 优 □ 良 □ 中 □ 及格 □ 不及格 (在所选等级前的□内画“√”) 教研室主任(或答辩小组组长): (签名) 年 月 日 教学系意见: 系主任: (签名) 年 月 日 学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下进行的研究工作所取得的成果。尽我所知,除文中已经特别注明引用的内容和致谢的地方外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式注明并表示感谢。本人完全意识到本声明的法律结果由本人承担。 学位论文作者(本人签名): 年 月 日 学位论文出版授权书 本人及导师完全同意《中国博士学位论文全文数据库出版章程》、《中国优秀硕士学位论文全文数据库出版章程》(以下简称“章程”),愿意将本人的学位论文提交“中国学术期刊(光盘版)电子杂志社”在《中国博士学位论文全文数据库》、《中国优秀硕士学位论文全文数据库》中全文发表和以电子、网络形式公开出版,并同意编入CNKI《中国知识资源总库》,在《中国博硕士学位论文评价数据库》中使用和在互联网上传播,同意按“章程”规定享受相关权益。 论文密级: □公开 □保密(___年__月至__年__月)(保密的学位论文在解密后应遵守此协议) 作者签名:_______ 导师签名:_______ _______年_____月_____日 _______年_____月_____日 独 创 声 明 本人郑重声明:所呈交的毕业设计(论文),是本人在指导老师的指导下,独立进行研究工作所取得的成果,成果不存在知识产权争议。尽我所知,除文中已经注明引用的内容外,本设计(论文)不含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体均已在文中以明确方式标明。 本声明的法律后果由本人承担。   作者签名: 二〇一〇年九月二十日   毕业设计(论文)使用授权声明 本人完全了解滨州学院关于收集、保存、使用毕业设计(论文)的规定。 本人愿意按照学校要求提交学位论文的印刷本和电子版,同意学校保存学位论文的印刷本和电子版,或采用影印、数字化或其它复制手段保存设计(论文);同意学校在不以营利为目的的前提下,建立目录检索与阅览服务系统,公布设计(论文)的部分或全部内容,允许他人依法合理使用。 (保密论文在解密后遵守此规定)   作者签名: 二〇一〇年九月二十日 致 谢 时间飞逝,大学的学习生活很快就要过去,在这四年的学习生活中,收获了很多,而这些成绩的取得是和一直关心帮助我的人分不开的。 首先非常感谢学校开设这个课题,为本人日后从事计算机方面的工作提供了经验,奠定了基础。本次毕业设计大概持续了半年,现在终于到结尾了。本次毕业设计是对我大学四年学习下来最好的检验。经过这次毕业设计,我的能力有了很大的提高,比如操作能力、分析问题的能力、合作精神、严谨的工作作风等方方面面都有很大的进步。这期间凝聚了很多人的心血,在此我表示由衷的感谢。没有他们的帮助,我将无法顺利完成这次设计。 首先,我要特别感谢我的知道郭谦功老师对我的悉心指导,在我的论文书写及设计过程中给了我大量的帮助和指导,为我理清了设计思路和操作方法,并对我所做的课题提出了有效的改进方案。郭谦功老师渊博的知识、严谨的作风和诲人不倦的态度给我留下了深刻的印象。从他身上,我学到了许多能受益终生的东西。再次对周巍老师表示衷心的感谢。 其次,我要感谢大学四年中所有的任课老师和辅导员在学习期间对我的严格要求,感谢他们对我学习上和生活上的帮助,使我了解了许多专业知识和为人的道理,能够在今后的生活道路上有继续奋斗的力量。 另外,我还要感谢大学四年和我一起走过的同学朋友对我的关心与支持,与他们一起学习、生活,让我在大学期间生活的很充实,给我留下了很多难忘的回忆。 最后,我要感谢我的父母对我的关系和理解,如果没有他们在我的学习生涯中的无私奉献和默默支持,我将无法顺利完成今天的学业。 四年的大学生活就快走入尾声,我们的校园生活就要划上句号,心中是无尽的难舍与眷恋。从这里走出,对我的人生来说,将是踏上一个新的征程,要把所学的知识应用到实际工作中去。 回首四年,取得了些许成绩,生活中有快乐也有艰辛。感谢老师四年来对我孜孜不倦的教诲,对我成长的关心和爱护。 学友情深,情同兄妹。四年的风风雨雨,我们一同走过,充满着关爱,给我留下了值得珍藏的最美好的记忆。 在我的十几年求学历程里,离不开父母的鼓励和支持,是他们辛勤的劳作,无私的付出,为我创造良好的学习条件,我才能顺利完成完成学业,感激他们一直以来对我的抚养与培育。 最后,我要特别感谢我的导师***老师、和研究生助教***老师。是他们在我毕业的最后关头给了我们巨大的帮助与鼓励,给了我很多解决问题的思路,在此表示衷心的感激。老师们认真负责的工作态度,严谨的治学精神和深厚的理论水平都使我收益匪浅。他无论在理论上还是在实践中,都给与我很大的帮助,使我得到不少的提高这对于我以后的工作和学习都有一种巨大的帮助,感谢他耐心的辅导。在论文的撰写过程中老师们给予我很大的帮助,帮助解决了不少的难点,使得论文能够及时完成,这里一并表示真诚的感谢。 致 谢 这次论文的完成,不止是我自己的努力,同时也有老师的指导,同学的帮助,以及那些无私奉献的前辈,正所谓你知道的越多的时候你才发现你知道的越少,通过这次论文,我想我成长了很多,不只是磨练了我的知识厚度,也使我更加确定了我今后的目标:为今后的计算机事业奋斗。在此我要感谢我的指导老师——***老师,感谢您的指导,才让我有了今天这篇论文,您不仅是我的论文导师,也是我人生的导师,谢谢您!我还要感谢我的同学,四年的相处,虽然我未必记得住每分每秒,但是我记得每一个有你们的精彩瞬间,我相信通过大学的历练,我们都已经长大,变成一个有担当,有能力的新时代青年,感谢你们的陪伴,感谢有你们,这篇论文也有你们的功劳,我想毕业不是我们的相处的结束,它是我们更好相处的开头,祝福你们!我也要感谢父母,这是他们给我的,所有的一切;感谢母校,尽管您不以我为荣,但我一直会以我是一名农大人为荣。 通过这次毕业设计,我学习了很多新知识,也对很多以前的东西有了更深的记忆与理解。漫漫求学路,过程很快乐。我要感谢信息与管理科学学院的老师,我从他们那里学到了许多珍贵的知识和做人处事的道理,以及科学严谨的学术态度,令我受益良多。同时还要感谢学院给了我一个可以认真学习,天天向上的学习环境和机会。 即将结束*大学习生活,我感谢****大学提供了一次在农大接受教育的机会,感谢院校老师的无私教导。感谢各位老师审阅我的论文。 本科生毕业设计(论文)规范化要求 第一部分 学生应遵守以下规范要求 一、毕业设计论文说明 1. 毕业设计论文独立装订成册,内容包括: (1) 封面(题目、学生姓名、指导教师姓名等) (2) 中、外文内容摘要 (3) 正文目录(含页码) (4) 正文(开始计算页码) (5) 致谢 (6) 参考文献 (7) 附录 2. 中、外文内容摘要包括:课题来源,主要设计,实验方法,本人主要完成的成果。要求不少于400汉字,并译成外文。 3. 毕业设计论文页数为45页-50页。 4. 纸张要求:毕业设计说明书(论文报告)应用标准B5纸单面打字成文。 5. 文字要求:文字通顺,语言流畅,无错别字。 6. 图纸要求:毕业设计图纸应使用计算机绘制。图纸尺寸标注应符合国家标准。图纸应按“规范”叠好。 7. 曲线图表要求:所有曲线、图表、流程图、程序框图、示意图等不得徒手画,必须按国家规定标准或工程要求绘制。 8. 参考文献、资料要求:参考文献总数论文类不少于10篇、,应有外文参考文献。文献应列出序号、作者、文章题目、期刊名、年份、出版社、出版时间等。 二、外文翻译 1. 完成不少于2万印刷符的外文翻译。译文不少于5千汉字。 2. 译文内容必须与题目(或专业内容)有关,由指导教师在下达任务书时指定。 3. 译文应于毕业设计中期2月底前完成,交指导教师批改。 4. 将原文同译文统一印成B5纸规格装订成册,原文在前,译文在后。 三、形式审查 5月15日前,将毕业设计论文上交指导教师,审查不合格者,不能参加答辩。 四、准备答辩 答辩前三天,学生要将全部材料(包括光盘、论文)统一交指导教师。 关于毕业论文格式的要求 为方便统一、规范论文格式,现将学院的相关要求做如下强调、补充: 1. 基本要求 纸型: B5纸(或16开),单面打印; 页边距: 上2.54cm,下2.54cm,左2.5cm,右2.5cm; 页眉:1.5cm,页脚1.75cm,左侧装订 正文字体:汉字和标点符号用“宋体”,英文和数字用“Times New Roman”,字号小四; 图号1-1,指第1章第1个图 在图的前部要有文字说明(如图1-1所示) 表号3-5,指第3章第5个表 在表的前部要有文字说明(如表3-5所示) 图、表的标注字体大小是五号宋体 行距: 固定值20; 页码: 居中、小五、底部。 2. 封面格式 封皮: 大连理工大学城市学院(二号、黑体、居中) 本科生毕业设计(论文)(二号、黑体、居中) 学 院:(四号、黑体、居中、下划线:电子与自动化学院) 专 业:(四号、黑体、居中、下划线、专业名字之间无空格) 学 生:(四号、黑体、居中、下划线,名字是2个字的中间空1个字、3个或3个以上字的中间无空格) 指导教师:(四号、黑体、居中、下划线,名字是2个字的中间空1个字、3个或3个以上字的中间无空格,两位指导教师的中间用顿号“、”) 完成日期:(四号、黑体、居中、下划线,如:2009年5月25日) (注意:5个下划线两端也是对齐的,单倍行距) 内 封:大连理工大学城市学院本科生毕业设计(论文)(四号、黑体) 题目 (二号、黑体、居中); 总计 毕业设计(论文) 页(五号、宋体) 表格 表(五号、宋体) 插图 幅 (五号、宋体) (注意:页数正常不少于40页,优秀论文原则上不少于45页) 3. 中外文摘要 中文摘要:标题“摘 要” (三号、黑体、居中、中间空1个字) 正文(不少于400字) 关键词 (五号、黑体):3-5个主题词(五号),中间用分号“;”隔开。 外文摘要 (另起一页):标题“Abstract” (三号、黑体、居中) 正文 (必须用第三人称) 关键词: Key words(五号、黑体):3-5个主题词(五号)与中文关键词对应,中间用分号“;”隔开。 4. 目录 标题 “目录”(三号、黑体、居中); 章标题(四号、黑体、居左); 节标题(小四、宋体); 页码 (小四、宋体); 二、三级目录分别缩近1和2个字; 四级目录不在“目录”中体现,在正文中也不是单独一行,可以黑体(没有句号),然后空2个字接正文; 注意:正文中每章开头要另起一页; “目录”下方中间的页码和摘要一样统一用罗马字,顺接摘要的。 摘要 目录加页眉 5. 论文正文 页眉: 论文题目(居中、小五、黑体); 章标题(三号、黑体、居中); 节标题(四号、黑体、居左); 正文 程序用“Times New Roman”,字号小四; 6. 参考文献 标题:“参考文献”(小四、黑体、居中) 参考文献的著录,按文稿中引用顺序排列,并注意在文内相应位置用上标标注,如:……的函数。 示例如下:(字体为五号、宋体) 期刊类:[序号]作者1,作者2,……作者n。文章名。期刊名(版本),出版年,卷次(期次)。页次 图书类:[序号]作者1,作者2,……作者n。书名。版本。出版地:出版者,出版年。页次 会议论文集:[序号]作者1,作者2,……作者n。论文集名。出版地:出版者,出版年。页次 网上资料:[序号]作者1,作者2,……作者n。文章名。网址。发表时间 7. 其它 量和单位的使用:必须符合国家标准规定,不得使用已废弃的单位(如高斯(G和Gg)、亩、克分子浓度(M)、当量能度(N)等)。量和单位不用中文名称,而用法定符号表示。 图表及公式:插图宽度一般不超过10cm,表名(小四)置上居中,图名(小四)置下居中。标目中物理量的符号用斜体,单位符号用正体,坐标标值线朝里。标值的数字尽量不超过3位数,或小数点以后不多于1个“0”。如用30Km代替30000m,用5µg代替0.005mg等,并与正文一致。图和表的编号从前至后顺序排列,图的编号及说明位于图的下方,居中;表的编号及说明位于表的上方,居中。公式编号加圆括号,居行尾。图表中的字体不应大于正文字体。注意:图表标题中的数字也是“Times New Roman”。 8.论文依次包括:封皮、内封、中文摘要、英文摘要、目录、正文、结论、致谢、参考文献、(附录),不要落项。 9.注意:上面没有说“加粗”的“黑体”,均为“黑体不加粗”。 补充: 1.答辩要求:自述15分钟,回答问题10分钟,自述要求使用PPT 答辩内容: 1).论文题目 2).设计内容 3).设计方案 4).如何完成设计 工作原理 软件或硬件设计 制作\调试\安装 5).存在不足,今后努力的方向 6).致谢 3.最后上交学生装订好的论文、光盘、记录表、成绩单 4.光盘里的文件夹命名为:学号_姓名_年级专业班级 文件夹里包括的文件有:论文、ppt、英文翻译 1) 论文的文件名格式:学号_姓名_年级专业班号_题目(论文)_完成日期doc 2) ppt的文件名格式:学号_姓名_年级专业班号_题目(ppt)_完成日期ppt 3) 英文翻译的文件名格式:学号_姓名_年级专业班号_题目(英文翻译)_完成日期doc 例如: 答辩问题5个, 侧重总体思路一个 软件或硬件一个 翻译一个 其他2个 4 1 _1234567893.unknown _1234567897.unknown _1234567899.unknown _1234567901.unknown _1234567902.unknown _1234567900.unknown _1234567898.unknown _1234567895.unknown _1234567896.unknown _1234567894.unknown _1234567891.unknown _1234567892.unknown _1234567890.unknown
本文档为【人脸识别技术研究本科毕业论文】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
不系舟红枫
从教近30年,经验丰富,教学水平较高
格式:doc
大小:2MB
软件:Word
页数:89
分类:工学
上传时间:2019-01-22
浏览量:46