针对特定可变角度的人脸识别系统的开发与设计开题报告
2020-02-19 22:28:16
1. 研究目的与意义(文献综述)
人脸识别作为一种受到社会各界广泛关注的生物识别技术,相较于虹膜识别、指纹识别、视网膜识别等其他生物识别技术,不仅具有使用方便、识别精确度高、不易仿冒等特点,而且符合人类通过眼睛以脸辨人的生活习惯,受到很多用户的欢迎[1]。人脸识别系统的研究始于上世纪60年代[2],80年代后随着计算机技术和光学成像技术的发展得到提高,而真正进入初级的应用阶段则在90年后期,并且以美国、德国和日本的技术实现为主;人脸识别系统成功的关键在于是否拥有尖端的核心算法,并使识别结果具有实用化的识别率和识别速度。
人脸识别技术发展历史悠久,涉及的技术相当广泛。最早的人脸识别技术可以追溯到1888年,galton[3]在《nature》上发表了一篇具有代表性的文章,介绍如何使用人脸特征进行识别。kirby[4]等人首次将主成分分析(principle componentanalysis,pca)技术引入到人脸识别领域,随后pentland[5]等人以pca为基础,提出了一种名为eigenface的人脸特征描述技术。近年来,大量的人脸特征表示技术如lbp特征[6]、gabor小波特征[7]以及surf特征[8]等被成功的运用到人脸识别领域。2014年,facebook提出了deepface[9],利用卷积神经网络在440万张图像上进行训练,在人脸公开数据集lfw[10]上获得了97.35%的识别率。vggface[11]采用较deepface更深的网络结构和更大的输入图像在lfw上获得了98.95%的识别率。2015年,香港中文大学的汤晓鸥教授团队提出了deepid[12]网络,该网络对卷积神经网络进行了改进,并同时使用识别和认证两种监督信号进行训练,将识别率提高到了99.15%。随着数据集的不断扩大,人脸识别技术的识别率也在不断上升。2015年google提出了facenet[13]使用更深的卷积神经网络在2亿多张样本集上进行训练,在lfw上取得了99.63%的精度。从20世纪90年代开始,国内陆续开始成立研究机构进行人脸识别技术的研究,其中具有代表性的机构和院校有中科院自动化研究所模式识别国家重点实验室、清华大学计算机系、哈尔滨工业大学计算机系等,这些研究机构在人脸识别领域取得了丰硕的成果[14]。
由于人脸识别技术的迅猛发展,人脸识别系统也得以广泛的应用到以下几个方面:
2. 研究的基本内容与方案
基本内容:
(1)搭建以opencv为核心的人脸识别系统,利用运行设备(如pc)的摄像头采集图片和视频信息。
(2)按照人脸图像采集及检测、人脸图像预处理、人脸图像特征提取以及匹配与识别这四个过程来实现人脸识别。重点研究不同人脸图像的预处理和提取过程。同时评估现有的人脸识别方案,总结各种算法的优缺点和使用范围。
3. 研究计划与安排
第一阶段(2月17日—2月28日):查阅有关的参考资料并完成开题报告;翻译英文资料(不少于5000汉字),并交予指导教师检查。
第二阶段(3月1日—4月14):了解人脸识别各个过程:图像预处理,人脸检测,特征定位,人脸归一化,特征提取和特征识别。重点掌握人脸检测、特征定位、人脸归一化和特征提取子过程。研究现有人脸识别方法,同时总结各种算法的优缺点以及使用范围。
第三阶段(4月15日—5月12日):实现针对特定可变角度的人脸识别系统,完成从人脸检测到人脸识别整套功能,验证该系统的有效性与实时性。
4. 参考文献(12篇以上)
[1] redmon,j., divvala, s., girshick, r., amp; farhadi, a. (2016). you only look once:unified, real-time object detection. in proceedings of the ieee conference oncomputer vision and pattern recognition (pp. 779-788).
[2] sun,y., wang, x., amp; tang, x. (2014). deep learning face representation frompredicting 10,000 classes. in proceedings of the ieee conference on computervision and pattern recognition (pp. 1891-1898).
[3] li,y., ai, h., yamashita, t., lao, s., amp; kawade, m. (2008). tracking in lowframe rate video: a cascade particle filter with discriminative observers ofdifferent life spans. ieee transactions on pattern analysis and machineintelligence, 30(10), 1728-1740.