基于深度学习的人脸识别研究与应用开题报告
2021-02-25 13:14:14
1. 研究目的与意义(文献综述)
人工智能是计算机学科的一个分支,它是研究人类智能活动的规律,并用于模拟、延伸和扩展人类智能的一门新的技术科学。人工智能目前已在指纹及人脸识别、专家系统、智能搜索、定理证明、博弈、自动程序设计以及航空航天领域取得了广义的应用。深度学习是近十年来人工智能领域取得的重要突破。它在计算机视觉、图像与视频分析、语音识别、自然语言处理、多媒体等诸多领域的应用跨入高速发展期。随着深度学习发展,计算机视觉领域相关技术大幅提高,针对于人脸识别、车牌识别、行人检测、大规模场景识别的准确性和难度也在大幅提高。本论文主要在于研究深度学习的理论和方法,在深入学习卷积神经网络和循环神经网络之后,将深度学习应用于人脸识别中,并探讨如何提高人脸的识别率。
由于深度学习起源于国外,早在20世纪50年代就有美国学者对学生阅读过程中所采用的学习方法进行了研究,并在1976年提出了深度学习这个概念;而国内有关深度学习的研究始于1997年,但是直到2005年才有文献较为全面地对深度学习展开研究。图像处理是深度学习最早尝试的领域。早在1989年,加拿大多伦多大学教授Yann LeCun就和他的同事提出了卷积神经网络(Convolutional NeuralNetworks, CNN),它是一种包含卷积层的深度神经网络模型。CNN的架构设计是受到生物学家Hube和Wiesel的动物视觉模型启发而发明的,尤其是模拟动物视觉皮层的V1层和V2层中简单细胞和复杂细胞在视觉系统的功能。起初卷积神经网络在小规模的问题上取得了当时世界最好成果,但是在很长一段时间里一直没有取得重大突破,主要原因是卷积神经网络应用在大尺寸图像上一直不能取得理想结果,比如对于像素数很大的自然图像内容的理解,这使得它没有引起计算机视觉研究领域足够的重视。在2012年10月,Hinton教授以及他的学生采用更深的卷神经网络模型在著名的ImageNet问题上取得了世界最好结果,使得对于图像识别的领域研究更进一步。2012年国内互联网巨头百度公司将相关最新技术成功应用到人脸识别和自然图像识别问题,并推出相应的产品。现在的深度学习网络模型已经能够理解和识别一般的自然图像。深度学习模型不仅大幅提高了图像识别的精度,同时也避免了需要消耗大量时间进行人工特征的提取,使得在线运行效率大大提升。
传统的人脸识别方法有多种,例如基于局部的方法,有利用局部描述子Gabor、局部二值模式(local binary pattern,LBP)等;还有基于全局的方法,有特征脸方法(Eigenface)、线性判别分析法(linear discriminant analysis,LDA)等。但是由于关照、姿态和表情变化等因素的影响,传统的人脸识别方法的识别精确率受到制约,而在深度学习框架下,学习算法直接从原始图像学习可以进行判别的人脸特征,加上海量人脸数据的提供,基于深度学习的人脸识别在速度和精确性上已经超越了传统的人脸识别方法,甚至超越人类本身。在2012年,勒尼得·米勒研究小组就将深度学习用于LFW(labeled face in the wild)数据库上的人脸识别,采用的是无监督的特征学习方法,识别率为87%,而特征脸方法在LFW中的识别率仅有60%。近几年国外的深度学习在人脸识别中的研究又有了进一步提升,例如DeepFace、DeepID、FaceNet等算法,均是基于海量的数据训练的,其中FaceNet的准确率在FLW数据库上达到了99.63%,已经超过了人眼的识别率(99.25%)。国内的研究机构也在人脸识别领域进行了大量的深入研究,例如中国香港中文大学的团队,利用CNN模型,其DeepID项目在LFW数据库上的人脸识别率达到了99.45%。就目前来看,深度学习是未来人脸识别的发展方向,但是深度学习的计算复杂度高,训练过程时间长,甚至需要计算机硬件的配合,所以快速的学习方法将会是研究趋势。2. 研究的基本内容与方案
一、基本内容
1. 深入研究深度学习;学习机器学习和深度学习的相关理论和方法;
2. 学习卷积神经网络和循环神经网络的理论;
3. 研究计划与安排
第1~2周 查阅有关的参考资料并完成开题报告;阅读顶级会议论文和相关参考文献;
第3~4周 学习深度学习相关的基础知识;学习人脸识别相关的基础知识;
第5~6周 学习caffe框架的相关知识;
4. 参考文献(12篇以上)
[1] 纪宏璠, 雷体南. 2005-2014年国内外深度学习研究的现状分析[j]. 软件导刊:教育技术, 2014, 13(8):47-49.
[2] 周激流, 张晔. 人脸识别理论研究进展[j]. 计算机辅助设计与图形学学报, 1999, 11(2):180-184.
[3] lecun y, bengio y,hinton g. deep learning[j]. nature, 2015, 521(7553):436-444.