基于轻量级VGGNet的人脸识别开题报告
2022-01-14 21:07:32
全文总字数:5174字
1. 研究目的与意义及国内外研究现状
在21世纪,深度学习的迅速发展使得计算机在语音和图像识别任务等多种事务处理任务中达到人类的一般水平,甚至超越。深度学习能从海量的数据经验中学习并进行架构来拟合事务结构,通过构建相对简单的模型来让机器学习事务复杂的特征,而不必需要人类完全清楚学习的特征。
现实生活中的事务极度复杂,一般人们很难了解到事务的本质,不能了解事务所有的特征。人类从浅层数据掌握事务的特征是极其困难的,但是可以通过计算机的模拟人脑,用简单的模型来进行特征提取,在这个方向上,深度学习发展出以人工神经网络为核心的算法体制。
其中卷积神经网络(convolutional neural networks,简称cnn)[1][2]是众多深度学习网络结构中的一种,因具有强大的特征提取能力,已成为图像,文本,语音识别等领域研究热点之一。从一开始的lenet-5到alexnet,再到现在比较著名的zfnet,vggnet[3],googlenet[4]和resnet[5]。以及许多应用在个别领域较多的卷积神经网络,如:shufflenet在移动端用的较多。针对vggnet,vggnet网络通过增加深度,能利用增加的非线性得到目标的近似结构,也就是更好的特征提取。但是vggnet网络的缺点也特别明显,在深度宽度的加深加宽的同时,特征向量不断丰富,而参数量也爆炸式增长,一张图的参数量达到140m,在一些个人与小型企业上实现还是有一定困难的。
2. 研究的基本内容
本文在现有的vggnet神经网络模型下,对cnn的理念进行了解与学习。再对vggnet网络进行分析,了解vggnet网络模型大概的框架,了解vggnet是如何建立的并针对现有的vggnet网络中存在依赖大规模数据训练和巨额计算能力的问题,本文将对vggnet网络进行轻微的改造,简化网络结构,提出一种light vggnet,并基于这种算法进行局部优化。对这种light vggnet进行调整与优化,训练好模型达到一定的标准后,采用improved light vggnet使用opencv进行收集人脸图像,对图像进行预处理,再对处理好的图像进行模型训练,再进行人脸识别。
3. 实施方案、进度安排及预期效果
第一部分,简单了解基于vggnet的深度学习以及在人脸识别领域的研究背景与意义,并且简单了解了近年来国内外在cnn人脸识别方面所做出的努力以及提出的各种创新方法。
第二部分为了解在实现vggnet网络的训练和使用vggnet网络模型的过程中所需要使用的一些技术与开发工具。
4. 参考文献
[1]. jain a.k.,ross a,prabhakar s..an introduction to biometric recognition[j].ieee transactions on circuits and systems for video techsactions,2004,1(1):4-20.
[2]. 田启川,张润生,生物特征识别综述[j].计算机应用研究,2009,(12):4401-4406,4410.doi:10.3969/j.issn.1001-3965.2009.12.001.