基于深度学习的眼部特征点检测算法研究毕业论文
2021-11-07 20:44:09
摘 要
目前,人脸检测在生物识别领域和辅助驾驶领域得到了广泛的应用,其中,眼睛定位是面部识别和分析领域的关键步骤。因此,对人脸特征点检测的研究,尤其是研究如何获得高精度的眼睛定位具有重要意义。本文通过对人脸检测历史的研究发现,人脸检测从技术上可以分为三个阶段:模板匹配阶段、AdaBoost阶段和深度学习阶段。如今,深度学习已成为人脸特征点检测的重要手段。
本文首先介绍了深度学习的起源、发展、特点及与本研究密切相关的卷积神经网络。还介绍了本文用到的深度学习框架TensorFlow。本文主要研究了MTCNN、DAN和PFLD的网络结构及其基于TensorFlow的实现。MTCNN创造性的将人脸检测与人脸对齐结合,提高了检测精度;DAN首次引入特征点热点图,这使得在人脸检测的所有阶段可以使用整个人脸图像作为输入;PFLD使用辅助网络预测几何信息,主干网络使用MobileNet块,模型大小紧凑、灵活多变。研究结果表明,三种算法检测效果优异,高精度地完成了眼部特征点检测任务,尤其可以不受姿态变化、光照强弱的影响。综合这三种方法来看,PFLD检测效果最好。所得结果对于生物识别和辅助驾驶领域具有重要意义。
关键词:深度学习;人脸检测;人脸对齐;眼睛识别
Abstract
Currently, face detection has been widely used in the field of biometrics and assisted driving. Among them, eye positioning is a key step in the field of facial recognition and analysis. Therefore, the research on face feature point detection, especially how to obtain high-precision eye position is of great significance. Through research on the history of face detection, this paper finds that face detection can be technically divided into three stages: template matching stage, AdaBoost stage and deep learning stage. Today, deep learning has become an important means of face landmarks detection.
This article first introduces the origin, development, characteristics of deep learning and the convolutional neural network that is closely related to this research. It also introduces the deep learning framework TensorFlow used in this article. This paper mainly studies the network structure of MTCNN, DAN and PFLD and its implementation based on TensorFlow. MTCNN creatively combines face detection with face alignment to improve detection accuracy; DAN introduces landmark heat-maps for the first time, which makes it possible to use the entire face image as input in all stages of face detection; PFLD uses an auxiliary network to predict geometry Information, the backbone network uses MobileNet blocks, so that the model size is compact and flexible. The research results show that the three algorithms have excellent detection effects and complete the task of detecting eye feature points with high precision, especially they can be free from the influence of posture changes and light intensity. Based on these three methods, PFLD has the best detection effect. The results obtained are of great significance in the field of biometrics and assisted driving.
Key Words:Deep learning; face detection; face alignment; eye recognition
目录
第1章 绪论 1
1.1 研究背景及意义 1
1.2 人脸检测的发展及研究现状 2
1.2.1 模板匹配阶段 2
1.2.2 AdaBoost阶段 3
1.2.3 深度学习阶段 5
1.3技术路线 6
第2章 深度学习与TensorFlow 8
2.1 深度学习简介 8
2.1.1 起源 8
2.1.2 发展 8
2.1.3 特点 9
2.1.4 多层感知机 10
2.1.5卷积神经网络 11
2.1.6 优化算法 13
2.1.7欠拟合与过拟合 13
2.2 TensorFlow简介 16
2.2.1张量 16
2.2.2节点 16
2.2.3计算图 17
2.2.4会话 18
第3章 MTCNN算法实验 19
3.1算法介绍 19
3.2环境配置与数据预处理 19
3.2.1环境配置 19
3.2.2数据预处理 19
3.3程序设计 20
3.3.1主函数检测流程设计与实现 20
3.3.2损失函数设计与实现 21
3.4实验与结果分析 23
3.4.1训练参数设置 23
3.4.2检测结果 23
第4章 DAN算法实验 24
4.1算法介绍 24
4.2环境配置与数据预处理 24
4.2.1环境配置 24
4.2.2数据预处理 24
4.3程序设计 25
4.3.1程序主框架 25
4.3.2前馈神经网络设计与实现 26
4.3.3连接层设计与实现 27
4.3.3损失函数设计与实现 28
4.4实验与结果分析 28
4.4.1训练参数设置 28
4.4.2检测结果 29
第5章 PFLD算法实验 30
5.1算法介绍 30
5.2环境配置与数据预处理 31
5.2.1环境配置 31
5.2.2 数据预处理 31
5.3程序设计 31
5.3.1程序主框架 31
5.3.2损失函数设计与实现 32
5.3.3主干网络设计与实现 33
5.3.4辅助网络设计与实现 34
5.4实验与结果分析 34
5.4.1训练参数设置 34
5.4.2检测结果 35
结论与展望 36
参考文献 37
致谢 39
第1章 绪论
1.1 研究背景及意义
在一幅任意的数字图像中找到人脸的位置和大小的计算机技术被称为人脸检测。一般来说,人脸检测只需要负责找出面部区域并识别是否为人脸,同时在检测过程中需要略过环境中的干扰;更进一步,人脸检测可以精细地从人脸图像中定位各个器官的特征点。