基于深度学习的行人识别毕业论文
2021-04-19 00:21:46
摘 要
近年来,随着目标识别和计算机视觉的发展,目标识别技术也有着越来越广泛的应用范围。行人识别是目标识别的一种应用分类,行人识别在智能交通系统、安全驾驶辅助系统、无人驾驶系统等应用都是核心技术。无人驾驶系统也是目前热门的研究点,百度、谷歌、特斯拉各大公司都在研发无人驾驶汽车,但近几年来无人驾驶汽车频发车祸事故,说明了行人识别技术目前还不够完善,所以,对行人识别技术的研究及改进是有必要的。
本文通过构建行人识别网络模型,用卷积神经网络提取行人特征,用选择性算法生成目标候选区域,用两个损失函数对分类和边框回归进行训练,经过实验证明,该行人识别模型可以正确识别并用方框标记出图像中的所有行人。
关键词:行人识别;卷积神经网络;选择性算法;边框回归
Abstract
In recent years, with the development of object identification and computer vision, object identification technology has also become more and more widely used. Person identification is an application classification of object identification. Person identification is a core technology in applications such as intelligent transportation systems, safe driving assistance systems, and driverless systems. The driverless system is also a hot research point at present. Companies like Baidu, Google, and Tesla are all research and development driverless cars. But in recent years,driverless cars frequently cause traffic accident. It shows that technique is not perfect at present. Therefore, it is necessary to research and improve the person identification technology.
This paper constructs a model of person identification neural networks, using convolution neural networks to extract person features, using the selective search algorithm to generate object proposal , and use two loss functions to train classification and Bounding-Box regression. After experimental verification, the person identification model correctly identifies and marks all person in the image with boxes.
Key words: Person identification; Convolutional Neural Network; Selective Search algorithm; Bounding-Box regression
目 录
第一章 绪论 1
1.1课题背景及意义 1
1.2国内外研究状况 2
1.3本文结构及工作 2
第二章 基于深度学习的行人识别相关理论与技术 4
2.1卷积神经网络 4
2.1.1 卷积层 5
2.1.2 池化层 6
2.2 选择性搜索算法 7
2.2.1 选择性搜索在模式识别中的应用 7
2.2.2 选择性搜索算法流程 7
2.2.3 相似度计算 8
2.3 边框回归 9
2.4 ROI pooling层 11
2.5 损失函数 12
2.5.1 SoftmaxLoss函数 12
2.5.2 Smooth L1 Loss函数 13
2.6 Tensorflow 13
第三章 行人识别网络搭建 15
3.1 整体网络框架 15
3.2 特征提取网络的实现 15
3.2.1 特征提取网络结构的搭建 15
3.2.2 特征网络结构的训练 17
3.3 ROI Polling 层的实现 17
3.4 分类和位置精修网络的实现 18
3.4.1 分类和位置精修网络的搭建 18
3.4.2 分类网络的训练 19
3.4.3 位置精修网络的训练 19
3.5 创建行人训练数据集 19
第四章 实验及分析 21
4.1 卷积核尺寸 21
4.2 网络深度 22
4.3 训练迭代次数 23
4.4 测试结果与分析 25
第五章 总结 27
参考文献 28
致 谢 29
第一章 绪论
1.1课题背景及意义
随着模式识别和机器视觉的发展,目标检测技术得到了广泛的应用。行人识别作为目标识别的一种,有着非常重要以及广泛的应用性,是国内外计算机视觉领域的关注点之一,在视频监控、智能交通系统、以及安全驾驶辅助系统等应用都是核心技术。
在视频监控方面,人们对社会公共安全的需求越来越大,在公共场所的监控摄像就变得十分普遍,在人群密度较大的超市、火车站、小区、学校、医院等地方布置了大量的监控摄像。通过对拍摄的监控视频进行分析和研究,可以了解场所状况和获取有用的信息。但传统的视频监控主要由监控人员来观察监控屏幕,这样当监控设备数量大时,监控人员很难保证顾及到每个监控设备,并且容易产生疲劳感,使得监控效果差,也耗费大量的人力。人工监控已经很难处理海量增长的监控摄像数据,所以才需要使用计算机对监控摄像的行人进行识别和监控。通过先进的深度学习算法构建监控系统:可以自动对视频中的行人进行检测识别,进行分析,然后可以分辨出可疑人员,将其报告给安全人员进行预警。这样的系统能够有效提高视频监控的效率、可靠性和实时性,并且可以节省大量的人力物力。
在智能交通方面,随着经济发展,世界汽车数量呈爆发式增长,在城市汽车数量膨胀的情况下,其城市交通安全问题也越发严峻,每年的交通事故次数呈上升趋势,所以如何提高汽车的行驶安全和交通管理就显得有社会意义。交通管理可以通过摄像头进行监控对交通违规行为进行约束等等,在汽车行驶方面,目前国内外都在进行无人驾驶汽车或者辅助驾驶系统的研究,像谷歌、特斯拉、百度、Uber等公司都在研发无人驾驶汽车。而在汽车行驶中,行人是影响其安全驾驶的重要因素,所以行人识别技术也成为了其核心技术。在无人驾驶和辅助驾驶系统里通常都有多种传感器用来感知周围环境,其中也有行人目标检测与识别系统。通过行人识别这个模块,可以检测识别行人目标。这样可以对其进行安全评估,然后会给驾驶员做出提示或者控制汽车进行相应的动作,这样可以大大提高行人和车辆的安全。但是由于行人目标存在特殊性、周围环境和道路交通状况复杂,以及车速等原因,行人识别模块需要极高的实时性和准确性,但从目前发生的特斯拉和Uber无人驾驶汽车的致死事故看来,这一项技术还需要长足的发展,其实时性和准确性还需要提高,所以对行人识别技术进行更深入的研究和实践是有必要的。
1.2国内外研究状况
目前行人识别的方法主要由基于背景建模和基于统计学习这两种方法,基于背景建模方法就是对图像的背景进行建模,然后通过将图像与背景模型进行比较,得到前景目标(需要检测的目标)。在目标区域提取特征,利用分类器判断行人是否包含在内。但背景建模目前主要存在的问题:1、对图像的要求比较严苛,光照的强弱、图片拍摄时的抖动都会降低其检测效果。2、实时性较差,无法及时检测背景物体和前景目标的变化。3、当图像的环境较为密集(例如人群、树林等)时,其区分背景和前景目标时会较为困难。
而基于统计学习的方法是目前行人识别最常用的方法,行人识别分类器需要有大量的行人数据集进行训练构建。通常流程是先提取目标的主要特征(例如灰度值、边缘、纹理、颜色、梯度直方图),然后再利用分类器(例如SVM、softmax等)利用其特征值对目标进行分类。统计学习目前在实现行人识别上有以下几个问题:1、行人目标的特殊性;2、样本数据集很大程度上影响着分类器的效果;3、提取的特征在特征空间中分布较为分散。