行人重识别方法研究毕业论文
2020-04-04 10:53:35
摘 要
行人重新识别(re-id),目的是在相互不重叠的摄像机网络中搜索出一个特定的行人,近年来行人重识别技术受到广大学者的广泛的关注。这项任务也非常具有挑战性,特别是当数据库中每个人只存在单个的图像的时候。本文提出了一种基于HSV模型利用马氏距离的学习来和特征点匹配相结合的行人重识别算法来研究行人重识别技术。这个方法首先是依据改良的HSV空间颜色量化策略,比对两幅行人图像的躯干部分和腿部的主颜色是不是相同,来快速确定出需要识别的目标,做一个初识别;然后再对需要识别的目标,使用环形Gabor滤波器组生成多尺度图像,再用改良的FAST算法和BRIEF算法对多尺度图像进行特征点的提取与描述,最后再用深度学习中度量学习方法进行特征点匹配和提纯,来达到比较好的匹配效果,提高匹配的精准度。在度量学习中本文使用学习马氏距离的算法进行度量学习。学习马氏距离的算法有两个非常显著的特点:(1)为了获得训练数据的最佳可分离性,首先需要通过将类间距离强制为零来最大限度地减小内部类距离;(2)可以提高学习度的泛化能力,然后最大化不同类之间的最小边界。这个方法,称为等距离约束的度量学习方法(EquiDML),应用最小二乘回归原理将同一个人的图像映射到一个规律的单形的同一顶点上,并将不同的人的图像映射到一个规律的单形的不同顶点上。所以,在已经学习的指标下,相同类别的图像会被折叠到单个点,而不同类别的图像则会被转换成等距离的。
关键词:HSV颜色空间;行人重识别;马氏距离;特征点匹配
Abstract
Pedestrian re-id (re-id) is designed to search for a specific pedestrian in a non-overlapping camera network. In recent years, pedestrian re-identification technology has received wide attention from scholars. This task is also challenging, especially when everyone in the database only has a single image. In this paper, a pedestrian re-identification algorithm based on HSV model which combines markov distance learning with feature point matching is proposed to study pedestrian re-identification technology. This method is based on the modified HSV color space first quantitative strategy, comparing two pedestrians image part of the trunk and legs is the main color of the same, to quickly determine the need to identify the targets, do an early identification; Then to need to identify target, using the ring of multi-scale image Gabor filter, BRIEF, algorithm and an improved FAST algorithm of multi-scale image feature points extraction and description, final reoccupy metric learning method in deep learning feature point matching and purification, to achieve better matching effect, improve the matching accuracy. In measurement learning, this paper USES the algorithm of learning markov distance for measurement learning. Markov distance learning algorithm has two significant features: (1) in order to obtain the best separability of training data, you first need to through the class force is zero to minimize the distance between the inner class distance; (2) it can improve the generalization ability of learning degree, and then maximize the minimum boundary between different classes. This method, learning method of measurement called the equidistance constraints (EquiDML), using the least squares regression principle will be the same image map to a regular on the same vertices of the simplex, and different people's image maps to a different rule of simplex vertices. Therefore, under the learned indicators, images of the same category will be folded to a single point, while images of different categories will be converted to equidistance.
Key Words:HSV color space; pedestrian recognition; Mahalanobis distance; feature point matching
目 录
第1章 绪论 1
1.1课题研究的背景及意义 1
1.2 国内外研究现状 1
1.3 本文主要研究内容 4
第2章 研究方法概述 5
2.1 本文提出的研究方法概述 5
2.1.1 HSV颜色空间 5
2.1.2 Gabor滤波器 5
2.1.3 FAST算法特征点检测 6
2.1.4 BRIEF特征描述子 6
2.1.5 等距离约束的度量学习 6
2.2 本文所采用的研究算法概述 7
第3章 HSV颜色空间初识别和基于特征点匹配的行人重识别 9
3.1 引言 9
3.2 基于HSV颜色空间的行人初识别 9
3.3 多尺度环形Gabor滤波器 10
3.4 改良的FAST算法的特征点检测 11
3.5 改良的BRIEF特征描述 12
第4章 等距离约束度量学习 14
4.1 引言 14
4.2 等距离约束的度量学习 14
4.3 梯度解决方法 16
第5章 实验及分析 19
5.1 实验设计及分析 19
5.2 实验结果及分析 19
第6章 总结 20
6.1本文研究总结 20
6.2研究的不足及展望 20
致谢 21
参考文献 22
第1章 绪论
1.1课题研究的背景及意义
行人重识别一般也叫做行人再识别,它是使用计算机视觉技术来判别图像或者视频中是不是存在一个特定的行人的一项技术,它通常被认为是一个图像检索的分问题。随着科学技术水平的不断进步,视频采集技术和大规模数据存储技术的快速发展,越来越多的摄像机网络被部署在我们生活的公共场所上,传统的人工监控已经越来越难以应对如此大量的视频和图片,而且随着人类社会安全问题越来越具有挑战性,视频监控技术的智能化成为了解决这个问题的主要方法。研究这个问题对社会公共安全和刑事侦查也有十分重要的意义。
行人重识别是指给定一幅行人图像或者一段视频,在已经存在的可能来自于非重叠的摄影机的图像或视频当中,识别出目标行人。行人重识别的图像或视频一般来自于不同的摄像机,由于不同摄像设备之间的差异,而且行人自身同时又有刚性和柔性等特性,图像和视频中行人外观容易受到着装、遮挡、姿态和视角等因素的影响,所以如何准确而且快速的识别出特定行人,成为了这个问题的主要研究方向。
行人重识别的研究同时面临着类似图像分辨率低、视角变化多、姿态变化不确定、光线变化明显以及遮挡范围较大等问题。现如今的监控视频的画面一般比较模糊,分辨率也比较低,所以利用人脸识别等方法基本无法进行重识别的工作,只能通过头部以外的行人人体外部信息来进行识别,然而不同行人的体型和着装服饰很有可能一样,这也为行人重识别的准确度带来了非常大的挑战。而且行人重识别的图像和视频往往来自于不同的摄像机,由于拍摄场景、摄像机参数不同,行人重识别的工作通常也会存在光照变化及视角变化等问题,这又使得同一个行人在不同摄像机下有着比较大的差别,不同的行人的外貌特征可能比同一个人的外貌特征更相似。进行重识别的行人图像很可能拍摄于不同的时间,行人姿态、着装也会有不同程度的改变。除此之外在不同的光照条件下,行人的外观特征也会有非常大的差异。并且实际视频监控下的场景又十分复杂,很多监控场景的人流量非常大,场景十分复杂,画面很容易出现遮挡等情况,这种时候靠步态等特征就很难进行重识别。以上的各种情况都会给行人重识别的研究带来了十分巨大的挑战,所以目前的研究离实际应用还有很大的距离。这也给这一研究领域提供了前景十分可观的巨大的发展空间。
1.2 国内外研究现状
相对于行人检测来说,行人重识别的研究还不算成熟,行人重识别的研究开始于二十世纪九十年代中期[16],在 2006 年,行人重识别的概念第一次在CVPR 上提出[17]后,相关的研究就不断的涌现。2007年Gray提出了一个对于行人重识别的研究具有重大意义的数据库VIPeR[18]。此后就有越来越多的学者开始关注并从事行人重识别的研究。近些年,每年在国际顶级的会议以及顶级期刊上关于行人重识别的工作也不少。
早期的研究者们借鉴和引入了一些图像处理、模糊识别领域的成熟方法,侧重于研究行人的可用特征、简单分类等算法。到了2010年,行人重识别技术的训练库就开始大规模化,广泛地采用深度学习框架[19][20],深度学习不仅应用于提取高层的特征,同时也为度量学习的研究带来了新的革新。行人重识别最开始是在基于图像的情况下,也就是在每个数据集中每个摄像机下只有一幅或者几幅行人图像。但是视频相较于图像而言拥有更多的信息量,并且基于视频的研究[21]更符合视频监控环境下的现实情况,更具有现实意义。所以越来越多学者开始重视并研究视频下的行人重识别的方法。
现如今行人重识别的研究越来越火热,而在大多数现有的研究方法中,他们将重识别问题转化为计算目标图像与候选图像之间距离度量问题,并且提出来许多方法。但是大多数的方法都没有注意到摄像头参数和图像背景对重识别结果会造成的影响。在章东平、许丽园的研究中[1],他们首先为每一对摄像头学习一个距离度量模型,然后根据摄像头对结果的影响强度再为这些模型分配相应的权值,最后对度量模型与它相应权值的乘积进行累加与优化,得到最终的距离度量模型。这种研究方法可以有效的优化现有的基于距离度量学习的方法,能够有效的排除设备所带来的影响,值得学习。
在行人重识别研究中,行人姿态改变是个很头疼的问题。在王金,刘洁,高常鑫,桑农的研究中[2],他们先将训练集中的行人图片进行稠密图像块采样获得图像块集合, 然后对每一个图像块提取其局部表观空间特征, 最后在此特征集上聚类得到通用的行人部件字典。通过这部字典,将行人分割后向部件字典投影,再进行匹配,成功率会高很多。但是我个人认为这种方法的资源占用会很大,因为需要对训练库进行采样提取。
在宋婉茹,赵晴晴,陈昌红,干宗良,刘峰的研究中[3],详细的对行人重识别研究的成果和方法进行了概述。他们从图片和视频两方面进行描述,内容比较丰富,适合入门快速了解这一研究。
彭志勇的研究中解决了尺度、视角和光照变化对重识别的影响,而且是从视频中获取行人图像[11],这一点更重要但是也更难。他首先用背景分差法检测运动中的行人,再用主颜色对比和特征点匹配的方法进行重识别。进行重识别的方法是目前主流方法之一,不算特别精准,但效果也还行。在检测到目标行人后,再用跟踪方法获得目标行人图像。对于这一套方法,背景分差法有朴春赫,潘怡霖,赵海,朱宏博研究的基于改进ViBe的多行人检测方法[12],他们详细叙述了ViBe对多行人检测的优势和方法,很值得深入学习。而在重识别方面,彭志勇,常发亮,刘洪彬,别秀德所研究的基于HSV模型和特征点匹配[6]的行人重识别算法就很有效果,它为了提高算法的识别速率和准确度,适应了目标行人图像样本少、视频场景变化的现实情况,也是需要深入学习和了解。最后在跟踪识别方面,管皓,薛向阳,安志勇所研究的通过深度学习[13]来进行行人跟踪就详述了这一方法。在彭志勇的这套方法中采用的就是基于均值漂移的跟踪算法。我个人认为这套方法集中了很多优秀方案,而且还进行了优化。
张华的基于空间颜色特征的行人重识别方法中提出了以视频侦查应用为背景,建立一种在计算复杂度和性能上较均衡的行人外貌特征描述符[4],这样一定程度上降低了光照变化对颜色特征稳定性的影响,同时他是将行人分割成躯干和腿,然后在分割的,这样就能提高颜色直方图对光照和姿态变化的鲁棒性。这种方法就比较细致了,他的研究只针对颜色特征的变化,没有太在意姿态的影响,同样也值得深入研究。
杨钰源的基于度量学习和深度学习的行人重识别研究[5]中在重识别方面加入了深度学习,通过微调训练得到深度卷积神经网络模型,然后通过这个模型进行特征提取。这种方法在近几年研究中比较热门,采用深度学习能更有效的进行重识别。
Venice Erin Liong,Jiwen Lu,Yongxin Ge提出了一种基于正则化的局部度量学习法[7],这种方法避免了过度拟合的问题。这种方法结合了全局和局部的度量来表现每个类之间的差异。这也是更为细致的重识别方法,采用参数化方式来规范协方差矩阵。
Jin Wang,Zheng Wang,Chao Liang,Changxin Gao,Nong Sang的研究[8]是目前我查找到的最新的研究成果,他们提出学习马氏距离的深度学习算法,减少了内部类的距离,最大化不同级层间的边缘。
Liangliang Ren,Jiwen Lu,Jianjiang Feng,Jie Zhou提出的研究适用于RGB-D图像的重识别方法[9],与彭志勇的不同,后者是在Lab颜色空间上进行处理。
Wen Fang,Hai-Miao Hu,Zihao Hu,Shengcai Liao,Bo Li使用感知哈希法将底层特征映射绑定[10],并结合多个特征通道进行特征编码,然后建立一个图像金字塔,并对三个区域统计数据进行了层次特征描述的方法,使其对光照和视点变化都具有鲁棒性,也是单方面的优化重识别方法。
Jiayun Wang,Sanping Zhou,Jinjun Wang,Qiqi Hou则是提出具有特征学习与融合的深度排序模型[15],通过学习一个大的自适应边界来解决人的再识别问题,也是深度学习运用于重识别上面的另一种方式。
Huang W, Hu R, Liang C等人的研究[14]则在实际生活中有很大关系,他们提出在相近的两台摄像机里,同一行人出现的概率要大。所以他们在视觉差异的前提上有加上了时空约束,利用行人在某一特定时间走向某一特定摄像机的可能性来更快速的查找到行人。他们的研究旨在提升对不同摄像头选定的速度来加快查找速度。
1.3 本文主要研究内容
本文研究综合了现有的行人重识别研究方法,将最开始通过颜色和特征点匹配的方法通深度学习领域结合(图1.1)。
研究中特征提取主要包含颜色识别以及特征点匹配。由于HSV颜色空间最贴近人眼直观感觉,所以选择基于HSV空间颜色的量化策略来对行人图片的躯干部分进行初识别,快速筛选出备选目标。然后对备选目标,利用环形Gabor滤波器生成多尺度图像,再利用改进的FAST算法与BRIEF算法对多尺度图像进行特征点提取与描述,最后通过度量学习找到最优的度量函数进行匹配。
本文设计的度量学习通过等距离约束来学习马氏距离,将类内变量在最大程度上最小化,而且不同类的点嵌入到不同的顶点,以保证不同类之间的最佳可分性。最重要的是等距离约束可以提高学习度量的泛化能力。
图1.1 研究数据流程图
第2章 研究方法概述
2.1 本文提出的研究方法概述
本文为了解决行人重识别研究中识别率低,识别过程复杂的问题,提出了先经由HSV颜色空间的行人初识别,然后再通过滤波、特征点检测和描述来进行特征点选取,最后使用学习马氏距离的度量学习进行特征点的匹配。
2.1.1 HSV颜色空间
在视频内的容分析以及多媒体的检索等应用中,行人重识别技术是一项非常关键的技术。到目前为止,已经提出的行人重识别算法大致分为两类,一类是基于特征描述的方法进行识别[22],另一类是基于距离度量学习的方法进行识别[23]。基于特征描述的方法是通过设计具有区分性和稳定性的描述子来对两张行人图像的相似度进行度量的。SDALF (symmetry–driven accumulation of local features)算法[22]就是基于特征描述的算法中最具代表性一个算法,它将行人人体目标分割为头部、躯干和腿部三部分,利用加权的HSV直方图、最大稳定颜色区域和重复纹理块这三种特征进行组合识别,这个算法的识别性能还比较好,但是描述符的计算复杂度比较高,存储的开销比较大。和基于特征描述的方法不同,基于距离度量学习的方法则是通过机器学习,训练出距离测度或者是分类器,让同一个行人的图像对的相似度尽可能的提高,让不同行人的图像对的相似度尽可能的降低。基于距离度量学习的方法对特征的选择要求比较低,一般可以得到比特征描述类的方法更好的识别效果,但是它也有它不如意的地方。一方面它的训练时间比较长,而且空间的复杂度也比较高,而且另一方面它对训练的样本和视频的场景有非常大的依赖性。
为了适应目标行人图像样本比较少,视频场景的变化比较复杂的现实情况,而且还要提高算法的识别速度和准确度,本文提出了一种基于HSV颜色空间模型和特征点匹配的行人重识别算法。首先利用HSV颜色空间模型对行人图像进行初识别,对比两幅行人图像分割后的躯干和腿部的主颜色是不是一致,然后对经过初识别阶被段判定为备选目标的行人图像进行特征点的提取,让特征点和模板图像进行匹配。假如匹配成功的点的对数达到一定的阈值,就可以认为这两幅行人图像中的行人为同一行人目标。
以上是毕业论文大纲或资料介绍,该课题完整毕业论文、开题报告、任务书、程序设计、图纸设计等资料请添加微信获取,微信号:bysjorg。
相关图片展示: