基于对抗生成网络的行人重识别研究毕业论文
2022-01-09 17:49:00
论文总字数:28539字
摘 要
行人重识别的数据集匮乏已经成为限制其技术落地的瓶颈之一,生成对抗网络技术恰巧可以弥补这一不足,为行人重识别提供大量样本。但是由于目前生成对抗网络不能够做到完全可控,生成的图片会损失掉一些细节,直接用来训练网络反倒会增加干扰。所以本文在DGNET的基础上对PATN网络结构进行了改进,使得生成的图片与原图片颜色分布更加一致减轻了对目标图片的依赖。进一步解除了图片与其所属姿势之间的耦合关系。之后利用增强了的生成图片扩充了行人重识别数据集并利用生成的图片作为三元组的负例对行人重识别网络进行训练。对训练之后的模型进行了Rank-1等指标上的检验,发现改进后的模型相较于基准模型有了较大的提升,证明了算法的有效性。我们希望之后可以将本文提出的方法与其他方法相结合进一步提升行人重识别模型性能。
关键词:行人重识别 生成对抗网络 颜色一致损失 三元组损失
Abstract
The lack of data sets for pedestrian re-recognition has become one of the bottlenecks restricting the landing of its technology. The generation of confrontation network technology can just make up for this deficiency, and provide a large number of samples for pedestrian re-recognition. However, the current generation of the confrontation network cannot be fully controlled, the generated pictures will lose some details, and directly used to train the network will increase interference. Therefore, this paper improves the PATN network structure on the basis of DGNET, so that the color distribution of the generated picture is more consistent with the original picture, reducing the dependence on the target picture. It further relieves the coupling between the picture and the pose it belongs to. Afterwards, the enhanced generated image is used to expand the pedestrian re-recognition data set and the generated image is used as a negative example of the triple to train the pedestrian re-recognition network. The trained model was tested on Rank-1 and other evaluation standards. it was found that the improved model was greatly improved compared to the benchmark model, proving the effectiveness of the algorithm. We anticipate that the method proposed in this paper can be combined with other methods to further improve the performance of the pedestrian re-identification model.
Keywords: Person re-identification; GAN; Consistent color loss; Triplet loss
目 录
摘要 I
Abstract II
目 录 III
第一章 绪论 1
1.1本文研究背景与意义 1
1.2国内外研究现状 2
1.2.1 行人重识别 2
1.2.2 对抗生成网络 2
1.2.3 基于生成图片的行人重识别 4
1.2.4 其它相关工作 4
1.3本文的主要工作 5
1.4本文结构安排 5
1.5本章小结 6
第二章 行人重识别网络 7
2.1评价指标 7
2.1.1 Rank-n 7
2.1.2 mAP 7
2.2数据集介绍 8
2.3网络结构 9
2.4损失函数 10
2.5实验结果 11
2.6本章小结 13
第三章 基于DG-Net外观模块的PATN改进模型 14
3.1位姿变换网络PATN 14
3.1.1 PATN网络结构 14
3.1.2 PATN性能指标 16
3.1.3 位姿变换效果 16
3.2 DG-Net外观模块 17
3.2.1 DG-Net网络细节 17
3.3基于DG-Net外观模块的PATN改进模型 19
3.3.1 生成器 19
3.3.2 鉴别器 20
3.3.3 训练总损失 20
3.4本章小结 20
第四章 实验结果 21
4.1实验平台 21
4.2实验步骤 21
4.3生成图片对比 21
4.4 PATN改进模型指标对比 24
4.5行人重识别指标对比 24
4.6本章小结 26
第五章 总结与展望 27
5.1当前工作的效果与不足 27
5.2展望 27
参考文献 28
致 谢 31
第一章 绪论
1.1本文研究背景与意义
行人重识别(Person re-identification)可以看作是图像检索的一个子问题, 该技术利用计算机视觉技术判断图像或者视频中是否存在特定行人。一般需要从给定的几段不同摄像头的监控中检索出跨摄像头的某个特定行人图像,这一技术可以弥补当前固定摄像头的视觉局限, 并可与行人检测、行人跟踪技术相结合, 应用于视频监控、智能安防等领域[1]。
和传统方法不同,现在重识别领域广泛应用的深度学习方法经过训练可以自动的从给定图像或视频中计算出区分度高的行人图像特征,同时学习得到较好的相似度度量。当然深度学习相关的行人重识别方法也经历了一个从简单到复杂的发展过程。起初研究者主要关注用网络学习单帧图片的全局特征,根据损失类型的不同可以分为表征学习[2、3、4] (Representation learning)和度量学习(Metric learning)方法[5]。但是仅凭单帧图片的全局特征在目前行人重识别数据集较小的情况下,识别的准确率和召回率难以达到要求。于是研究者们引入局部特征[6]和序列特征[7、8]进一步发展行人重识别研究。如何利用局部特征等其他潜在图像信息提高行人重识别模型的泛化能力,应对一些常见的行人遮挡、姿态变化、尺度等问题,具有重要的研究价值。目前由于涉及隐私和标注困难等多方面原因行人重识别的数据集较小。这就造成了模型过拟合训练集从而使得测试集或者跨域数据集的性能下降,因此如何充分利用现有的数据集,提高行人重识别模型的泛化性能具有十分重要的意义,有待深入开展研究。
请支付后下载全文,论文总字数:28539字