登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 机械机电类 > 测控技术与仪器 > 正文

基于pytorch的行人重识别研究毕业论文

 2021-04-06 21:40:42  

摘 要

行人重识别(Person re-identification)也称为行人再识别,它使用计算机视觉技术来确定图像和视频序列中是否存在特定行人。是检索图像的分支之一。即确定一个监控器下的某一个行人图像,查找其他监控器或者设备下的该行人图像。当前固定摄像头有视觉局限性,本技术解决了这个问题,并可和行人检测/人脸识别技术相结合,可广泛应用于智能安保、智能视频监控等范畴。

本课题对行人重识别的方法进行了研究,本文提出了一种改进型的CNN模型——ResNet50模型以解决行人重识别问题。主要研究工作有:1.建立并优化ResNet模型,搭建了一个全新快速有效的模型。2.选用PyTorch框架进行训练,4.选择Market-1501作为本研究的数据集。最终达到了第一张就检索出正确行人(rank-1)的准确率为0.8795,mAP为0.7156。

关键词:卷积神经网络 行人重识别 PyTorch

Abstract

Pedestrian Recognition (Person re-identification), also known as Pedestrian Recognition, uses computer vision technology to determine whether there is a specific pedestrian in an image or video sequence. It is widely considered as a sub-problem of image retrieval. Given a monitoring pedestrian image, the pedestrian image across devices is retrieved. It aims to make up for the visual limitation of the fixed camera, and can be combined with pedestrian detection/pedestrian tracking technology. It can be widely used in intelligent video surveillance, intelligent security and other fields.

In this paper, the method of pedestrian recognition is studied. An improved CNN model, ResNet50 model, is proposed to solve the problem of pedestrian recognition. The main research work is as follows: 1. Establish and optimize ResNet model, and build a new fast and effective model. 2. Select PyTorch framework for training. 4.Choose Market-1501 as data set. Finally, the accuracy of searching the right pedestrian is 0.8795 when the first one is reached.

Keywords: Convolutional Neural Networks Person re-identification PyTorch

目录

摘要 1

Abstract 1

第1章绪论 1

1.1研究目的及意义 1

1.2国内外研究现状 2

1.3本文研究内容 3

1.4本文结构安排 3

第2章深度学习理论 5

2.1深度学习 5

2.1.1深度学习介绍 5

2.1.2深度学习常用网络结构以及区别简介 7

2.2卷积神经网络(CNN) 9

2.2.1卷积 9

2.2.2卷积网络的经典结构 11

2.3深度学习常用框架 14

第3章 数据库的图片处理 16

3.1 行人重识别常用数据库以及数据库选择 16

3.2 Market-1501数据库简介 16

3.2.1数据集简介 16

3.2.2数据集目录介绍 17

3.2.3数据集命名规则 18

3.2数据集处理 18

第4章模型的构建与训练 19

4.1训练环境简介 19

4.2 ResNet模型的构建与优化 19

4.2.1 批训练值的选取 19

4.2.2 学习率的选取 19

4.2.3 本模型的网络结构……………………………………………………………………20

4.3模型的训练 21

第5章行人重识别测试 23

5.1 特征提取 23

5.2评估 23

5.3简单的可视化以及结果 24

第6章总结与展望 25

参考文献 26

致谢 28

第1章绪论

1.1研究目的及意义

行人重识别(Person Re-identification)又名行人再识别,本文简称为ReID,它使用计算机视觉技术来确定图像和视频序列中是否存在特定行人。是检索图像的分支之一[1]。即确定一个监控器下的某一个行人图像,查找其他监控器或者设备下的该行人图像。

当今社会高速发展,大众越来越关注城市的公共安全。目前公众治安的重要手段之一即为监控视频,这在城市秩序、走失人口查询、刑事侦察等方面中扮演着极为重要的角色。这一过程中最为关键的一环,也是最重要的前提条件即为对目标人物的定位与追踪。在实践操作过程中,存在这些问题:

  1. 监控视频普遍分辨率很低,较为模糊,传统的人脸识别难以识别模糊不清的人脸,只能利用非脸部即身体、身材比例等人体外观来识别,而体型和衣着服饰也有可能雷同,这对准确识别给定行人带来了非常大的挑战。
  2. 往往是使用不同的摄像机观测行人,由于拍摄地点、摄像头等的差异,一般存在视角变化或者是物品遮挡,这导致不同摄像机拍摄的同一个行人有很大差别,不同行人的身体特征有时候比同一个人的身体特征更类似。
  3. 进行重识别的目标图像一般是不同时间拍摄的,目标有时候会改变姿态及衣着。不同时间的光照也会不同,所以会对身体特征造成影响。
  4. 生活监控有着非常复杂的场景,许多监控场景场景复杂,交通量大,容易发生屏幕遮挡。此时,通过步态和其他特征很难识别成功。
  5. 现在大多数监控系统还是人工监控,但是监控网络不断扩展,在成千上万的监控视频中,用人工的方式找到特定行人的成本无法估量,不仅容易出错,效率低下而且影响了时效性。

对于这些不足点,公众开始寻找智能的机器来完成行人重识别任务。在此想法出现之后,很多研究者踏入了这一行业,行人重识别(Person Re-identification) 的课题也由此开展[2]

在现实摄像头视频中,因成本原因导致的摄像头所示照片不清晰,人脸非常模糊,使得人脸识别失去效果。这时候,ReID就成为了不可替代的新技术。跨设备即跨摄像头是ReID的一个重要特点,所以研究中评估性能的时候,是要在不同设备(摄像头)下找出相同行人图片。ReID已经在学术界研究多年,但是直到深度学习技术的突破性发展,才取得了很大的进步[3]

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图