基于深度学习的对象检测文献综述
2020-06-23 21:00:10
1. 选题背景与意义 对象检测作为图像处理和计算机视觉领域中的经典课题,在交通监控,图像检索,人机交互等方面有着广泛的应用。
它旨在一个静态图像(或动态视频)中检测出人们感兴趣的目标对象。
传统的对象检测算法中提取和分类决策分开进行,对特征选取的要求就更加严格,在面对复杂场景的时候很难得到理想结果。
自从Geoffrey Hinton教授提出深度学习理论,越来越多研究学者尝试采用深度学习理念来解决对象检测问题,并且提出了许多不同的模型。
相比于传统对象检测算法,卷积神经网络中特征提取和模式分类并行进行,而且随着层数的增多可以更好地处理复杂场景。
目前深度学习已在图像处理,计算机视觉等领域取得了令人惊讶的成绩,更是在工程应用方面表现出极大的潜力。
如今国内外互联网巨头企业纷纷在争取抢占该领域的科技制高点,可见深度学习不仅是目前的研究热点,更是未来的发展方向。
2. 国内外研究现状 2.1对象检测研究现状 目标检测就是”给定一张图像或者视频帧,找出其中所有目标的位置,并给出每个目标的具体类别”。
简单的说:对象检测就是计算机模拟人眼通过图片获得自己感兴趣的对象。
对象检测对于人来说是再简单不过的任务,但是对于计算机来说,它看到的是一些值为0~255的数组,因而很难直接得到图像中有人或者猫这种高层语义概念,也不清楚目标出现在图像中哪个区域。