相关滤波器算法在视频跟踪中的应用文献综述
2020-04-15 17:45:22
随着人工智能技术的发展,计算机视觉作为其中关键的一环历来饱受研究者关注[1]。而基于视频的目标跟踪又作为计算机视觉的基础问题之一,它涉及图像处理、模式识别、概率统计、机器学习等多学科理论知识,并在智能监控[2]、人机交互[3]、车辆导航[4]等众多领域中有着广阔的应用前景。
目标跟踪技术研究起源与上个世纪50年代,1955年Wax[5]首先提出了目标跟踪的基本概念,其后在1960年Kalman[6]提出了卡尔曼滤波器算法,Sitter[7]又于1964年提出基于贝叶斯理论的目标轨迹和轨迹最优数据关联,为目标跟踪理论的逐步成熟奠定基础。近十年来,目标跟踪算法从传统的光流法[8],均值漂移[9]、粒子滤波算法[10]转向基于学习的跟踪算法[11],与传统的跟踪算法相比,当前涌现的各类基于学习的方法在复杂视频场景下表现出了更好的跟踪性能。
按照目前通用的分类方法,当前的跟踪算法可以分为生成式模型和判别式模型两种[12]。生成式方法是从通过提取的相关特征中学习目标的外观模板,在搜索区域寻找匹配程度最高的区域作为目标的方法,如高斯混合模型[13],贝叶斯网络[14],马尔科夫模型等。判别式方法则是把跟踪问题转化为一个背景与前景的二分类问题,通过提取的相关特征训练一个分类器,在目标区域实现前景与背景的区分,如Struck[15],TLD方法[16]等。
在近几年的跟踪研究中,相关滤波方法[17](Correlation Filter)以其在速度和性能上的优势独占鳌头,其通过极高的效率解决岭回归问题完成了对目标的判断。值得一提的是,在2015年由Henriques[18]等人提出的核化相关滤波算法(KCF),利用循环矩阵的原理,将相关滤波器的求解过程运用快速傅里叶变换转换到频域,同时提出了解决多特征融合的方法,加入了方向梯度直方图(HOG),大大提高了目标跟踪的效果。
此外,随着深度学习在计算机视觉领域的不断发展,基于深度神经网络的目标跟踪算法也逐渐成为学术界的研究热点[19, 20]。将深度学习应用在目标跟踪领域,通常有两种思路:基于深度特征的相关滤波器与基于分类网络的目标跟踪[21]。其中的深度特征相较于传统手工特征,在相关滤波器中加强了语义信息,从而提高跟踪精度。而由于深度网络强大的拟合能力,利用多重网络结构实现二分类(目标和背景)的任务,也取得了许多先进的成果。