基于视频的目标检测与跟踪算法实现开题报告
2020-04-13 13:10:50
1. 研究目的与意义(文献综述)
目标跟踪是计算机视觉研究领域的热点之一。被广泛地应用于航空、公共安全、商业、自动驾驶等方面。作为视频监控中最基础的环节 - 目标的检测与跟踪技术,一直以来更是人们关注的热点问题。目标是否能够被成功跟踪主要取决于能否成功将目标从它周围环境中分割出来,因此可以把目标的检测与跟踪问题 转换成二分类问题, 只要找到合适的特征和判别分类器就可以实现高效准确的跟踪。
过去几十年以来,目标跟踪的研究取得了长足的发展。从meanshift、粒子滤波(particle filter)和kalman filter等经典跟踪方法,到基于检测(track by detection)或相关滤波(correlation filter)的方法,到最近三年来出现的深度学习相关方法。每年在几个主要跟踪数据集上的竞赛非常激烈,方法也越来越多。
对于目标视觉跟踪,公认两大类方法:生成(generative)模型方法以及判别(discriminative)模型方法。目前比较流行的是判别类方法,也叫检测跟踪tracking-by-detection。生成类方法是 在当前帧对目标区域建模,下一帧寻找与模型最相似的区域就是预测位置,比较著名的有卡尔曼滤波, 粒子滤波,mean-shift等。判别类方法,otb50里面的大部分方法都是这一类,cv中的经典套路图像特征 机器学习 , 当前帧以目标区域为正样本,背景区域为负样本,机器学习方法训练分类器,下一帧用训练好的分类器找最优区域。判别类方法与生成类方法最大的区别是,分类器采用机器学习,训练中用到了 背景信息,这样分类器就能专注区分前景和背景,所以判别类方法普遍都比生成类好。举个例子,在训练时告诉tracker目标80%是红色,20%是绿色,还告诉它背景中有橘红色,要格外注意别搞错了,这样的分类器知道更多信息,效果也相对更好。tracking-by-detection 和检测算法 非常相似,如经典行人检测用hog svm,struck 用到了haar structured output svm,跟踪中为了尺度自适应也需要多尺度遍历搜索,区别仅在于跟踪算法对特征和在线机器学习的速度要求更高,检测范围和尺度更小而已。
2. 研究的基本内容与方案
kcf是一种鉴别式追踪方法,这类方法一般都是在追踪过程中训练一个目标检测器,使用目标检测器去检测下一帧预测位置是否是目标,然后再使用新检测结果去更新训练集进而更新目标检测器。而在训练目标检测器时一般选取目标区域为正样本,目标的周围区域为负样本,当然越靠近目标的区域为正样本的可能性越大。
kcf的主要工作
3. 研究计划与安排
2018.3.22——2018.4.10:完成对算法的学习
2018.4.10——2018.4.30:完成程序编写工作
2018.4.30——答辩:完成毕业论文的撰写
4. 参考文献(12篇以上)
[1]: henriques j f, rui c, martins p, et al. high-speed tracking with kernelized correlation filters [j]. ieee tpami, 2015.
[2]: henriques j f, caseiro r, martins p, et al. exploiting the circulant structure of tracking-by- detection with kernels [c]// eccv, 2012.
[3]: bertinetto l, valmadre j, henriques j f, et al. fully-convolutional siamese networks for object tracking [c]// eccv, 2016.