基于摄像头的多目标跟踪方法文献综述
2020-04-21 16:21:15
近年来,随着人工智能技术的迅速发展,传统汽车行业与信息技术结合,在汽车自动驾驶技术方面的研究取得了长足进步,业内很多大公司都在此领域投入巨资进行研发,如国外的谷歌、丰田,国内的百度、比亚迪等公司都推出了自动驾驶汽车,且实验结果令人满意。目前,主流自动驾驶技术都基于视频分析。
基于统计学习的行人检测主要包含基于生成式模型(局部)的检测方法和基于特征分类(整体)的检测算法:
1)基于生成模型的检测方法,通常采用局部特征或者肢体模型来描述局部属性,结合局部特征的空间结构特性或分布模型进行分类;
2)基于特征分类的检测方法,目的是找到一种能够很好地描述行人特征的方法。通过提取行人的灰度、边缘、纹理、颜色等信息,根据大量的样本构建行人检测分类器,从样本集中学习人体的不同变化,把视频图像中的行人目标从背景中分割出来并精确定位。
而在多目标跟踪模型的特征提取和表观模型建立过程中,通常会面临几大难点:
1)目标的随机性。目标随机性包括:目标个数的不断变化,比如一段视频序列中会有各种各样的行人不断出现和离开;目标运动状态的随机性,在跟踪行人目标时,其运动速度可能是匀速、加速、变加速,运动轨迹也可以是直线、曲线、甚至是不规则的曲线分布等;
2)背景的复杂性。造成背景复杂性的原因囊括了:光照的变化影响了可见光图像数据,进而导致目标表观特征发生变化,使得前景背景难以区分;动态背景扰动,实际视频序列中存在密集的人流、摇动的树木甚至公园的喷泉等动态背景都会导致视野模糊而造成算法性能下降;
3)目标外观的变化和相似外观的区分。在运动过程中,由于摄像头与行人之间的距离远近不同,人体的旋转等运动状态的改变都会造成局部区域的特征丢失与新特征的出现,增大了跟踪难度;
4)遮挡问题。遮挡包括但不限于目标之间相互遮挡、目标被背景障碍物遮挡,当目标较长时间内被遮挡甚至全部遮挡的情况下,绝大多数的目标跟踪算法无法处理这样的遮挡问题。
本论文的意义是在单目视觉条件下基于检测的在线多目标跟踪算法基础上,研究鲁棒性好、准确性高的多目标跟踪理论方法以改善上述问题,从而在车辆自动驾驶中完成对行人轨迹的预测,并给自动驾驶算法的决策层提供输入。