基于多模式融合的视觉跟踪技术研究文献综述
2020-04-14 16:27:33
视觉是人与外界接触的方式之一,大约80%的外界信息来自于视觉。但是人类视觉所带来的东西是有限的(受活动范围以及视野的限制),也是有时效的,所以,计算机视觉应运而生。计算机视觉是在了解人类视觉的基础上,用成像系统代替人类视觉器官,用计算机代替人脑完成对输入图像的处理与理解。随着科学技术的发展,计算机技术也越来越发达,因此,计算机视觉也越来越受到计算机信息、生物、数学等众多领域的重视。
视觉跟踪技术作为计算机视觉领域的热门课题之一,是对连续的图像序列进行运动目标检测、提取特征、分类识别、跟踪滤波、行为识别,以获得目标准确的运动信息参数(如位置、速度等),并对其进行相应的处理分析,实现对目标的行为理解。
视觉跟踪是指对图像序列中的运动目标进行检测、提取、识别和跟踪,获得运动目标的运动参数,如位置、速度、加速度和运动轨迹等,从而进行下一步的处理与分析,实现对运动目标的行为理解,以完成更高一级的检测任务。多模式融合即将基于区域、特征点、主动轮廓的视觉跟踪算法,采用信息融合的方法,综合这些跟踪模式的跟踪结果,实现比单模式更好的跟踪效果,因此具有重要的理论和应用研究价值。
随着计算机视觉的不断发展以及社会需求的日益增加,越来越多的高校和研究机构投入到视觉跟踪技术的研究。目前,在视觉跟踪领域,国外研究成果比较突出的有卡内基梅隆大学、麻省理工学院和斯坦福大学等;国内研究成果比较突出的有中国科学院、清华大学、中国科学技术大学、国防科学技术大学、上海交通大学和华中科技大学等。其他高校和科研机构也为视觉目标跟踪技术的发展做出了一定贡献,取得了一些研究成果。
视觉跟踪技术在军事目标的监测、公共场所的安防、智能交通、智能机器人、人机交互、医学图像处理等诸多方面均具有广泛的应用前景,包括在媒体界,现在的真人秀节目里的摄像机跟着目标转动从而来记录目标的所有动作。在复杂环境下(相似背景、杂波环境,光照变化以及目标自身形变和遮挡等),实现精确、稳定的视觉目标跟踪,在学术研究与工程应用两方面都具有非常重要的意义,设计实现复杂环境下准确性好、稳定性高的实时目标跟踪系统具有极高的实用价值。这也是课题的研究意义所在。
{title}
2. 研究的基本内容与方案
{title}
基本内容:视觉跟踪是计算机视觉领域中的一个热点问题,其在诸如目标制导、自动驾驶、行为识别等应用场景下有着广泛的应用价值。近年来,尽管人们对于视觉追踪有了广泛的研究,并提出了许多有效的跟踪方法,但对于复杂的现实环境来说,单一的视觉跟踪方法很难满足系统需求,为了提高系统的稳定性和可靠性,论文提出利用基于多模式融合的视觉跟踪技术,从而得到更好的结果。
目标:本论文重点将单模式的跟踪技术,采用信息融合的方法,综合这些模式跟踪的结果,然后进行分析比较,得到比单模式更好的跟踪结果。
拟采用的技术方案及措施:对论文的研究背景,以及单模式的视觉跟踪技术:基于区域、特征点、主动轮廓的视觉跟踪算法原理进行研究、介绍。讨论目前的单模式视觉跟踪技术的特点以及不足。在采集单模式视觉跟踪后的数据后,并将单模式所得的结果,采用信息融合的方法,从而得到比单模式更好的结果。本次设计利用Matlab实现相应算法的编程。最后对设计内容进行总结和分析。