基于Matlab环境的运动目标检测文献综述
2020-04-29 18:48:52
随着计算机技术的不断发展,计算机能力得到了极大的提高,使得利用计算机实现人类的视觉功能成为目前计算机领域最热门的课题之一。计算机视觉研究的目标是使计算机具有通过图像(和静止的图像相比,运动图像包含了更多的信息)认知周围环境信息的能力,这种能力不仅能使计算机能感知环境中物体的几何信息,包括它的形状、位置、姿态、运动等,而且能对它们进行描述、存储、识别与理解。
在实际中,视频监控利用摄像机对某一特定区域进行监视,是一个细致和连续的过程,它可以由人来完成,但是人执行这种长期枯燥的例行监测是不可靠,而且费用也很高,因此引入运动监测非常有必要。它可以减轻人的负担,并且提高了可靠性。概括起来运动监测主要包括三个内容:运动目标检测,方向判断和图像跟踪。运动目标检测是整个监测过程的基础,运动目标的提取准确与否,直接关系到后续高级过程的完成质量。
图像的类型主要有三种:可见光图像、红外图像和雷达图像。其中可见光图像是通过光学成像原理得到的;红外图像是通过不同物体表面辐射的热量不同的而得到的;雷达图像则是合成孔径雷达、毫米波雷达、激光雷达等不同成像手段得到的图像。针对它们不同的特点,也就产生了不同的检测跟踪算法。本文针对可见光图像中的运动目标进行分析研究。
巨大的商业价值和应用价值使越来越多的公司和学术机构致力于这种技术的研究。美国,英国等国家己经展开了大量相关项目的研究。1997年,由美国国防高级研究项目署DARPA(DefenceAdvancedResearch Projects Agency)领头,以美国卡耐基梅隆大学为首,麻省理工学院等高校参与了视频监控系统项目VSAM(VSAM:System forvideo surveillance andmonitoring,意为:视频监控系统)的研究开发,并于2000年基本完成.此项目主要研究的是针对战场及普通民用场景进行监控的自动视频理解技术:分布于各个不同位置的摄像头获取的视频信号通过一个分布式的网络连接汇集到操作中心,只需要一个操作人员就可以监控一个相当广阔的空间范围.同时,在很大程度上减少了操作人员的劳动强度,系统能够自主检测异常情况的发生,而且只有在检测到异常的情况下系统才会发出信号,提醒操作人员作相应的处理。从2000年开始,DARP又设立了HID(Human Identification at aDistance)计划,美国有13所大学和5个研究中心参与了这个项目的研究,包括卡内基梅隆大学、马里兰大学、麻省理工大学、哥伦比亚大学等。其任务是开发多模式的、大范围的视觉检测技术,以实现远距离情况下人的检测、分类和识别,增强国防、民用等场合免受恐怖袭击的自动保护能力。欧盟赞助研究的PRISMATICA系统,该系统融合了多种智能检测设备(智能摄像头、非接触智能卡、无线视频传输等),用于地铁站的安全监视。国外一些公司近年来相继推出了具备一定智能功能的视频监视系统,如:娜威的 DETEC AC公司提供的Detec系统;美国ObjectVideo公司提供的ObjectVideoVEW、ObjectVideo Forensics。它们实现了在用户定义规则下对监视场景进行监测、跟踪、分类、统计的软件系统,可在诸如有人闯入、盗窃、提包遗失或者未经许可在限制区域闲逛等违反自定义规则的情况下报警。另外还有ObjectVideo On Board一构建在DSP处理器上的嵌入式视频监视系统;在日本,一家公司发展的基于的三维激光摄像机的自行车辆及行人检测系统,系统的主要目的是获得交通流参数,以动态地智能地控制交通信号。
相对而言,国内在目标跟踪技术方面的研究起步较晚。主要的研究团队有中科院自动化所模式识别国家重点实验室、北京大学视觉与听觉信息处理国家重点实验室及清华大学智能技术与系统国家重点实验室。中科院自动化所模式识别国家重点实验室的主要目标是实现一个动态场景集成分析演示系统并最终推向实用,而北京大学视觉与听觉信息处理国家重点实验室的工作主要是实现高度智能化的机器感知系统,并在言语听觉技术、三维视觉信息处理、智能机器人等研究领域取得许多研究成果。清华大学智能技术与系统国家重点实验室主要从事人工智能基本原理、基本方法的基础与应用基础研究,包括智能信息处理、机器学习、智能控制,以及神经网络理论等,还从事与人工智能有关的应用技术与系统集成技术的研究,主要有智能机器人、声音、图形、图像、文字及语言处理等。交通流参数,以动态地智能地控制交通信号。在国内,也己有一些具备智能功能的视频监视产品上市,如:北京黄金眼科技的黄金眼,北京行者科技的行者猫王等产品。但是,目前国内使用中的视频监视系统大部分均侧重于视频数据的压缩、传输和存储;其报警功能大都利用红外,烟雾等外接传感器实现;视频数据到达终端以后还是需要由人来实时观测分析,或者是存储起来以备事后查阅。这种系统仍需耗费大量的人力物力,却只能实现部分的预期功能,远远无法满足日益增长的对监视系统智能化的需求。
{title}2. 研究的基本内容与方案
{title}本次毕设需要学习和研究数字图像处理、数字视频处理原理和方法。重点研究视频运动检测方法,在Matlab环境下实现,并对结果进行比较分析。目标是能够在Matlab环境下实现实时运动目标检测。
首先通过阅读教材和各方面的相关资料,著作和论文的基础上,着重研究视频运动检测方法,进行编程实验,最终完成运动检测方法的完整代码。
在进行运动目标检测时,一个很重要的步骤就是区分出运动目标和背景范围,对于背景的提取主要有手动背景法,统计中值法,算术平均法和Surendra背景更新算法。Surendra背景更新算法能够自适应地获取背景图像,该算法提取背景的思想是对差值图像的亮度值进行判断,如亮度大于阈值,背景图像对应位置的像素点保持不变,否则利用当前帧对背景图像进行替换更新。
对于运动目标检测常用的三种方法(包括光流法,帧间差分法和背景差分法)进行分析,在对比其优缺点及主要的适用范围后,重点选择研究帧间差分法。帧间差分法比较简单,对环境的适应能力强,但是检测到的运动目标不精确。
根据方案进行编程实验,完成运动检测方法的完整代码。