基于背景差分法的视频流人体运动目标检测方法研究开题报告
2020-05-28 06:59:08
1. 研究目的与意义(文献综述包含参考文献)
1. 研究背景及意义
在日常的视频监控中,视频序列中的运动目标是最令人关注的部分。现阶段所使用的视频监控系统在实施跟踪与检测目的上主要是针对于一定场景范围中正在进行运动的物体目标,其缺陷是不能够深入地识别与理解其物体目标。在突然发生某一事件的情况下可以借助于该系统进行事后取证,但是不能够对所发生的事件做出及时的反应,这是该系统存在的最大问题。从这一角度来说,借助于一定的视频监控系统来针对于一定场景范围内正在进行运动的物体目标进行及时的深入理解以及实时地检测尤为重要。图像序列和视频的研究重点是视频序列中的人体运动分析,它的主要研究方向包括计算机图形学、计算机视觉、人工智能和图像处理等计算机领域,己成为计算机视觉领域中最具有前瞻性的方向之一。
在视频图像中如何让计算机系统首先对人体的相关信息进行有效地获取,在此基础之上对其进行相关分析,从现阶段来看如何实时地跟踪人体所进行的相关行动以及对其进行有效分析与理解很有必要。这里所说的人体运动行为识别是指运用某种手段从某一个或者是若干个视频序列中对其中所包含的人体进行有效地跟踪与检测,在此基础之上对其进行有效地识别,在该过程中如何将人体在进行运动中的相关数据进行有效获取是最关键的,重建人体的三维运动,并在此基础上对人体的运动行为进行理解和描述,进而用计算机来实现虚拟现实、身份识别和智能监控等应用。基于视频的人体行为分析主要被广泛应用于以下几个方面:智能监控(intelligent surveillance)、运动分析(motion analysis)、高级人机交互(advanced human-computer interaction)、虚拟现实(virtual reality)和基于模型的视频编码(model一based image coding)。
2. 研究的基本内容、问题解决措施及方案
本文研究的问题:基于背景差分法的视频流运动人体目标检测研究。
研究方法:
[1] 在对现有运动目标检测方法研究的基础上,着重研究背景差分法,以该方法作为本文运动目标检测的方法。背景差分法中需要研究背景模型的建立,可以选择混合高斯模型作为背景模型的建立方法。还要对干扰区域去除,前景运动人体目标区域的提取问题进行研究。
[2] 对目前常用的人体动作数据库进行研究比较,为本文的仿真实验选择合适的数据库,如KTH、Weizmann等,可以考虑不同复杂度的背景、不同的光照条件以及干扰因素,对不同情况的视频进行实验的对比。
[3] 将本文的运动目标检测方法和常用的一些目标检测方法通过仿真实验进行对比。
[4] 利用海康威视的网络摄像头等设备搭建视频智能监控硬件系统
[5] 利用海康威视网络摄像头提供的接口函数实现实时视频流的传输和采集。
[6]对海康威视网络摄像头获得的实时视频流进行目标检测和定位
具体步骤如下:
1.背景差分法
背景差分法在对运动目标的检测方面有较广的运用。背景差分法对运动目标
的检测实质是将图像的当前帧与背景模型进行差分运算,由于当前帧和背景模型
中不同的仅有要检测的运动目标,作差后从而得到运动目标的轮廓,即前景图,
从而获得运动目标位置[32] o
由于检测需要将每一个要检测的图像帧序列与背景模型进行差分运算,所以
选择的背景建模技术对于准确性等性能是至关重要的,背景模型的准确度将直接
对运动目标检测结果造成影响。可是我们知道,背景模型不是一成不变的,环境
场景情况的多变性、复杂性和多种干扰因素如光照变化、树叶摆动等,一系列的
干扰因素都对正确有效地背景建模造成了困难。
正是由于各种干扰因素和环境多变性的问题,背景在长时间内静止不变是不
实际的,因此,在对较长的视频序列进行运动目标检测时,根据背景的动态变化,
对背景模型重建进行背景更新是必须的。
2.混合高斯建模
高斯背景建模分为单高斯分布模型和混合高斯模型。
单高斯分布模型的基本思想是先给图像中每个时刻t的像素点建立模>T,型,该模型用单高斯分布表示。设一阀值为T,当那么将该点判足为背景点,反之将该点判定为前景点。设像素rli的灰度值出现的概率服从高斯分布:. 单高斯分布模型算法简单,由于背景建模通过参数迭代,因此不需多次建模处理,对十背景单一的场景能取得较好的效果。而下面将介绍的混合高斯模型是对其的拓展。
混合高斯模型
混合高斯模型是对单高斯模型的扩展。混合高斯模型是将图像中的每个像素点的特征使用多个高斯模型来表示。每当获取新一帧的图像时,混合高斯模型都将进行更新,再将当前帧中每个像素点用更新的混合高斯模型来匹配判定,匹配成功则为背景点,反之为前景点。
设当前帧图像的像素点为X , K个高斯模型分量构成P,那么图像中时刻t的像素概率为P(x),混合高斯模型公式如下
3.目标检测算法的对比
运动目标检测技术 |
优点 |
缺点 |
帧间差分法 |
抗千扰能力强,受场景中光 线等变化因素的影响小 算法简单,运行速度快
|
运动目标的重叠部分会造成空洞、漏检,导致准确率降低 受到检测目标的运动方式的影响
|
光流法 |
能够适用在摄像机位置改变 的场景中,受到干扰因素的 影响小
|
算法复杂,计算过程和运算 量大,检测的时长较长,不 具有实时性
|
背景差分法 |
便于实时处理,检测效果好, 不会出现空洞情况
|
依赖背景模型,对于长时间 光线变化敏感,需进行背景 更新
|
4.利用海康威视的网络摄像头等设备搭建视频智能监控硬件系统
5.利用海康威视网络摄像头提供的接口函数实现实时视频流的传输和采集
1)调用函数P1ayM4一etPort获取当前没有被使用的通道号,此处操作主要是因为海康提供的SDK支持多视频通道的同时预览,所以在进行解码显示之前我们必须有选择的获取视频的预览通道号。
2)调用接口P1ayM4_ SetStreamOpenMode,设置码流播放模式,本文选择流模式。
3)调用P1ayM4_ OpenStream打开码流接口,类似于打开文件。
4)调用P1ayM4_ GetPictureSize获取原始码流中视频图像的大小。
5)调用接口P1ayM4_ SetDeoCallBaok(1Port,g一eoCBFun),其中,1Port表示预览通道号,g一ecCBFun为一个回调函数,是整个解码过程的关键,能够返回解码后视频流数据及其大小等信息。通过这种方式解码所得到的视频格式为YV 12格式,而我们通常处理的格式是RGB,所以解码后得到的视频流还需要进行YV 12到RGB格式转换。
6)调用接口P1ayM4少lay对解码后经过处理的视频流进行显示。
6.对海康威视网络摄像头获得的实时视频流进行目标检测和定位
Kim等人提出的码本模型是基于聚类的思想建立背景模型。它根据视频序列的前N帧为组成的像素过程,为每个像素过程建立一个码本背景模型,然后按照某种距离量度对新来视频帧像素值和码本背景进行匹配聚类,从而提取出前景目标。该算法保持了背景的多模特征,而且内存占用和计算量都很小,基本满足实时性要求,但它是仅以像素为单位的背景估计,没有用到像素空间邻域信息,导致检测到的目标空洞现象较为严重。
本文根据海康监控视频流的像素值浮动规律提出融合码本和纹理信息的背景建模方法「4i, 48],最终得到一个比较适合该监控系统的时空背景相结合的目检测算法,且利用该算法的检测结果,可以准确的标记出移动目标的轨迹与轮廓。下面开始对解码回调接口g一ecCBFun所得的视频流嵌入目标检测算法。由于YUV颜色空间的色度和亮度的完全分离性,使其比其他颜色空间更适合在海康监控系统上建立码本模型。下面分两部分进行介绍:一是背景模型初始化,二是前景分割和背景更新。