基于鱼眼广角相机的物体的自主检测和识别开题报告
2020-02-18 19:36:09
1. 研究目的与意义(文献综述)
1.1目的及意义 随着经济的不断发展,我国许多城市的交通系统出现了道路拥挤、路况混乱等各种各样的问题。因此建立一个良好的智能交通环境,不仅可以避免交通事故的频发发生,减少不必要的损失,而且有助于各行各业的蓬勃发展。近年来,由于科技的不断发展,智能交通系统(ITS)[1]应运而生,它指的是在一些较为完善的基础交通设施上,运用先进的电子科技来加强人、车、路三者之间的联系,从而对交通系统的安全、效率、环保、能源等各方面进行优化。 交通信息采集是建立智能交通系统的第一步,因此运用计算机视觉系统中的运动目标检测[2](Moving Objection Detection)对信息采集来说至关重要的,且其是进行目标跟踪、行为分析的基础,目标检测的效果如何会直接影响到后续工作。运动目标检测是指当前采集场景中有正在运动的目标时,以当前图像与背景图像的像素点差异从而在背景模型中识别并提取准确的运动目标,主要是提取感兴趣的运动目标,例如车辆、行人等。 1.2国内外现状分析 国内外常见的运动目标检测算法有:帧间差分法[3]、背景建模法[4]、光流法[5]、机器传统学习[6]、深度学习等。 一个视频序列在无运动目标的情况下,相邻帧的像素点的变化不大,在运动目标出现时,相邻帧之间的像素点就会有明显的变化,这样利用视频序列连续性的特点来识别和检测运动目标的算法就是帧间差分法。这种算法就是在时间上连续的两帧或三帧间进行像素差分运算,再对灰度差绝对值的阈值化来识别目标,从而达到检测运动目标的功能。帧间差分法的算法简单、计算量小,对场景的适应性强而且识别目标的速度快。但对移动特别快或特别慢的目标识别并不理想,且如果摄像机安装在移动单位上,背景图像的像素点也会时刻变化,这样对相邻帧之间做差值没有意义。Hashiyama, T等人[7]提出用图像信息来估计背景图像来进行运动补偿,来消除由于摄像机运动而带来的影响。Seki M等人[8]提出一种背景减法,根据图像矢量的分布来了解被观测场景背景的时间变化,利用多维图像矢量空间来表达背景的实际变化,很好地处理了背景中的各种变化。 背景建模法,也称背景差分法,与帧间差分法不同的是,这种方法是用当前帧与通过计算建立起来的背景模型进行差分运算而不是相邻帧之间的差分,显然这种方法的关键就在于建立好的背景模型[9]。在实际图像采集的过程中,由于外部环境的变化以及不可避免的噪声,建立准确的背景模型就十分困难了。一般情况下,图像的灰度值如果在一个均值的一个范围内上下随机波动,这种场景就是我们要找的背景[10],为防止本存在于背景中的物体的消失而导致出现鬼影,已建立起的背景模型要时刻进行更新,但在更新过程中依然会出现数帧鬼影,这在一定程度上会影响识别精度,建模方法还有很大的改进空间。 Gibson于二十世纪五十年代提出光流场[11]及相关概念,当图像中的物体运动时,图像中的像素点的运动趋势就可以反映出物体的运动,而像素点的运动趋势主要体现在灰度值分布的变化,即每个像素点都有自己的速度矢量,整个图像就是一个像素点矢量场,这个二维矢量场就是光流场,Horn和Schunck于1981年提出了一种光流场的计算方法[12],引入了光流约束方程,这样就不必提取出场景的先验信息,但光流法计算量大且计算的过程复杂,在实际运用中不是常见的选择。 方向梯度直方图(Histogramof Oriented Gradient, HOG)特征是由Dalal. N于2005年提出的[13],用于检测道路上行人的方法,这里把已在行人检测上取得了极大成功的特征提取用来提取车辆的特征,再结合SVM分类器来进行车辆的检测识别。当然特征的提取方法以及分类器不光只有Hog SVM,文献[6]中还提到了Haar-like Adaboot等。在对车辆生成独特的梯度特征后,分类器负责将图像中的物体分类为车辆/非车辆,这就需要使用训练数据对分类器进行训练,实际上在识别过程中一个车辆会被多个滑移窗口识别[14],所以需要对物体的最小边界框的识别次数设置一个阈值,来去除冗余的窗口。Sun Z[15]等人在Gabor滤波器提取特征的基础上,提出一种Gabor滤波器优化方法(EGFO),通过集群消除冗余的过滤器。 基于R-CNN和YOLO算法等深度学习的目标检测。 |
2. 研究的基本内容与方案
2.1研究基本内容及目标 熟悉鱼眼广角相机的标定,通过对鱼眼相机进行标定图像内角点三维坐标的输入,来获取鱼眼相机的内参和外参系数,完成鱼眼广角相机的标定。使用标定好的鱼眼相机拍摄路况视频,运行车辆识别算法对视频序列进行处理和分析,检测和识别目标车辆,对目标识别精度、识别速度、算法效率、现实可行性进行评估,总结算法的优缺点以及提出可行的改进方法,对误识别、鲁棒性或者算法效率上进行一定程度的优化。 2.2课题研究方法 1、查阅相关文献资料,学习相机标定的基础知识,了解相机以及相机标定的原理方法,理解如何得到内外参系数,然后由内外参系数对相机进行畸变矫正。 2、相机的常见标定方法为:传统相机标定,只考虑空间坐标转换,通过列特征点方程来求解内外参系数;非线性标定,与传统线性不同的是,其需考虑畸变利用非线性模型求解;张正友标定,只考虑了径向畸变,没有考虑切向畸变。经过一系列的坐标转换后,至少需要三个单应性矩阵方能求解进行标定,那么就需要三张不同的标定图片。标定环境: MATLAB环境下相机标定方法、 OpenCV下相机标定方法、 ros下相机标定方法等。 3、查阅相关资料了解相关车辆识别检测算法,构建算法所需要的环境,收集算法运行所需要的材料。 2.3拟采用的技术方案及措施 本文拟采用将帧间差分法和背景建模法的结合。对两种算法进行的优缺点进行互补。基本思路是(1)先选取一帧作为背景帧, 建立混合高斯模型,即得到图像灰度直方图。图像灰度直方图反映的是图像中某个灰度值出现的频次,也可以认为是图像灰度概率密度的估计。(2)再运用帧间差分对相邻两帧图像进行差分运算(作差分的量可以是灰度、亮度、色度值或其它的参数),得到变化区域(当前帧的运动物体以及前一帧的运动物体),(3)然后将变化区域与背景模型进行差分运算确认为背景点的像素点以及前一帧的非重合部分将被更新到背景模型中,非重合部分应以更高的背景模型更新频率,这样使得在建模时即使有运动的物体存在, 也会随着运动物体的移动而迅速得到干净的背景帧模型。 这样就解决了帧差法易出现空洞的缺陷,确认为运动物体的部分也可识别。使用这种算法,突然静止的物体会在相邻帧差时被更新到背景模型中,不会被检测为运动物体,当背景差分时只将当前帧运动区域进行背景差分,去除了其它区域的噪声影响,且在运动物体存在时也可进行背景建模,大大提高了算法准确性。 |
3. 研究计划与安排
第1-5周:查阅相关文献资料,明确研究内容,了解相关物体识别算法以及相机的标定方法,提出大致思路,完成开题报告以及翻译任务。 第6-7周:查阅相关文献资料,相机标定好后拍摄识别素材,运行算法并总结算法各个方面的性能,以及可以改进的方向。 第8-12周:查阅相关文献资料,完成对改进的算法的运行及评估。 第13-14周:完成并修改毕业论文。 第15周:准备答辩工作。 |
4. 参考文献(12篇以上)
[1]Bishop R. A Survey of intelligent vehicleapplication worldwide[C]. Proceeding of the IEEE Intelligent VehiclesSymposium,2000,25-31. [2]谢凤英. 数字图像处理及应用[M]. 北京:电子工业出版社,2014.6. [3]朱明旱,罗大庸. 基于帧间差分背景模型的运动物体检测与跟踪[J]. 计算机测量与控制,2006,14(8):1004-1006,1009. [4] Cucchiara R, C. Grana, M.Piccardi, et al. Detecting Moving Objects, Ghosts, and Shadows in VideoStreams[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 2003,25(10):1337-1342. [5]崔智高,王华,李艾华,王涛,李辉. 动态背景下基于光流场分析的运动目标检测算法[J]. 物理学报,2017,66(08):116-123. [6] Wen X, Shao L, Fang W, Xue Y.Efficient Feature Selection and Classification for Vehicle Detection[J]. IEEETransactions on Circuits and Systems for Video Technology,2015,25(3):508-17. [7] Hashiyama T, Mochizuki D, YanoY, Okuma S. Active frame subtraction for pedestrian detection from images ofmoving camera[C]. IEEE,2003,vol.1:480-485. [8]Seki M, Fujiwara H, Sumi K. A robust backgroundsubtraction method for changing background[A].Proceeding of IEEE Workshop onApplication of Computer Vision Piscataway[C].USA:IEEE,2000:207-213. [9]Robert T.Collins, Alan J.Lipton. A System forvideo surveillance and monitoring[C].Conference on AutomatedDeduction.2000:497-501. [10]CSDN论坛.基于opencv3实现运动物体识别[EB/OL].https://blog.csd n.net/oliverkingli/article/details/78067557,2017,9. [11]A.Murat Tekalp.Digital videoprocessing[M].Tsinghua University Press,1998. [12]Horn B K P, Schunck B G. Determining opticalflow[J]. Artificial Intelligence,1981,17(1):185-203. [13]Dalal N, Triggs B. Histograms of orientedgradients for human detection[C]. USA:IEEE,2005,vol.1:886-893. [14]韵卓. 基于DSP的道路前方车辆识别算法研究[D].吉林大学,2014. [15]Sun Z, Bebis G, Miller R. On-road vehicledetection using evolutionary Gabor filter optimization[J]. IEEE Transactionson Intelligent Transportation Systems. 2005,6(2):125-37. |