基于深度学习的动态背景分割研究与实现文献综述
2020-04-14 22:09:47
研究目的和意义
本次毕业设计拟在深入学习深度学习相关技术的基础上,掌握深度学习在计算机视觉领域的应用方法,实现一个可以针对任意一幅在动态场景中拍摄的普通图片,将其场景中的背景信息有效地分割提取的实例系统。
随着互联网社会的发展,尤其是社交网络的发展,我们可以获得大量的图像数据,那么如何从大量的图像数据中获得我们所需要的信息就变得越来越重要。另一方面,随着硬件技术的进步,计算能力的提升,深度学习越来越成为当前解决问题的重要方法。深度学习在图像分割领域的利用主要是卷积神经网络,而卷积网络的出现使图像分割的发展进入新的阶段。它在图像识别领域的优势是显而易见的,不仅促进了图像分类,使其更高效和精确,还在对图像任务具体结构的输出方面取得了关键性的进展。这些进展包括目标检测,图像分类,以及对部分和关键点检测技术等。图像分割是一个更加深层的工作,它的应用也非常的广泛。不仅可以应用到人脸识别,指纹识别等方面,提高了设备的安全性,在信息爆炸的时代保障我们的信息安全;还能应用于道路识别,行人检测等方面,实现车辆的自动驾驶,既方便了人类的生产与生活,又可以提高行车安全,避免交通事故的发生。但是,图像分割领域仍然存在着大量的挑战。比如说如何让计算机像人类一样去理解图像的内容,本身就已经非常的困难,那么如何让计算机去更加精确的分割出我们想要的结果,就更加的困难了。而且图像中的事物总是多变的,既有空间上角度,位置的变化,也有时间上的更替,要让计算机拥有这种适应变化的鲁棒性显得极其重要但又是一个非常大的挑战。
国内外研究现状分析
传统的图像分割方法,如阈值法,边缘检测法等,虽然原理都是不同的,但是这些传统的图像分割方法用的都是像图像的颜色特征,纹理特征,统计直方图等的一些比较低级的图像特征。在一些比较简单的图像分割应用中可能会有比较好的效果,但是在一些更加复杂的应用场景下,这些传统算法的效果就不是非常理想。利用图像本身涵盖的内容信息更加有效与图像中级,高级语言结合来提升图像分割效果是在深度学习出现以前的研究热点。规范割算法是Shi等人在2000年提出的一种图像分割方法,在考虑了子图间的差异性的基础上,同时考虑了子图内部的相似性。规范割算法根据图像的轮廓特征以及纹理特征来全局最小化损失函数来得到细尺度分割结果,因此在当时取得了不错的效果。超像素算法是 Moorer等人于2008年基于最小割的概念提出的算法 , 该算法以二维图像边界代价图作为输入,保存了两个像素之间存在边界的概率值,它的分割准确度相对来说也比较高。2004年,Felzenswalb 和 Huttenloche提出 FH 算法,该算法将图像映射成无向图,综合考虑了区域内部相似度和区域之间的差异性,通过对图中的顶点进行聚类实现分割 , 能够较好地保持图像边界,因此可以准确的分割出图像的整个轮廓。Girshick 等人于2014年提出了R-CNN方法,该方法首先使用搜索算法搜多到大量的可能存在物体的候选框,然后使用alexnet等网络进行分割或者检测,在一定的程度上提高了图像分割的准确率,但是速度非常慢。
{title}2. 研究的基本内容与方案
{title}
基本内容
本项研究的基本内容是在动态场景下拍摄的照片,能够使用深度学习方法进行图像分割,包括以下研究阶段:(1)数据集的采集与筛选; (2)深度学习模型的构建;(3)深度网络模型的训练;(4)基于深度学习模型的背景分割算法实现;(5)实例系统的设计与实现。
目标
研究的目标是使用卷积神经网络来采用卷积神经网络来实现深度学习图像分割方法,使用有监督学习的方法训练 CNN用于动态背景分割,利用计算机视觉和图像处理技术将目标物体从图片场景中有效地分割出来,研究将从分割车辆背景开始,如果项目进展顺利且分割效果优良,将采用更多的交通视频数据使得该神经网络能够从视频中分离出行人以及交通标识。