基于全卷积网络的道路图像分割方法研究开题报告
2020-02-18 19:35:38
1. 研究目的与意义(文献综述)
长期以来,道路识别是自动驾驶中一直等待被解决的问题,相关的技术一直掌握在少数公司手中,无法被广泛普及,大多数发表的文章都是停留在概念和抽象分析的层面上,并没有深入进行分析。道路识别本质上就是图像分割,而图像分割指的是从将一幅图片从语义上划分多个部分,从而清晰地得到语意元素在图像中的大小和位置,这些信息将作为后续图像处理的基础。目前国内外的研究主要是通过卷积网络(convolutional neural network, cnn)和全卷积网络(fullyconvolutional network, fcn)组成。
其中cnn通常在卷积层之后会接上若干个全联接层, 将卷积层产生的特征图映射成一个固定长度的特征向量。cnn适合于图像级分类任务,因为它们最后会得到整个输入图像的一个概率向量。利用cnn来判断图像中的某个像素是否属于车道时,我们通常需要分析它临近的若干像素,而窗口的大小就决定了哪些临近像素会被考虑。它的缺点很明显,表现在计算量巨大、存储开销巨大、窗口大小不确定、窗口大小限制了感知区域的大小。
而fcn将传统cnn中的全联接层转化成一个个的卷积层。由于经过多次卷积和池化后,得到的图像越来越小,分辨率越来越低,为了从这个分辨率低的粗略图像恢复到原图的分辨率,fcn使用了上采样。例如经过5次卷积(和池化)后,图像的分辨率依次缩小了2,4,8,16,32倍。对于最后一层的输出图像,需要进行32倍的上采样,一得到和原图一样的大小。而上采样是通过反卷积实现的。
2. 研究的基本内容与方案
本毕业设计研究的基本内容是利用全卷积网络(fcn)进行图像处理。最终实现将输入图像是车辆前方的道路图像(由固定在前挡风玻璃上的摄像头所拍摄)进行识别处理,输出将图中道路标绿的图像。
在具体毕业设计进行过程中,我打算按照以下流程进行相关知识的学习和毕业设计的实施。
(1)python 和matlb 编程能力强化:由于机器学习相关大都是用python语言实现的,而matlab是优秀的矩阵计算工具,所以学习和强化python和matlab能力是很必要的
3. 研究计划与安排
(1)2019/1/14—2019/1/23:查阅参考文献,明确选题;
(2)2019/1/23—2019/2/28:进一步阅读文献,完成开题报告;翻译英文资料,并交予指导教师检查。
(3)2019/2/28—2019/3/15:mlatlb和python学习,coursera上机器学习课程的学习。
4. 参考文献(12篇以上)
[1] 叶子豪, 孙锐, 王慧慧. 基于全卷积神经网络与条件随机场的车道识别方法[j]. 光电工程, 2019, 46(2): 180274.
[2] 李琳辉,钱波,连静,郑伟娜,周雅夫. 基于卷积神经网络的交通场景语义分割方法研究[j]. 通信学报, 2018, 39(4): 123-130.
[3] 王海, 蔡英凤, 贾允毅, 等. 基于深度卷积神经网络的场景自适应道路分割算法[j]. 电子与信息学报, 2017, 39(2): 263-269.