基于Nvidia TX2平台的车辆目标检测文献综述
2020-04-14 16:22:24
1.1 目的及意义
近年来,随着人工智能技术的发展和社会工业水平的不断提高,人们对自动化设备的需求日益增大,而其中最受人关注的方向之一就是自动驾驶。自动驾驶自1980年以来已经得到了世界许多大学、研究中心、汽车公司和其它行业公司的研究和开发,并且随着汽车智能化程度的不断提高,越来越多的大学、汽车企业及科技公司都将加入到自动驾驶的研究中,继续推动这个领域的发展。
无人驾驶汽车由环境感知、决策、控制和定位导航四个部分组成,这四个部分相互协作以实现无人驾驶车辆的正常运行。环境感知是其它部分工作的基础。环境感知即通过各传感器获取车辆外部环境信息、汽车内部工作状况以及驾驶员的行为信息等。车辆的目标检测是环境感知中的一个重要步骤。
车辆的目标检测主要是利用汽车上的雷达传感器或者视觉传感器获取汽车周围的环境信息,通过特定算法对获取的环境信息进行处理,判断目前行驶道路上是否有其它车辆并返回车辆在道路上的位置等有用信息。车辆目标检测所运用到的传感器多为毫米波雷达、激光雷达和车载摄像头等,由于车载摄像头成本较低,识别速度快,且计算机视觉技术的快速发展,通过车载摄像头和计算机视觉技术对车辆目标进行检测是近年来目标检测的重点研究领域和方向。
车辆目标检测目前广泛应用于汽车辅助驾驶系统中,主要作用是帮助驾驶员发现前方道路的车辆,在事故发生之前及时提醒驾驶员进行避规操作从而避免事故的发生。虽然基于计算机视觉的目标检测算法不断发展,但目前基于单目摄像头的车辆目标检测算法的精度和实时性仍有很大的提升空间,算法对于现实复杂场景的适应性还存在较大问题,需要进一步的改进算法以提高检测的精度及实时性。
1.2 国内外研究现状
车辆目标检测可以看作是目标检测的子课题,传统目标检测的研究可以归纳为特征描述子级联分类器的模式。通过对图像进行区域化扫描,对扫描的区域进行分类,以达到在整幅图像中检测到目标的效果。所以传统目标检测的研究是对手工特征算子的研究和分类器的研究,在通过特征描述子提取到图像的特征后,对提取的特征进行训练和分类。这其中较为典型的是早期Viola[1]等人提出的基于“Adaboost Harr”的图像检测算法,这种方法首先提取图像中的Harr特征,再利用Adaboost算法分类器对提取的特征进行选取,分类器会选择图像中与所需识别的图像相关特征进行判别并分类。该方法首先运用于人脸的检测[2],后多用于行人检测中,也有研究者如金立升[3]等人将这种图像检测算法用于日间行车的前车检测并应用于汽车安全辅助驾驶系统中的感知部分。法国研究人员Dalal[4]等人于2005年提出的梯度方向直方图(Histogram of oriented gradient,HOG)的方法开辟了对图像特征描述的新思路。这个特征提取方法最早与SVM分类器相结合并运用于行人的检测当中,如今已广泛应用于图像识别中。该方法主要思路是在一个整体灰度化图像中,图像中的梯度或边缘梯度分布能够很好地描述物体目标的表象和形状,这是因为图像灰度化后梯度主要存在于物体目标的边缘处,所以通过计算图像梯度便可较好的获取物体轮廓。此方法已有如李星等人[5]运用在车辆识别功能上,他们的方法实现了在不同光照下对前向车辆较为准确的识别。
传统的机器学习算法在经历了快速发展后,其对于检测速度与精度的提升在近些年并不明显,一定程度上进入了发展的瓶颈期,此时比机器学习较晚提出的深度学习(Deep Learning,DL)概念逐渐进入了大众的视野。这一概念是由机器学习领域的研究者Hinton[6]在2006年提出的,概念刚提出时由于并没有实际可行的证明并未引起较大的关注。但随着计算机硬件水平的提升,逐渐满足了深度学习中提出的训练大型多层神经网络结构的方法,在2012年Krizhevsk[7]在当时的ImageNet视觉识别挑战赛中利用深度卷积神经网络(Convolution Neural Network,CNN)在将最高的前5类的识别错误率降到15.30%,降幅达到了10%,并且最终赢得了比赛,神经网络算法因此受到了高度关注。在这之后,神经网络算法几年间连续赢得了该项比赛,并将物体识别的错误率降到了人眼识别错误率以下。