基于图像处理的车辆类型检索的设计与实现文献综述
2020-04-29 18:52:18
1.1研究的意义
随着生活水平和工业水平的提高,机动车数量迅速增长,车辆的品牌也有所增加,传统的人工基于图像对交通信息的判断工作已经无法满足当前的发展状况,有效判别某一辆汽车具体品牌型号对于交通管理领域,特别是对车辆违章、无牌照车辆等公安稽查领域有着非常重要的意义[1]。如何从如此庞大的数据中快速并准确地搜索出目标车辆类型也成为了一个现实的难题。
智能交通系统是交通运输领域的前沿科技,广泛应用于交通运输管理、车辆调度系统和机动车自动控制系统。车型分类是智能交通系统应用领域中基本功能模块和重要分支,是一门集计算机视觉、模式识别、工业测控技术、电子技术于一体的综合技术,能够自动、实时地对车型进行识别和分类,为交通管理、收费、调度和统计提供依据[2]。其中基于图像处理的车型检索系统是智能交通系统的研究内容之一,也是其重要核心技术。
目前,图像检索技术以使用图像视觉特征信息从图像数据库中检索相似图像为主流技术形式,即通常所说的基于内容的图像检索[6] 。车辆图像检索系统是基于内容的检索技术,在交通视频监控领域的重要应用,它可以按照人们的需求,通过车辆检测、车辆属性(颜色、车标、车牌、车型等)识别等技术手段,在众多的图像库中自动寻找到目标车辆,从而有效缓解基于人力的检索与图像大数据之间的矛盾。
近年来,基于深度学习的相关理论和应用发展迅猛,与传统依赖先验知识的特征提取算法不同,深度神经网络可在训练数据驱动下自适应地构建特征描述,具有更高的灵活性和普适性。卷积神经网络是深度学习的一项重要技术,已在图像识别、语音识别、物体检测等领域取得卓越成绩[7]。利用卷积神经网络来对同类事物的图像进行检索就成了一种很自然的想法。该技术从上世纪60年代至今经历了这么多年的发展,已经取得了丰硕的研究成果。但该领域仍存在众多有待进一步解决的问题,这也是研究的意义所在。
综上,本文基于卷积神经网路的车辆图像检索系统的实现不仅能为城市的交通规划提供第一手的数据,还可为交管部门和公安部门追查违章和肇事车辆提供极大的便利,具有较强的现实意义和乐观的发展前景[3]。
1.2 国内外研究现状
从20世纪70年代开始,有关图像检索的研究就已开始,当时主要是基于文本的图像检索技术(Text-based Image Retrieval,简称TBIR),利用文本描述的方式描述图像的特征。到90年代以后,出现了对图像的内容语义,如图像的颜色、纹理、布局等进行分析和检索的图像检索技术,即基于内容的图像检索(Content-based Image Retrieval,简称CBIR)技术。
目前已有不少应用于实践环境的基于内容图像检索系统,如由IBM公司开发的最早商业化QBIC系统,以及由哥伦比亚大学研发的WebSeek系统、麻省理工学院研发的PhotoBook系统等。通过基于内容的技术检索Web图像,首先需要从Web中剥离图像,组成图像集,对图像集中的各个对象进行基于内容的特征分析、相似度匹配。立足于图像内容,对图像进行分析和检索。相比而言,尽管图像检索已经出现了诸如直方图、颜色矩、颜色集等多种表征图像特征的方法,但是要突破对低层次特征的分析,实现更高语义上的检索,实现难度大,进展慢。不过,基于内容的图像检索建立在多媒体信息的内容语义上,能够更为客观地反映媒体本质的特征。
图像检索领域已经进入了瓶颈期,这并不意味着本学科发展停滞,而是出现了很多理论和实践上的问题亟待解决,一旦图像检索领域有了新的突破,又将进入新的增长周期,随着跨媒体检索的兴起和发展,图像检索作为多媒体检索中的一部分,已经不再作为单一研究内容[4]。