基于深度学习的车牌识别的研究与应用文献综述
2021-02-25 13:14:00
当今时代交通中时常发生违反交通规则、以及其他需要查看车牌的情况,由于工作量大,人力用于查看记录的成本偏高,所以基于深度学习的车牌识别能够较好的解决交通中的这些情况,通过摄像头传输过来的画面进行解析分类识别,最终完成对车牌号的识别。
深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。[1]
深度学习的概念由Hinton等人于2006年提出。基于深度置信网络(DBN)提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望,随后提出多层自动编码器深层结构。此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法,它利用空间相对关系减少参数数目以提高训练性能。[1]
深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。[2]
同机器学习方法一样,深度机器学习方法也有监督学习与无监督学习之分.不同的学习框架下建立的学习模型很是不同.例如,卷积神经网络(Convolutional neural networks,简称CNNs)就是一种深度的监督学习下的机器学习模型,而深度置信网(Deep Belief Nets,简称DBNs)就是一种无监督学习下的机器学习模型。
本论文研究目的及意义:在对现有的技术上面进行归纳并将算法和分类特征进行总结,分析作为图像特征的特征算子,另在论文中阐明现实生活中的分类方法及原理,研究深度学习的优势,以及卷积神经网络的训练方法。
国内外现状:关于车牌识别,国内外的研究人员通过各种方式,已经取得了一定的成绩,早期的车牌图像处理是通过研究提取图像中的特征因子来分类识别的,常采用向量机的方式进行处理,罗彬,Wang等使用了边缘直方图作为特征,这些方法不仅简单而且处理速度快,缺点很明显,准确率不够,这限制了图像识别的发展,后期增加了图像质量分析,通过图像模糊度的计算以及评判,将质量差不多的图片放在一起进行处理,相对而言提高了准确率。YU等人使用了图袋的方式对图像中车的特征进行统计,产生对应的代码,以便后期的匹配。
深度学习作为目前机器学习算法中的新技术,目的在于模仿人脑进行学习、分析的神经网络。深度模型具有强大的学习能力和高效的特征表达能力,更重要的优点是从像素级原始数据到抽象的语义概念逐层提取信息,这使得它在提取图像的全局特征和上下文信息方面具有突出的优势,为解决传统的计算机视觉问题(如图像分割和关键点检测)带来了新的思路。深度学习不同于简单的机器学习,目前大多数的分类、回归等学习算法都属于简单学习或是浅层结构,而前层结构主要包含1层或2层的非线性特征转换层,典型的浅层结构有高斯混合模型(GMM)、隐马尔科夫模型(HMM)、条件随机域(CRF)、最大熵模型(MEM)、逻辑回归(LR)、支持向量机(SVM)和多层感知器(MLP)。前层结构的局限性恰恰是由其模型本身导致的,采用一层简单结构将原始输入信号转换到特定问题的特征空间中致使其对复杂函数及复杂分类问题的处理具有局限性,更难解决比较复杂的自然信号,如人类的语音、自然图像等。而深度学习可以通过深层非线性网络结构,表征输入数据,实现复杂函数的逼近,最终展示其强大的从少数样本集中学习数据集本质特征的能力。