中文牌照的两阶段字符切割外文翻译资料
2023-08-28 17:11:18
英语原文共 15 页,剩余内容已隐藏,支付完成后下载完整资料
中文牌照的两阶段字符切割
摘要
字符分割作为字符识别的一部分,在车牌自动识别系统中起着重要的作用。近年来,人们提出了许多关于字符分割(CS)的方法,它们在各自的数据集上都能很好地工作。然而,由于噪声、重叠、连通或者碎片等图像的帧间分割、图像的衰落和图像质量的下降,他仍然是图像分割的难点。本文提出了一种中文车牌的两阶段分割方法。在第一阶段,提出了一种基于哈罗滤波器组和最小响应的模板匹配方法。它粗略地找到字符间分割点的位置。然后,在第二阶段通过一种寻路算法的变体来调整连接字符或重叠字符之间的精确分割。本文用具有挑战性的2334幅图像的数据集上的实验证明了该方法的有效性。
1.介绍
随着车辆数量的快速增长,开发智能交通系统(ITS)对于提高高速公路、收费站和停车场的管理水平具有重要意义。车牌自动识别(ALPR)系统是车牌识别系统的重要组成部分之一,通常由车牌定位(LPL)系统组成。字符分割(CS)和字符识别(CR)。其中CS的目标是准确定位每个字符的边界,从而分割出相应的图像patch进行识别。因此,它的性能对整个系统有很大的影响。在过去的几年里,人们对计算机科学进行了大量的研究。现有的方法可分为三类:基于垂直投影(VP)的方法,基于连通分量分析(CCA)的方法,基于模板匹配(TM)的方法。
其中,基于VP的方法是最简单、最快的。通过检测投影直方图中的山谷,直接对字符进行分割。但该方法对噪声比较敏感,容易造成连接字符或片段字符分割错误。在基于CCA的方法中,经常检测到类字符的成分,并利用它们的位置关系对真实字符进行分割。但在连接或碎片的情况下,分割将变得困难。因此,基于CCA的方法的性能在很大程度上取决于二值化的结果。
相比之下,使用TM的方法对连接和碎片更牢固。通常使用与标准车牌结构相同的方波和分数函数进行匹配。当左右两边都有噪音的时候,他的两侧或字符间粘附严重,这些方法给出的结果远远不能令人满意。因此,需要开发一种更有效的方法来解决这些问题
本文提出了一种充分利用中文车牌排列结构的两阶段字符分割方法。它包括三个主要步骤:图像预处理、初始分割和精确分割。在预处理步骤中,去除帧的水平边框,对二值图像进行垂直倾斜校正。然后在初始分割阶段设计一排harrowshape filter (HSF)并与垂直投影进行卷积,目的是大致找到字符间分割点的位置。最后,通过对传统寻路算法的改进,对连通字符和重叠字符之间的精确分割进行了调整。我们工作的主要贡献如下:
(1) 结合CCA和水平扫描去除板框的水平边框。
(2) 采用HSF bank和最小响应进行粗分割。
(3) 根据的变体对连通字符和重叠字符进行分割。.
本文的其余部分组织如下。首先,相关工作在第2节中介绍。第三节对该方法进行了详细的描述,包括图像预处理、初始分割和精确分割。在第四节中,我们讨论和评价了实验结果,并将我们的结果与几种最先进的方法进行了比较。最后,第五节对工作进行总结。
2.相关工作
在文献中,已有许多车牌字符分割算法被提出。车牌字符分割技术虽然已经研究多年,但如何利用车牌的帧数、倾斜度和质量对车牌字符进行分割仍然是一个具有挑战性的课题退化。根据绪论中提到的不同方法,我们将对各个类别的相关工作进行回顾。
对于基于VP的方法,研究了垂直投影直方图中的峰谷分布。在[3]中,通过水平投影去除板框后,对二值图像进行垂直投影,通过加减估计的字符宽度,找到最大的空间来定位每个字符的边界。[4]与[3]在字符区上下边界的定位上有很大的不同。图像在水平方向上被分割成多个块,每个块水平投影得到两组分段线。对于每个集合,在每个分段线的中点上进行霍夫变换得到边界线。因此,这种方法可以处理倾斜板。[5,6]的研究主要集中在连接字符和重叠字符的分割。在[5]中,分别采用了形态学增厚算法和形态学减薄算法。在[6]中提出的方法使用了一种最优寻路算法[16],该算法不仅在精度上有效,而且在时间上也很有效。
CCA是另一种常用的字符分割技术。通常先从二值图像中提取与字符或识别为字符的长径比相同的连通分量,如[7,8]所示。通过分析它们之间的空间关系,分割出未检测到的字符。与基于阈值的斑点检测相比,[17]中提出的最大稳定极值区域(MSER)检测器更强大,常用于文本检测[18]。在[9]中首次将其应用于车牌字符的分割。满足某些几何特征的字符被认为是板字符。[10,11]的研究充分利用了MSERs在其车牌识别系统中的应用。因此,采用CCA的方法对板框具有较强的鲁棒性,且不受倾斜的影响。
利用车牌字符的排列,提出了基于TM的车牌字符排列方法。根据水平投影和垂直投影的特点,提出了一种变长模板匹配方法。设计了两套模板,一套为单方波模板,另一套为七方波模板,分别与水平梯度图像的水平投影和垂直梯度图像的垂直投影进行匹配。最佳匹配是在相关系数最大的位置实现的。淼[13]提出了一种利用TM的新方法,将垂直投影直方图上的区间中点与模板上的区间中点进行比较,将字符块与噪声区分开来。在[14]中,字符块中白色像素的个数与字符间隔中白色像素的个数之间的差值作为匹配的度量。
图1 中文车牌字符分割框架流程图
与上述方法不同,我们通过两个步骤来完成分割任务。初始分割阶段的目的是将车牌字符精确地分割成两部分,得到字符宽度和空间宽度的估计。在此基础上,采用寻路算法对重叠字符和连通字符之间的中点位置进行精确分割。利用该方法可以有效地分割中文车牌图像中的字符。
3. 提出的方法
图1描述了我们的框架的流程图。流程图中显示的三个部分将被详细描述。值得注意的是,分割的输入是独立的车牌图像,这些图像是由我们的车牌定位模块生成的。在该模块中,通过水平倾斜校正和粗分割得到更加准确的提取出的车牌图像,这不仅方便了车牌的验证过程,而且也方便了字符分割模块。因此,本文只考虑垂直倾斜校正。图2中的几个例子说明了从原始图像patch中获取输入车牌的过程。
3.1. 图像预处理
本文的图像预处理任务包括二值化、垂直边界定位和垂直倾斜校正,目的是得到一幅没有帧的垂直字符的二值图像。
3.1.1. 二值化
通常,在二值化之前,需要先将彩色图像转换成灰度图像。而在RGB颜色空间中,g分量图像中车牌的对比度往往比其他两个分量高,即车牌中字符与其背景之间的灰度差。但是对于夜间拍摄的车牌,R-component图像是首选。为了达到平衡,我们选择了对比度高的那个。 设c为颜色分量变量且,是像素在相应的水平梯度值。c分量图像的对比度计算公式如下:
为了有效地突出特征和抑制背景,提出了一种自适应二值化方法。将全局方法与局部方法相结合,对噪声和光照不均匀不敏感。设灰度值为T表示全局阈值由大津,T表示局部阈值,由Bernsen提供。根据所述过程,二值化公式如下:
- (b) (c)
图2 (a)原始图像 (b)水平校正图像 (c)字符分割的输入
其中,二值是由局部阈值计算的中间值,是通过局部阈值调整待二值化灰度范围的参数。从[19]中可以看出,当a在0.2到0.4之间时,可以得到很好的结果。在我们的工作中,根据经验,它被设为0.3。图2中前两幅图像的二值化结果如图3所示。
3.1.2. 横向边界位置
由于车牌图像中可能存在额外的非车牌区域、车牌框架和铆钉,因此在分割前需要定位字符区域的上下边界。水平扫描法(HCM)是实现这一目标的一种常用方法,它逐行计算像素从一种颜色到另一种颜色的变化次数。然而,字符周围的粘连往往导致过度分割或分割不足。在某些欠分割的情况下,通过提取相似高度的连通分量,也可以采用CCA进行定位。
因此,我们将HCM和CCA结合起来,以获得更好的性能。如果提取的成分数量大于2,则使用CCA;否则,选择HCM。定位结果如图4所示。
3.1.3. 垂直倾斜校正
在图5中,给出了两种垂直倾斜模式。采用[22]中提出的方法,得到了具有竖直特征的平板图像。它通过寻找投影的最小值来估计倾斜角度,并通过在每一行水平移动像素来校正图像。用h表示倾斜角,用h表示二值图像的高度。每个像素的移动距离可以计算为:
其中x和y为当前像素坐标。如果大于0,则像素向右移动,否则将向左移动。在我们的实验中,旋转角度范围从到,并且每次都在增加。图6为校正后的图像和相应的倾斜角度。
- (b)
图3 图像灰度化和二值化结果
- (b)
图4 使用(a) CCA和(b) HCM定位字符区域的水平边界
0
(a) (b)
图5 垂直倾斜modes.2
(a)
(b)
图6 垂直校正结果
3.2. 初次分割
一般来说,通过在车牌上定义和定位一个基线,并在基线和字符宽度之间进行一系列的数学运算,就可以很容易地得到每个字符的边界。在中文车牌的分割任务中,选择将车牌分为左右两部分的较大空间作为基线。在这一小节中,我们的目的是准确定位更宽的空间,并给出字符宽度的估计。为此,提出了一种基于一组响应最小的耙形滤波器的模板匹配方法。
要构建过滤器库,我们首先根据垂直投影设置字符宽度范围。假设字符宽度的变量为,然后根据公安部车牌标准,其对应的正常空间宽度、较宽空间宽度和滤波器宽度可由下式推导:
其次,对滤波器的形状进行建模,这直接影响到分割结果。在传统方法[12,14]中,字符块和字符空间的分布与标准车牌完全相同,其值分别设置为1和0,如图7(a)所示。此外,选取最大相关系数和最大方差作为匹配准则。为了提高对退化平板图像的鲁棒性,设计了一种响应最小的耙形滤波器。它在两个方面不同于传统的。首先,将每个正常空间的大小缩小到1像素的宽度,同时扩展每个字符块的大小。分配给它们的值是0和1,这与传统的值相反。这样就得到了耙状滤波器,如图7(b)所示。第二个不同点是我们计算响应的方式。滤波器与投影向量卷积,计算空间上的投影和。这样,可以大大减少粘连和噪声的影响。
设W为校正后图像的宽度,为垂直投影向量。卷积响应在可表示为:
式中为第i个分割位置:
图7 (a)传统过滤器 (b) Harrow-shaped过滤器顶部块分布底部过滤值
为了获得最佳匹配的字符宽度和字符区域的起始位置,响应在和的值,并且重复上述所有值,并选择响应最小的值。 以图6(a)中校正后的图像为例,将字符宽度的上限和下限分别设置为7和18。匹配后得到的最小响应曲线,如图8(a)所示。显然,最优字符宽度是。同时,覆盖在的响应曲线如图8(b)所示,表明在为了更好地理解匹配过程是如何实现的,表1和表2分别总结了变量描述列表和相应的算法伪代码。
图8 (a)不同字符宽度下的最小响应曲线 (b)不同位置的响应曲线。
3.3. 精确的市场分析
在这一阶段,利用初始分割结果得到每个字符的准确边界。对于水平方向上没有连接或重叠的相邻字符,通过在参考点周围搜索,很容易得到左右边界。因此,我们关注的是连接和重叠的情况。这个任务用的是。对于右边的字符分割基线为,对于左边的字符分割基线为。以正确的部分为例,实现细节如下所述。
首先,为了清晰地表示算法的变体,表3给出了一个形式化的语句。然后,根据图10所示的规则构造权重图,将该变量应用于二值图像。这里,中间的红点表示一个白色的前景像素,其他的是它周围的背景像素。基于相邻字符之间的路径应该尽可能少地通过目标像素的思想,实验中设置为A、B、C和D的权重分别为20、5、3和1。为目标像素分配了可观的成本。这样,通过背景像素绕行的路径更可取。背景像素的权重为1,这是移动的最小代价。
图9 初步分割结果
图10 构造权重图的规则
图11 连通字符间的最优路径
图12 经过调整后的精确分割结果
- (b)
(c) (d) (e)
图13 平板图像样本 (a)提取准确 (b)帧数 (c)垂直倾斜 (d)质量下降 (e)分辨率低
(a)
(b)
(c)
(d)
(e)
图14 (上端)采用AMM对平板图像进行精确提取分割结果(a) AMM (b) AOLPR (c) MVTM (d) VLTM (e) (底部)相应的分割字符
构造权值图时,由给出的迭代公式可知从起点到点p的最优路径的实际代价为:
初始化为0。根据最便宜的路径位于从当前点到最下面一行的位置,可以得到剩余的可能成本为:
lt;
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[609462],资料为PDF文档或Word文档,PDF文档可免费转换为Word