登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 外文翻译 > 电子信息类 > 电子科学与技术 > 正文

基于OPENCV的手写字符识别系统设计外文翻译资料

 2022-11-11 14:59:49  

毕业设计英文翻译

Handwritten character recognition using wavelet energy and extreme learning machine


Handwritten character recognition using wavelet energy and extreme learning machine

Binu P. Chacko bull; V. R. Vimal Krishnan bull; G. Raju bull; P. BabuAnto

Abstract

This paper deals with the recognition of handwritten Malayalam character using wavelet energy feature (WEF) and extreme learning machine (ELM). The wavelet energy (WE) is a new and robust parameter, and is derived using wavelet transform. It can reduce the influences of different types of noise at different levels. WEF can reflect the WE distribution of characters in several directions at different scales. To a non oscillating pattern, the amplitudes of wavelet coefficients increase when the scale of wavelet decomposition increase. WE of different decomposition levels have different powers to discriminate the character images. These features constitute patterns of handwritten characters for classification. The traditional learning algorithms of the different classifiers are far slower than required. So we have used an extremely fast leaning algorithm called ELM for single hidden layer feed forward networks (SLFN), which randomly chooses the input weights and analytically determines the output weights of SLFN. This algorithm learns much faster than traditional popular learning algorithms for feed forward neural networks. This feature vector, classifier combination gave good recognition accuracy at level 6 of the wavelet decomposition.

Keywords: Character recognition , Feature extraction , Wavelet energy , Extreme learning machine

1 Introduction

Handwriting recognition has been a popular area of research since few decades under the purview of image processing and pattern recognition. A major goal of pattern recognition research is to create human perception capabilities in artificial systems. The task of automatically reading handwriting with close to human performance is still an open problem and the central issue of an active field of research. This may be due to the large degree of variability of human writing. Handwritten character recognition (HCR) systems have to address issues such as infinite variety of character shapes, similarity between characters, and distorted and broken characters. The system having intelligence in recognizing the natural handwriting for all possible scripts around the world is the need of the current era. As a first step of document understanding, a digital image of the document to be analyzed needs to be captured by a scanner or digital camera. Then the segmented characters are subject to a number of preprocessing steps that aim at reducing the variability in the appearance of handwriting. The basic problem is to assign the digitized character to its symbolic class. A pattern recognition algorithm is used to extract shape features and to assign the observed character to the appropriate class. In the case of handprint, it is loosely referred to as intelligent character recognition (ICR). It provides significant benefit to man–machine communication. The techniques for automatic handwriting recognition can be distinguished as being either online or offline depending on the particular processing strategy applied. Online recognition is performed as the text to be recognized is written. In contrast, offline recognition is performed after the text has been written. It deals with the analysis of spatio-luminance of an image. Two critical issues of developing a handwriting recognition system are the selection of a feature set and designing a classifier. The state of the art classifiers include statistical classifier such as modified quadratic discriminant function (MQDF), neural classifiers such as multi layer perceptron (MLP), radial basis function (RBF) classifier, polynomial classifier (PC), learning vector quantization (LVQ) and support vector machine (SVM). The state of the art features in HCR are the different variants of direction features. These include chain code, gradient, and curvature features. Gabor transform and statistical/structural features have also been successfully used in character recognition research. Shi et al. considered a composite feature by combining gradient and curvature feature vectors.

The aim of feature extraction of the recognition structure is to extract discriminant information from an image of a character as well as to reduce its dimension of representation. This reduction is required to make the conception of the classification system easier, when the discriminant feature extraction allows presenting competently a character to the classifier. In this paper, we adapt a feature called wavelet energy (WE) computed from wavelet transform (WT). Wavelets are powerful tools of multi-resolution analysis, which have been widely used in image processing applications. A 2D wavelet transform can decompose the image in several directions at different scale. Moreover, to a non oscillating pattern, the amplitudes of wavelet coefficients increase when the scale of wavelet decomposition increase. WE of different decomposition levels have different powers to discriminate character images. Computation of WE parameter is easy, and it produces better recognition accuracy. The main advantage of using this parameter is its ability to separate the character from noise in the wavelet transformed domain.

Once discriminant features have been extracted, they are submitted to a logic decision system whose task is to identify the character that they represent. Over the years, artificial neural networks (ANN) have widely used in classification tasks. The popularity of neural

剩余内容已隐藏,支付完成后下载完整资料


毕业设计英文翻译译文

译文题目:基于小波能量的手写字符识别

指导老师:韩屏

学 院:信息工程

专业班级:电子1302班

姓 名:伍安安

学 号:0121309340221

2017

4

13

基于小波能量的手写字符识别

彼努 P.查科,V.R.维姆 克里希南,G.拉朱,P.巴布 安多

摘 要

本文介绍了使用小波能量特征(WEF)和极限学习机(ELM)对手写马拉雅拉姆字符的识别。小波能(WE)是一种由小波能变换得到的新鲁棒参数。它可以降低不同类型噪声在不同程度时的影响。WEF可以反映小波能在不同尺度上多个方向的字符分布。对于非振荡模式,当小波分解的尺度增加时,小波系数的幅度增加。不同分解级别的WE具有不同的识别角色图像的能力。这些特征构成了不同模式手写字符的分类。许多分类器运用传统的学习算法,导致其速度远远低于需求。因此,我们对单个隐层前馈网络(SLFN)使用了一种称为ELM的极快倾斜算法,SLFN随机选择输入权重,经过分析而确定SLFN的输出权重。该算法比传统的前馈神经网络流行算法学习起来快得多。该特征向量和分类器的组合在小波分解的六级处拥有较高的识别精度。

关键字:字符识别;特征提取;小波能量;极限学习机

1 介绍

数十年来,手写识别在图像处理和模式识别的研究领域一直广受欢迎。模式识别研究的一个主要目标是在人造系统中创造人的感知能力。智能识别手写笔迹的人性化表现仍然是一个开源问题,也是研究领域的一个核心问题。这可能是由于人类书写的巨大多样性。手写字符识别(HCR)系统必须解决诸如字体形状、字符之间相似性,字体扭曲和字符分离等问题。该系统能智能识别世界各地所有可能字体的自然笔迹,这是当今时代的需要。文档识别的第一步,就要通过扫描仪或数码相机获取文档的数字图像信息进行分析。然后,分割的字符将进行许多预处理,目的是减少手写字符外观的变化。基本的问题是将数字化字符分配给其它的符号类。模式识别算法用于提取形状特征,并将观察到的对象分配给适当的类。在手印的情况下,它被宽泛地称为智能字符识别(ICR),它对人机交流具有重要意义。

根据所应用的特定处理策略,自动手写识别这项技术可以根据其应用过程中特定方法的不同被区分为在线识别和离线识别。在线识别随着文本被写入自动识别。相比之下,离线识别是在写入文本之后执行识别。它能对图像的空间亮度分析处理。开发手写识别系统的两个关键问题是选择特征集并设计分类器。最先进的分类器包括诸如修改二次判别函数(MQDF),多层感知器(MLP),径向基函数(RBF)分类器,多项式分类器(PC),学习矢量量化(LVQ)和支持向量机(SVM)等神经分类器的统计分类器。HCR的最新特征在于方向特征的不同变体,这些包括链码,梯度和曲率特征。Gabor变换和统计、结构特征也已经成功地用于字符识别研究,Shietal通过组合梯度和曲率特征向量来考虑复合特征。

识别并提取结构特征的目的是从字符的图像中提取判别信息,并减少其维度。当判别特征允许对分类器的角色进行表征时,需要削弱分类系统的概念。在本文中,我们调整了从小波变换(WT)计算得到的小波能(WE)的特征。小波是多分辨率分析的强大工具,已被广泛应用于图像处理。2D小波变换可以在不同尺度的多个方向分解图像。此外,对于非振荡模式,当小波分解的尺度增加时,小波系数的幅度增加。不同分解级别的WE具有不同的识别角色图像的能力。WE参数的计算很容易,具有更高的识别精度。使用该参数的主要优点是其能够将字符与小波变换域中的噪声分离。一旦提取出判别特征,就将它们提交给逻辑决策系统,其任务是识别它们所代表的字符。多年来,人工神经网络(ANN)已经广泛应用于分类任务。神经网络的普及得益于它们直接从输入样本,近似复杂的非线性映射的能力。然而,他们的表现受到对象表现出来的质量强烈影响。这可能需要大量的参数来表示字符。此外,基于梯度的学习算法(反向传播)可能容易陷入局部最小值。激活功能需要是有区分的能力,计算时间也随着网络规模的增加而增加,因此,有必要一方面执行有效的特征提取,另一方面采取措施减少培训和测试时间。ELM是一种有效的算法,趋向于达到最小训练误差,获得最小权重范数,产生最佳泛化性能,运行速度极快。

本文的其余部分组织如下。下一节回顾了HCR为各种语言领域所做的工作。第3节介绍了WE参数的推导和分析,ELM在Sect中得到了解释。在本文中给出了使用小波能量特征(WEF)和ELM的手写马拉雅拉姆字符识别实验。本文结束于Sect,通过指定使用这种方法显示HCR的优点。

2预备工作

计算机工具的不断发展促使人与电脑之间需要更便捷的交流接口。这样一个接口可以通过对专门领域具有重大经济影响的系统来创建,例如解释信封上的手写邮政地址,自动处理银行支票和官方形式的签名验证,白板阅读等。这些应用的重要性导致了HCR成为多年的热门研究对象。

2.1手写字符识别

手写识别的一般框架涉及预处理(噪声去除,文本检测或类似),分割,表示(骨架,轮廓,像素或其他),特征提取和识别一些方法不使用所有这些元素,而只是一个子集[17]。人们可能会发现阿拉伯语,中文和印度语,卡纳达,泰米尔语,孟加拉语,马拉雅拉姆语和古吉拉特语等语言的工作量很多,HCR系统的成熟只有英文和中文的几种语言。字符集(语言)的性质对HCR系统的性能有很大的影响。

Abuhaiba等人提出了一套识别孤立的阿拉伯字母的字符图模型,每个模型是一个状态机,具有对应于字符中段的方向的转换,并且具有额外的模糊约束以区分一些字符。Amin等人还使用基于骨架的图表来识别阿拉伯语字母,包括曲线的结构特征被馈送到五层神经网络中,图像水平和结构特征已被应用于阿拉伯语手写识别。前者将处理负担置于识别器上,而后者涉及在特征检测阶段的更多处理。图像需要更多的训练数据来建模手写字符形状,结构和混合方法在手写阿拉伯语中更常见。Shaher和Hancock从不同的角度考虑了识别问题。他们选择了七个基本的形状类,其中包含阿拉伯字符,每个类型只包含一个轨迹,他们的系统沿着每个轨迹均匀分布了二十个点,以训练点分布模型(PDM)。测试结果表明,与单个PDM相比,PDM的混合效果明显更好。Dehghani等人采用轮廓投影的罕见表征波斯语字符识别。图像被投影在多个方向,并且获得每个投影的轮廓的链码。轮廓被采样,并且使用二维图案,有效像素的数量,以及斜率和曲率来为每个部分获得特征。通过单个隐马尔可夫模型(HMM)计算分析水平和垂直投影轮廓的特征向量,每个字符产生两个HMM。在识别过程中,来自个体分类器的分数被整合以提高性能。

HMM也适用于难以直观描述的学习特征。现在,基于马尔可夫模型(MM)的系统成功地用于自动手写识别。HMM用于在银行支票中确认合法和礼节金额,并描述了一种检查阅读系统,可以实时识别法语支票的法律和礼节金额,读取率为75%,错误率为万分之一。它使用段并识别(使用多个分类器)范例。引用文献中采用了第一个认可法定数量促成承认金额的方法。Albert等人构建了一次性训练和一次性测试HMM(LOOT-HMM),并进行了手写数字识别问题的实验。在M次观察的序列中,从原始序列中保留观察结果,并在没有观察的情况下创建新的序列。对该序列中的所有观察对象重复该过程,并创建M个新序列。然后,总结所有可能的M序来作出最终决定。

由于手写形状的巨大变化,获得高识别精度对于单个分类而言通常是困难的。一个解决方案是采用一个具有拒绝策略的级联级别。Nunes等使用级联的分类器以及低计算复杂度的识别方案。Giusti等人出了一个两阶段识别系统,其中第一个分类器拒绝的模式被第二个分类器分类。Cao等人使用包括两个不同神经网络的多级分类系统来识别手写数字的两个阶段。Georgios等人提出了基于字符图像的递归子划分的特征提取技术,使得所得到的子图像包含平衡数量的前景像素。特征提取之后,基于特征提取方法的粒度级别提出两阶段分类方案,混淆矩阵中具有高价值的类在一定程度上合并,并且对于每个合并类的组,采集最好区分级别的粒度特征。

Lei等人提出了一种基于测地路径和非参数维数降低算法集成的最优维数降低方法。为了解决汉字识别等大规模模式识别问题,作者提出了一种简化算法策略。这种方法通过采用测地距离优化的非参数维数降低算法大大加快了训练速率。它比主分量分析(PCA)和具有更强分类能力的线性判别分析(LDA)都更为有效。 Tsukumo和Tanaka提出了一种将非线性归一化方法归一化为一个相对稳定形状的输入特征,并成功应用于字符识别。Fu和Xu将贝叶斯决策神经网络应用于分类,而Mao和Mohiuddin引入了使用增强算法对字符分类器进行训练的角色退化模型。

使用数据库ETL-9B进行了几次实验,董等人使用SVM达到了99%的识别率。 Liu 等人提出了使用二次曲线拟合的1D矩和双矩归一化方法。他们还提出了2D归一化方法,以减少运行时复杂度,并获得了99.19%的识别率。Liu等人提出了MQDF,并区别性地对这些参数进行了培训,以将识别率提高到99.39%。加藤等人采用斜率校正和非对称Mahalanobis距离进行分类,达到99.42%的识别率。培训统计分类的一个问题是缺乏足够的培训样本,通过使用Fisher的判别式来减少特征维度,以及通过在MQDF中进行的协方差矩阵的正则化,可以解决这个问题。

第三种技术是通过从现有的训练样本中产生大量的人为扭曲的样本来增加训练集。最近,Leung等人结合所有这三种技术,将识别率提高到99.46%。梁提出了用关键区域分析技术来解决类似性格类的问题。关键区域分析方法的核心思想是突出特定的细胞(关键区域),通过从这些区域中提取特征,可以区分两个相似的字符类别。提取的额外特征被附加到原始特征向量中,使得特征向量中的关键区域的总体贡献增加。作者采用了一种分层多分类方法,其中每对称混淆对的相似字符类使用两类分类器。输入字符首先由第一级分类器分类,如果它被识别为属于混淆对,则调用相应的两个类分类器来进行最终分类;否则,第一个分类器的决定是最终的,这种方法产生的最高识别精度为99.53%。

各种印度文字的模式识别研究也得到广泛报道,Chinnuswami等人提出了他们的工作来识别手写的泰米尔语字符。在这项工作中,作者使用了泰米尔文字符的结构。使用字符的曲线和笔画,识别特征,并使用统计学方法进行分类。Shanthi等使用SVM识别手写的泰米尔语字符。在这个工作图像细分被用于特征提取。Sukhaswami等人使用多个神经网络关联存储器来识别打印和手写的泰卢固语字符。许多预处理活动,如平滑,变薄,偏斜检测和校正以及归一化,都可以在古吉拉特数字识别工作中找到。相关文献中提出了印度脚本文件的斜角检测。Rajasekhara Aradhya提出了一种用于四个南印度语言卡纳达,泰米尔语,泰卢固语和马拉雅拉姆语的手写数字识别系统。在这项工作中,作者提出了基于区域和图像质心的特征提取技术。作者使用了两个不同的分类器,最邻近和反向传播神经网络,卡纳达语和泰卢固语的识别率为99%,泰米尔语识别率为96%,马拉雅拉姆语识别率为95%。

Dutta等人使用曲率特征识别打印和手写的字母数字孟加拉字符。在这里考虑了曲率最大值,曲率最小值和出射点等特征。在分类字符之前也进行了稀疏和平滑化。Bhattacharya等描述了一种混合方案,而Bhowmick等分别使用笔迹特征来识别手写的本格拉数字和字符。Ujjwal和Chaudhuri提出了一种使用基于小波的多分辨率表示和MLP分类器的多级级联识别方案,用于识别本格拉字符,梵文和英语的混合字符。在该方案中,数字以级联的方式与三个粗分辨率水平对应三个MLP分类器。如果即使以最高分辨率被拒绝,则另一MLP被用作通过组合以前阶段中三个分类器的输出来最终识别输入数字。Hanmandlu和Murth提出了一种用于识别手写梵文数字的模糊模型。Banashree等人尝试使用扩散半色调算法识别手写印地语数字。这里,十六分段显示概念已被用于特征提取。

Lajish已经应用了几种技术来识别手写马拉雅拉姆字符。作者使用状态空间点分布,分区矢量距离和模糊分区归一化矢量距离(FZ-NVD)等特征,分类器c均值聚类,k-NN,类模糊神经网络和自适应神经模糊推理系统(ANFIS)。FZ-NVD-ANFIS组合获得最高82.35%的识别率。这项工作指出了这种模式识别对其他鉴别特征的需要。Bindu和Raju使用MLP和NVD对这个问题做了一些工作。作者探索了网格划分技术,将细化图像分为16个块,并从其中测量NVD。当从共同起点(全局弹性网格划分)和局部起点(基于模糊边界的网格划分)测量NVD时,获得了76.21和76.45%的识别精度。当使用局部弹性啮合与共同起源时,识别率提高到79.8%。通过从局部质心(固定啮合)测量NVD,获得了83.31%的改进的识别精度。通过使用三个特征即纵横比、图像代码以及图像原点和质心之间的距离,将精度提高到88.22%。使用多个MLP分类器将识别率提高到93.3%。基于QDF的字符识别系统获得了89.99%的精度,其中每个细化图像被分成64块。在所有这些作品中,稀疏算法的不良性能在识别精度上受到影响,Binu和Babu 使用离散特征和MLP来实现90.18%的识别率。在这项工作中,使用有效的骨架修剪和骨架修剪算法来获得更好的特征。然而,由于人们的写作风格而产生的寄生成分是不可避免的,在马拉雅拉姆字符识别中也使

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[137762],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图