登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 文献综述 > 电子信息类 > 电子信息工程 > 正文

深度学习中图像数据扩增方法初步研究文献综述

 2020-04-14 16:31:29  

1.目的及意义

在传统模式教育教学中,测评学生知识水平的主要渠道是通过考试,并且以纸质试卷考试为主要手段,整个试卷评阅过程费时耗力。近年来,随着计算机理论与技术为背景的人工智能运用的不断普及,这项研究已成为当今计算机技术研究领域中的热点问题。在自动化智能评阅试卷研究中,许多研究人员也希望能够进一步将人工智能(Artificial Intelligence, AI)技术引入该领域,更好地发挥计算机的自动计算能力。目前,对于选择、填空等客观题型的自动评阅技术已经很成熟。但是,对于主观题的自动评阅技术尚在探索之中。对主观题自动评阅研究第一步就是要准确识别出考生的手书答案,它依赖于脱机手写体汉字识别(Offline Handwritten Chinese Character Recognition, Offline-HCCR)技术的成功。Offline-HCCR 是指将用硬笔或软笔手工书写在纸质介质上的文字进行机器识别,

它主要包括特征提取和分类两个阶段。特征提取用于从原始输入中提取能表达特定汉字本身而又区别于其他汉字的无冗余性的低维图像特征。常用的汉字特征包括结构特征、统计特征以及包含结构和统计的混合特征。常用的具体分类方法包括二元线性分类器支持向量机[1](Support Vector Machines, SVM)、模拟人脑运行机制的人工神经网络[2](Artificial Neural Network, ANN)分类器以及修正的二次判别函数[3](Modified Quadratic Discriminant Function,MQDF)等。汉字是华夏民族发展至今的文化产物,对于其手写体的准确识别有着重要的现实意义和价值。在过去的三十年里,科学界针对 Offline-HCCR 已经做了大量的研究工作[4],取得了一些进展,但多数成果仍处于实验室阶段,市场上鲜有普及型产品。汉字识别是人工智能与模式识别研究领域的一个重要分支。近年来,随着基于神经网络模型的深度学习[5](Deep Learning)方法研究领域的迅速发展,基于深度神经网络的图像特征提取与分类方法在模式识别领域得到了极大的成功,并被广泛应用于图像识别和语音识别等各个方面[6]。其中,作为拥有优秀图像识别能力的深度学习方法,深度卷积神经网络[7](Deep Convolutional Neural Network, DCNN),得到了越来越多在理论和应用方面的研究。事实上,DCNN 模型是由CNN 模型[8]衍变而来,它是拥有多个隐含层的卷积神经网络,具有自适应提取图像几何不变性特征的能力且模型参数少,运用该模型进行图像识别时,速度快、准确率高。在近几年的文档分析与识别国际会议[9,10](International Conference on DocumentAnalysis and Recognition, ICDAR)举行的脱机手写体识别竞赛中已经被广泛采用。与基于人工设计或定制图像特征的传统方法相比,DCNN 模型能够自适应因手写风格不一致而产生的各种汉字变形,并有效提取汉字图像特征,以保证有较高的识别率。但是,在运用 DCNN 模型解决识别问题时,需要针对不同的识别对象设计不相同的 DCNN 模型。因此,研究 DCNN 模型高识别性能的原因,并探索设计最佳 DCNN 模型的问题或补充 DCNN 模型的理论知识,对于解决脱机手写体汉字识别等具体应用问题有很好的实际应用价值。

信息交流与通信、新闻媒介、办公自动化、手写试卷的智能判卷等多方面的日常工作,都可能涉及到计算机对汉字的自动识别,而手写体汉字识别的研究尤其具有使用价值和应用前景。手写体汉字识别的研究可分为脱机手写体汉字识别和联机手写体汉字识别两种。目前,因为可以根据书写时的笔画顺序、点的坐标等动态信息对汉字进行识别,准确率也较高,联机手写体汉字识别技术已相对比较成熟,市场有很多产品普及,如汉王科技、文通公司的产品。然而,对于脱机手写体汉字的研究进程却是缓慢的。近 40 多年来,各国学者,尤其是日本和我国研究人员在这方面做了大量工作,提出了各种解决思路与方法。目前来讲,已发表的研究论文和技术报告大都着重讨论如何选择特征和匹配方法以适应手写体汉字字形的变化。研究中的实验数据集都是针对特定的已知手写体汉字集合,为多数人所接受的标准手写体字符库还没有真正确立,仍需做进一步研究。由于手写汉字使用的更为广泛,

它较之印刷体汉字的识别而言,其字形各异,变形也不规则。因此,脱机手写体汉字识别一直是汉字识别领域日益关注的课题。脱机手写体汉字的特点导致其识别率低。首先,与西文的数字和英文字符相比,汉字手写体的种类繁多。汉字中的字是其语言表达的基本单位,超过 5 万个。常用汉字也包括了 3700 多个。其次,与印刷体汉字相比,手写体的字形、字体和字号均有根本的不同。实际上,在手写体中,因为没有明确的标记,字形、字体、字号等特征描述的汉字字形都拥有相对西文符号更复杂的结构。与数字和英文字母相比,一个汉字一般会包含更多的笔画。最后,对同一汉字,其手写体的结构特征在不同人之间可能相差很大,而手写时的连笔现象又增加了识别的难度。传统的手写体汉字识别系统一般由特征提取器和分类器两部分组成(图 1.1)。其中,特征提取器对输入的汉字进行特征提取,分类器则根据特征提取所提取出的特征,再利用匹配等方式对待识别的汉字输入进行分类识别。

传统的脱机手写体汉字识别方法分为结构识别与统计识别两大类[52-54]。结构识别一般以笔画或笔画轮廓为特征,用图匹配或松弛匹配的方法做识别判决,如笔画分析综合法[55]、笔画近似法与松弛匹配法[56,57]、特征点法[58,59]等。结构识别的优点是能够适应手写汉字的变形。但是,手写体的任意性和手写过程中易出现的噪声等,使得基于特征识别方法易受干扰影响而发生错误,对识别率有较大的影响,这在很大程度上制约了结构识别法的发展和应用。

{title}

2. 研究的基本内容与方案

{title}

基本内容及目标

通过对图像数据扩增的学习实现对手写体汉字的识别研究

1) 学习深度学习的相关知识

2) 学习并实现汉字图像数据扩增识别的基本方法与理论

3) 对深度卷积神经网络模型进行深入分析

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图