登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 文献综述 > 电子信息类 > 信息工程 > 正文

基于深度学习网络的手写数字识别算法与实现文献综述

 2020-04-30 16:13:43  

1.目的及意义

手写数字识别是利用机器或计算机自动辨认手写体阿拉伯数字的一种技术,是光学字符识别技术的一个分支。手写数字识别被应用于人口普查,成绩单录入,财务,税务,金融,邮件分拣等各种大规模数据统计中。随着我国经济和生活水平的快速发展,每天都会有大量的手写数据,需要耗费大量的人力物力。若使用计算机自动进行手写数字识别技术将能大大提高工作效率,节省时间和金钱。因此手写数字识别研究具有重大的现实意义和广阔的应用前景。而且阿拉伯数字作为唯一被世界各国通用的符号,所以对手写数字识别的研究基本上与文化背景无关,各地的研究工作者可以说是同一平台开展工作的,有利于研究的比较和探讨。

对于 手写数字识别的研究具有一定的难度,数字虽然只有10种,笔划简单,但同一数字写法千差万别,所以很难做到兼顾各种写法的极高识别率的通用性数字识别系统。 在实际应用中,对数字的单字识别正确率的要求要比文字要苛刻得多。而且数字识别经常涉及的财会、金融领域,其严格性更是不言而喻的。因此,对手写数字识别系统的要求不仅仅是单纯的高正确率,更重要的是极低的、千分之一甚至万分之一以下的误识率。 由于脱机手写数字的输入只是简单的一副图像,它不像联机输入那样可以从物理输入设备上获得字符笔划的顺序信息,因此脱机手写数字识别是一个更具挑战性的问题。

随着科学技术的快速发展,机器学习技术在现代社会的各个方面表现出了强大的功能。深度学习作为机器学习的一种,也取得了很大的发展。深度学习就是一种特征学习方法,把原始数据通过一些简单的但是非线性的模型转变成为更高层次的,更加抽象的表达。通过足够多的转换的组合,非常复杂的函数也可以被学习。深度学习的核心方面是,上述各层的特征都不是利用人工工程来设计的,而是使用一种通用的学习过程从数据中学到的。

深度学习正在取得重大进展,解决了人工智能界的尽最大努力很多年仍没有进展的问题。它已经被证明,它能够擅长发现高维数据中的复杂结构,因此它能够被应用于科学、商业和政府等领域。除了在图像识别、语音识别等领域打破了纪录,它还在另外的领域击败了其他机器学习技术,包括预测潜在的药物分子的活性、分析粒子加速器数据、重建大脑回路、预测在非编码DNA突变对基因表达和疾病的影响。也许更令人惊讶的是,深度学习在自然语言理解的各项任务中产生了非常可喜的成果,特别是主题分类、情感分析、自动问答和语言翻译。我们认为,在不久的将来,深度学习将会取得更多的成功,因为它需要很少的手工工程,它可以很容易受益于可用计算能力和数据量的增加。目前正在为深度神经网络开发的新的学习算法和架构只会加速这一进程。

{title}

2. 研究的基本内容与方案

{title}

手写数字识别技术综合了数字图像处理、计算机图形学和人工智能等多方面的知识,现在越来越成为自动化和智能化的重要技术。由于手写数字存在不规范性、多样性,同时要对图像进行高点阵的扫描以达到精确识别,所以使得数字识别处理的信息量大而又复杂。手写数字识别将书写的数字转化为点阵或二值图像再进行特征提取,这个方法与书写的顺序无关,容易识别具有“补比划”或有“自由始终点”的字符,对于比划特征这样的分类能力强的特征不易抽取。

本次设计的目标是识别手写的数字,主要分为三个部分,预处理,手写数字的结构化特征提取,分类器设计及识别。预处理阶段,主要是为了使结构化特征提取时,锁提取的特征能够更好的反映手写数字的特征。手写数字或字母的结构化特征提取关系到识别的准确率,结构化特征主要根据图像像素的走向,来判断出数字的结构,例如直线、曲线和

分叉线等。为了提高识别率,采用卷积神经网络算法,对手写数字的特征进行处理,输出

正确的结果。

本次设计需要做的工作主要有

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图