基于机器学习的手写字识别开题报告
2020-02-18 18:24:22
1. 研究目的与意义(文献综述)
-
目的及意义(含国内外的研究现状分析)
1.1目的及意义
20 世纪中期,第一台计算机在美国诞生,人类的信息时代拉开了序幕,随后信息革命悄无声息的开始了,到目前为止,计算机已经由原来的仅供军事领域到人们的日常生活中,功能更是不可同日而语了。计算机已经发展成人们生活中不可或缺的一部分,在生活、娱乐、工作中都占据着重要的位置,计算机的功能和性能也在不断的加强,如何使计算机与人之间能更加友好的交互是信息技术研究的重点。人类可以通过视觉、听觉、嗅觉、触觉捕获信息,人与人之间甚至可以通过眼神、动作完成信息传递,人与计算机的交互变成人与人之间交流一样便捷是人机交互的最终目标。人类承载信息的方式主要包括声音、图像、语言和文字,而文字信息的作用是任何一种方式无法取代的。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!2. 研究的基本内容与方案
-
研究(设计)的基本内容、目标、拟采用的技术方案及措施
2.1研究目标
本次毕业设计是基于深度学习对手写字进行识别,包括初步实现深度网络构建,实现离线手写字分类。
2.2研究基本内容
(1).了解并学习端到端的文本识别系统,用于录入文本信息;
(2).了解并学习计算机视觉相关知识,用于区分文本信息;
(3).了解机器学习,了解监督学习和无监督学习的定义,了解浅层学习和深度学习的概念;
(4).研究学习深度学习,并着重学习深度学习模型:基于自动编码器、基于受限玻尔兹曼机、卷积神经网络等;
(5).学习并掌握深度信念网,初步实现深度网络构建;
2.3拟采用的技术方案及措施
通过将原始输入数据经过隐层的映射转换为编码输出,目标是输出。自动编码器分主要分编码和解码两个部分,形象表示如图2.3.1所示将输入数据送到编码器中,可以得到一个编码,然后数据再进入解码器,解码器会输出相应的数据,通过调节编码器和解码器的参数,降低重构的误差,模拟了一个输入到自身的映射。
图2.3.1 自动编码器的形象表示
图2.3.2 自动编码器的结构
神经网络一般分为输入层,隐藏层和输出层,如图2.3.3.所示。需要注意两点:1.有些神经网络包含着多个隐藏层;2.输出层的输出神经元可以为1个或多个。例如手写数字识别,它的输出可以为“0”到“9”,一共10个输出神经元。
图2.3.3 神经网络的结构
将一个手写数字图像分成一个m×n个部分。例如将图像分成28×28个区域,则输出层包含了784(28×28)个输入神经元,其神经网络的架构如图2.3.4。
图2.3.4 神经网络架构
对于输入神经元,当黑色部分占这个区域超过50%时,则这个神经元的值为1,否则为0。对于输出神经元,一共有10个。当第一个神经元被激活,它的输出为1时,即识别这个数字为0。
3. 研究计划与安排
第1-3周:查阅中、英文资料,完成开题报告,完成不少于2万字符的英文翻译任务;
第4-8周:学习和评测常用手写字识别方法;
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!4. 参考文献(12篇以上)
[1] 王有旺.深度学习及其在手写汉字识别中的应用研究[d].华南理工大学,2014
[2] 李卫.深度学习在图像识别中的研究及应用[d].武汉理工大学,2014
[3] 周星辰.基于深度模型的脱机手写体汉字识别研究[d].浙江大学,2016..
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付 -