基于深度学习的文字识别开题报告
2021-12-29 21:43:17
全文总字数:1495字
1. 研究目的与意义及国内外研究现状
深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。文字图像信息是人类获取外界信息的主要来源,在近代科学研究、军事技术、工农生产、医学、气象及天文等领域中,人们越来越多的利用图像信息来识别和判断事物,解决实际问题。获取文字图像信息非常重要,但更重要的是对文字图像进行处理,从中找到我们所需要的信息。而在对于需要处理大量文字资料的办公自动化、文档管理、图书管理等场合,文字自动识别输入就成了最佳选择。基于深度学习的文字识别是一项多学科的综合研究课题,它不但与人工智能的研究有关,而且与数字信号处理、图像处理、信息论、计算机科学、模糊数学等都有着千丝万缕的联系。一方面各学科的发展给他的研究提供了工具,另一方面,它的研究与发展也必将促进各学科的发展。因而有着实用的价值和理论意义。
国内外研究现状
20世纪20年代文字图像处理首次得到应用。20世纪60年代中期,电子计算机的发展得到普遍应用,文字图像处理技术也不断完善,逐渐成为一个新兴的科学。从70年代中期开始,随着计算机技术和人工智能、思维科学研究的迅速发展,数字图像处理技术也向更高、更深的层次迈进。到了20世纪90年代,机器人技术已经成为工业的三大支柱之一,人们已经开始研究如何用计算机系统解释图像。近年来,谷歌、微软、百度等拥有大数据的高科技公司相继投入大量资源进行深度学习技术研发,在语音、图像、自然语言、在线广告等领域取得显著进展。从对实际应用的贡献来说,深度学习可能是机器学习领域最近这十年来最成功的研究方向。
2. 研究的基本内容
本文的主要研究是根据文字识别技术在虚拟现实、人机交互、图像检索、无人驾驶、车牌识别、工业自动化等领域中广泛的应用,结合深度学习技术,从复杂条件下实现文档中的文字识别,提高文字识别速度与正确率。
3. 实施方案、进度安排及预期效果
一、准备阶段
1.2016年12月10日至2017年1月8日,查阅收集文献资料,确定论题,准备开题报告。
2.2017年1月9日至2017年2月20日,进一步修正研究研究目标、内容和方法,完成开题报告。
4. 参考文献
[1] 《图像处理与分析教程》 章毓晋编著,人民邮电出版社,2012。
[2] 《数字图像处理》,岗萨雷斯著,阮秋琦等译,电子工业出版社。
[3] 《数字图像处理》,胡学龙等编,电子工业出版社。 [4] 《数字图像处理(matlab版)》rafael c gonzalez,richard e.woods.[m] .北京:电子工 业出版,2004. [5] 《digital image processing》,rafael c gonzalez,richard e.woods.影印版。