基于全卷积网络的文档图像二值化算法研究任务书
2020-04-06 13:08:11
1. 毕业设计(论文)主要内容:
ocr作为一种自动解读文档图像符号的技术,一直以来都备受关注,尤其在信息时代的今天,数字图像纷繁复杂,如何便捷高效的获取其中的文字信息,更有着重要的时代意义。
文档图像二值化是文档图像分析和识别流程中的一个重要步骤。
为了让计算机更快的、更好地识别文字,需要先对含有噪音的彩色图进行处理,使图片只剩下前景信息与背景信息,可以简单的定义前景信息为黑色,背景信息为白色,这就是二值化图。
2. 毕业设计(论文)主要任务及要求
1)首先采集相关数据集,对其进行分析,数据增强;
2)然后搜集相关资料,建立合适的模型对数据集进行训练,并对模型进行评估和改进;
3)最后利用二值化算法,将需要处理的图像转换为二值化图,以便后续进行字符识别。
3. 毕业设计(论文)完成任务的计划与安排
1)2018/1/14—2018/1/22:查阅参考文献,明确选题;
2)2018/1/23—2018/2/22:进一步阅读文献,完成开题报告;翻译英文资料(不少于5000汉字),并交予指导教师检查。
3)2018/2/23—2018/4/30:对采集的相关数据集进行分析,数据增强;模型的建立与改进;二值化算法实现。
4. 主要参考文献
[1] 周志华. 机器学习. 清华大学出版社,2016
[2] i. pratikakis, k. zagoris, g. barlas and b.gatos, “icdar2017 competition on document image binarization (dibco 2017)”, 14thiapr international conference on document analysis and recognition, july. 03, 2017.
[3] g. chutani, t. patnaik and v. dwivedi ,“an improved approach for automatic denoising and binarization of degradeddocument images based on region localization”, 2015 international conference onadvances in computing, communications and informatics (icacci)