登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 开题报告 > 电子信息类 > 电子信息工程 > 正文

纸质发票数字识别算法比较研究与实现开题报告

 2021-03-10 23:36:45  

1. 研究目的与意义(文献综述)

20世纪早期由于信息处理过程需要大量的计算,而那个时期没有快速强大的计算工具,因而极大的约束了信息处理技术初期的发展。随着现代科学技术的腾飞,特别是计算机领域的迅猛发展,计算机的计算能力呈几何速率提升,信息处理技术有了极为巨大的发展,需要大量劳动力来进行重复性劳动的工作大为减少。比如财务领域里机打发票的归类汇总、学校师生的个人信息管理、高质量的彩色图片处理、对上网用户购买情况和喜好的分析、导弹拦截系统中的轨迹计算、火箭发射等。
信息处理技术的发展过程也伴随着机器学习和模式识别领域的发展。由于人工神经网络等新技术的引进,从上世纪70年代以来,光学字符识别技术开始逐步趋向成熟化。进入九十年代后,人工神经网络,支持向量机技术发展非常迅速,它们的诸多优点如信息并行分布式处理能力和自主学习功能都激起了人们对它的极大的兴趣。为模式识别开辟了新的途径,成为模拟人工智能的重要方法。
本篇论文主要研究和实现纸质发票上的数字自动识别。在全人工环境下,发票由工作人员一张一张识别并手动输入电脑,在发票单据数量过大时,处理时间会变得极其紧迫,易导致工作人员工作繁重、效率低下,费时费力。本课题的研究旨在利用计算机来处理纸质发票,不仅解放了生产力,效率更是有了质的提升,无形中为公司节省了一笔不菲的开支。数字识别涉及到了机器学习和模式识别的许多算法和技术,如BP神经网络、支持向量机、决策树等 。
字符识别一般从以下几个方面来进行分类:从输入设备的角度来分,可以分为脱机和联机;从字体角度来分,可分为印刷体和手写体;从识别对象的角度来分,可分为阿拉伯数字,英文字母,汉字以及其他国家的文字。其中印刷体的数字字符识别是最简单且发展最快的。数字字符识别发展到现在,在国内外都已经取得了丰硕的成果,使用了各种算法大幅提高了识别的精度,速度,鲁棒性,取得了大量的成果,在很多领域得到了成功的应用。但是,由于模式识别涉及许多复杂的问题,现有的理论和方法对于解决这些问题还有许多不足之处,需要各国研究人员继续加以研究,让数字识别的技术更加成熟。数字字符识别技术在国民经济发展的各个领域中都占有着极其重要的地位。到目前为止,小规模的光学字符识别系统应用已经非常的广泛,有着巨大地商业前景,如汽车招牌识别、产品编码识别、邮政编码识别等。国内目前最有实力的字符识别公司有:云脉OCR,汉王OCR等。因此,对于研究基于神经网络、支持向量机等算法的文字识别系统有着极其重要的意义。

2. 研究的基本内容与方案

一、发票上的数字字符识别内容大体包括:
1. 用输入设备如照相机对纸质发票进行录入;
2. 用图像分割和边缘检测的相关知识检测、分割发票区域并标记;
3. 用机器学习和模式识别的相关知识对区域中的字符进行训练;
4. 对测试样本自动进行识别,并返回识别结果;
5. 对识别结果进行整合,自动生成电子发票或按规定将数据输入数据库。
二、研究的目标及步骤:实现对纸质发票上所需数字字符的自动识别并按顺序依次录入指定数据库中,具体步骤如下:
1. 实现对单一规格的发票的区域划分,然后对每个区域进行标记,使用数字图像处理的相关技术如边缘检测与分割、Hough变换、边缘加细等提取出每个区域的内容,在边缘检测时,由于图像边缘的区域相似性和不连续性,可以使用Roberts边缘检测算子、Prewitt算子、Sobel算子等进行分割,它们各有自己的优点和缺点,视具体情况选择适合的算法。
2. 因为研究的主要是数字和字母的识别,当遇到汉字时即丢弃。取出所需数字字符后,使用决策树、支持向量机、BP神经网络等算法对训练样本进行训练,根据情况调整参数,最终生成分类器。用训练好的分类器对相同规格的发票进行测试,比较不同算法的优劣。
3. 识别完数字字符后送回标记的区域,完成识别结果整合,最后自动生成电子发票或者输入到指定数据库中。

3. 研究计划与安排

第1-3周:确定论文研究方向,搜集相关资料,撰写开题报告;
第4-5周:学习图像处理方面知识,初步掌握图像分割技术,能完成简单发票图像分割;
第6-7周:学习机器学习和模式识别方面的知识,初步掌握数字字符的识别技术,对选定识别算法完成样本训练,并实现同字号数字字符识别 ;
第8-9周:应用数字字符识别技术,实现实际场景下的发票数字识别,并完成对识别结果的整合;
第10-12周:完成论文初稿;
第13-17周:对论文进行修改和完善。

4. 参考文献(12篇以上)

[1]杨杰,黄朝兵.数字图像处理及MATLAB实现[M].北京:电子工业出版社,2014.
[2]丁伟雄.MATLAB R2015a数字图像处理[M].北京:清华大学出版社,2016.
[3]陈振龙,陈宜治,龚小庆.概率论与数理统计[M].杭州:浙江工商大学出版社,2016.
[4]周志华.机器学习[M].北京:清华大学出版社,2016.
[5]郭斯羽.面向检测的图像处理技术[M].湖南:湖南大学出版社,2015.
[6]孙明,孙红.数字图像理解与智能技术[M].北京:电子工业出版社,2016.
[7] 张强,王正林.精通MATLAB图像处理[M].北京:电子工业出版社,2012.
[8]刘浩,韩晶.MATLAB R2014a完全自学一本通[M].北京:电子工业出版社,2015.
[9]杨帆.数字图像处理与分析[M].北京:北京航空航天大学,2015.
[10]龚小庆,王炳兴.概率论与数理统计教程[M].杭州:浙江工商大学出版社,2012.
[11]Rafael C Gonzalez, Richard E Woods.数字图像处理(第二版)[M].北京:电子工业出版社,2004.
[12]S Mallat,A Wavalet Tour of Signal Processing. New York: Academic Press,1988.
[13]W. Zhang, et al. "A Method of Recognizing Curve Direction Based on Hough Transform," 2016 9th International Symposium on Computational Intelligence and Design (ISCID), Hangzhou, 2016, pp. 3-6.
[14] S. Qiang, et al. "An edge-detection method based on adaptive canny algorithm and iterative segmentation threshold," 2016 2nd International Conference on Control Science and Systems Engineering (ICCSSE), Singapore, 2016, pp. 64-67.
[15] W. Zhao, et al. "Character Recognition Based on Improved BP Neural Network," 2013 Third International Conference on Instrumentation, Measurement, Computer, Communication and Control, Shenyang, 2013, pp. 754-757.
[16] A. Gaur and S. Yadav, "Handwritten Hindi character recognition using k-means clustering and SVM," 2015 4th International Symposium on Emerging Trends and Technologies in Libraries and Information Services, Noida, 2015, pp. 65-70.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图