登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 计算机类 > 计算机科学与技术 > 正文

智能票据识别系统的设计毕业论文

 2021-12-25 15:17:03  

论文总字数:16273字

摘 要

票据录入是金融活动不可缺少的工作,票据录入的工作量缺十分庞大,开发出票据自动识别软件以减少财务人员的工作效率具有十分重要的实际意义。尽管电子票据已初具一定的使用规模,但纸质票据的使用依然占据主流。本文基于上述背景,设计了一套票据自动识别系统,能简化工作流程,提高工作效率。

该系统包括图像预处理、字符识别并保存识别内容。论文的主要工作如下:

  1. 对系统进行需求分析,并在此基础上设计系统的基本结构。
  2. 重点阐述系统的主要模块:预处理模块与字符识别模块。
  3. 对系统界面进行简单介绍,并展示测试结果
  4. 对测试结果进行总结,分析存在的不足,最后对系统未来的完善进行展望。

关键词:OCR 图像处理 tesseract 票据识别

Intelligent bill recognition system

Abstract

Bill entry is an indispensable task for financial activities. The workload of bill entry is very large. It is of great practical significance to develop automatic bill recognition software to reduce the efficiency of financial personnel. Although electronic bills have begun to take a certain scale, the use of paper bills still dominates. Based on the above background, this paper designed a set of automatic bill recognition system, which can simplify the work process and improve work efficiency.The system includes image preprocessing, character recognition, and preservation of recognition content. The main work of the paper is as follows:

  1. Perform a demand analysis on the system and design the basic structure of the system on this basis.
  2. Focus on elaborating the main modules of the system: pre-processing module and character recognition module.
  3. Briefly introduce the system interface and display the test results
  4. Summarize the test results, analyze the shortcomings, and finally look forward to the future improvement of the system.

Key words: OCR, Image Processing,tesseract,Bill recognition

目录

摘要 I

Abstract II

第一章 绪论 5

1.1 课题研究背景 5

1.2 课题研究现状 5

1.2.1票据识别系统研究现状 5

1.2.2 OCR技术研究现状 7

1.3 课题研究的目的和意义 7

1.4 论文结构安排 8

1.5 本章小结 8

第二章 需求分析与方案设计 9

2.1 设计目标 9

2.2版面分析 9

2.3 总体方案设计 10

2.4 本章小结 11

第三章 图像预处理 12

3.1 序言 12

3.1.1 OpenCV介绍 12

3.1.2 主要处理工作说明 12

3.2 去除红色印章 12

3.3 去噪 14

3.3.1 均值滤波 14

3.3.2 中值滤波 15

3.3.3 高斯滤波 15

3.3.4 双边滤波 16

3.4 信息区定位、切割 17

3.5 本章小节 20

第四章 其他处理与测试 21

4.1 tesseract字符识别 21

4.2 图像锐化 22

4.2.1 微分法 22

4.2.2 高通滤波法 22

4.3训练针对性库 24

4.3 效果展示 26

4.3.1实验环境 26

4.3.2 系统界面 26

4.3.3 效果比对 28

4.4 本章小结 29

第五章 总结展望 30

5.1 工作总结 30

5.2 课题展望 30

参考文献 31

致 谢 33

第一章 绪论

1.1 课题研究背景

社会的繁荣离不开经济交流,经济交流的频繁催生了金融业,随着金融行业的迅速发展,票据的使用越来越广泛。尽管电子支付的方式不断增多,但是由于互联网的安全所限以及其他各种原因,纸质票据的使用仍是最受欢迎的形式。在欧美等信息化高度发达的国家,纸质票据承担了60%的非现金转账业务,并且支票使用总量仍然以每年2-3%的速度递增。据资料统计,仅2005年,中国企业年签发票据量约20亿笔,金额已超过400万亿元。虽然办公自动化程度不断提高,但是对于票据的信息录入,仍然采用手工方式人工录入,企业、银行等的各金融相关部门每日需面对海量的票据类文档的证伪、录入、存储、处理等。近年来,我国也已经开始使用电子发票。电子发票的发展速度快,也越来越多地被企业所使用。电子发票正在逐步地取代纸质票据,更加有利于信息的提取和存储工作。

虽然电子发票正在逐渐兴起,但是尚未能完全取代纸质发票。纸质发票的使用规模仍然巨大。纸质票据的稳定性和可靠性仍然是金融信息记录的主要载体。面对巨大的工作量,人工的票据处理很难做到高速与高效。由此,票据自动处理系统应运而生。实现自动处理票据,真伪鉴别,既节省人力花费与时间,又能提高工作效率,减少人为干预,强化核算工作和风险应对能力。

基于上述背景,本文将采用OCR技术,针对增值税机打发票,对图像进行信息采集和提取,并寻求可有效提高识别精度的方法,提高票据信息录入的工作效率,减少人力资源投入。

1.2 课题研究现状

1.2.1票据识别系统研究现状

目前网上报账系统的开发还仅仅处于分散阶段,各个系统分开,独立工作,网上保账系统仅仅是传统报销的流程重写。 李春亭、连志刚、李国明以票据图像识别为核心,提出基于矩阵扩展法进行票据识别,系统包括功能模块、票据图像识别算法等。随着金融业务往来越来越频繁,票据的使用频率也越来越高,录入的工作量也就随之上升,这就为 OCR ,即光学字符识别的诞生奠定了基础。并且随着科技的不断发展,OCR 在票据自动识别系统中发挥的作用越来越广泛。刘宁波、李刚、张华强基于OCR技术实现了发票自动识别与校验系统,实现了发票验审管理、发票校验管理、影像管理及查询功能,实现了公司物资结算工作的智能化、自动化处理,提升了结算工作效率并提高了物资结算业务准确度,为物资结算工作提供了可靠的信息化支持。为求可通过扫描仪的读取数据,系统为客户机/服务器架构,服务器采用ORCALE 数据库。客户端通过Web Service方式实现和ERP的信息集成和交互。系统全部架设在内网环境,可达到国网对自建系统的安全性标准。架构图如下:

图1-1 C/S模式票据识别系统框架图

请支付后下载全文,论文总字数:16273字

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图