基于FPGA的数字识别系统开题报告
2022-01-14 21:57:28
全文总字数:4198字
1. 研究目的与意义及国内外研究现状
图像是当今信息传递的主要载体,图像信息是传递信息的重要媒介,图像中信息的提取对于当今科学技术和人工智能的发展有着深远的意义。图像识别至今经历了三个发展阶段,字符识别——数字图像处理与识别——物体识别。字符识别可以分为两类:一类是文字识别,识别的信息主要为各国的文字如汉字、英文等书写或印刷体文本;另一类是数字书别,识别的信息主要由阿拉伯数字以及少量特殊符号组成的各种编号和统计数据,如产品编号、发票、身份证号码、仪表数字等等 ,处理这类信息的核心是数字识别技术。因此数字识别的研究有着重大的现实意义,一旦实现并投入使用,将产生巨大的社会和经济效益。
本次选题的目的为在FPGA上实现单个数字的识别,为今后更高速、有效的多数字实时识别作好铺垫。
国内外研究现状
德国科学家Tausheck在1929年首次提出光学字符识别OCR的概念并取得相关专利,随后美国科学家Handel也提出利用技术对文字进行识别的想法。OCR研究自发展开始到今天已有近百年的历史,在研究初期多以文字的识别算法为主,并且限制在0至9的数字。随着研究的不断向前发展,日本在九十年代后期率先设计出一些初步的产品,随平台式扫描仪的广泛应用,我国的信息及办公自动化得到大力普及,有效推动了数字识别技术的革新,使其在识别准确率及速度方面都能跟上日益增长的用户需求。
光学字符识别(OCR)技术经过十几年的发展已经从实验室走向应用。数字识别是字符识别的一个重要分支,有极大的实用价值。从字符的字形方面可以大致分为印刷体和手写体,对于不同类型的数字对应的识别算法也不尽相同,这些都属于图像处理和分析的范畴。虽然传统的图像处理算法发展地更为成熟,但其实现大都是基于PC的软件方法,不能满足实时和便捷的需求硬件实现一般有单片机、VLSI、DSP和FPGA等几种形式:其中单片机在数据处理方面实现速度慢,一般仅用于简单的对实时性要求较低的数字处理;通用的DSP的外围电路设计较为复杂,而且开发周期较长,也不适合普通的数据处理;专业的DSP的灵活性差而且相较于其他几类处理器其成本较高。随着大规模现场可编程门阵列被广泛的应用,使得数字识别FPGA实时应用方面有了更广泛的发展。FPGA具有集成密度高、容量大、并行处理速度快、含内置存储器、还具有在线编程、动态重构和设计灵活性高的优势,所以应用更为广泛。FPGA自发展之日起,其高速有效的处理方式和高集成的可重复编程结构使它越来越广泛的应用于各个领域,近年来尤其在图像处理和视频传输等方面崭露头角。为改善 这一问题,利用FPGA的特性改进了传统的图像处理模式,通过直接对接受数据进行处理并直接输出最终结果的方式达到高效数据处理的目的。
数字识别算法从字符的字形方面可以大致分为印刷体和手写体两种,对应每种字形系统使用的识别算法也很有差异。本文的研究方向是印刷体数字识别,对应此类的识别算法有基于特征提取的数字识别和基于模板匹配的数字识别两大类:具体到基于特征的数字识别有基于数字的结构特征、组合特征、梯度特征以及对应数字图像的投影直方图和距离分布直方图的识别,还有根据多个参数构成的特征矩阵来进行字符识别算法;近年来还增加了较为新颖的如基于BP神经网络和粒子群等人工智能的数字识别算法。
数字识别算法 | 速度 | 最高准确率 | 稳定性 | 实现方式 |
基于结构和形状特征 | 一般 | 97.36% | 较好 | 软件平台或硬件电路均可 |
基于组合特征 | 一般 | 97.4% | 较差 | 软件平台或硬件电路均可 |
基于投影特征 | 一般 | 98% | 较好 | 软件平台或硬件电路均可 |
基于特征矩阵 | 较快 | 97%以上 | 很好 | 软件平台或硬件电路均可 |
采用BP神经网络 | 较快 | 90%左右 | 很好 | 软件平台 |
采用PSO等人工智能算法 | 较快 | 98.6% | 很好 | 软件平台 |
数字识别在各个行业都有应用,涉及领域十分广泛。数字识别技术应用在电子出版物领域中既能完成信息标准化又需要将出版物的一系列信息进行关联;基于BP人工神经网络的数字识别被应用在信息录入与处理系统中,不仅识别准确率可以达到96.8%以上,还能快速处理大量待处理信息,极大提高录入速度;数字识别还应用在身份号码识别;数字识别在船用设备管理尤其是液晶显示的仪器仪表中的应用,缓解了人们在实时观测报警系统中的工作压力;数字识别应用于高辐射的磁控溅射设备中,可以自动记录实验数据,并对实验数据进行存储和进一步识别进而实现远程监控。
2. 研究的基本内容
1. 根据课题要求完成数字识别系统的设计方案,确定使用的数字识别算法以及硬件电路实现工具。
2. 熟悉fpga开发板ac620、800*480液晶显示屏和ov5640摄像头的结构以及各功能的配置,以及常用数据传输接口的用法。
3. 使用i2c总线配置ov5640摄像头,确定输出视频图像格式和分辨率,使图像的数据存储以及进一步处理更为便捷。
3. 实施方案、进度安排及预期效果
进度安排:
1. 2019年2月份及之前,查阅收集相关中英文资料以及文献,了解数字识别原理,研究不同数字识别算法并分析各个算法的优缺点,选择合适的算法。
2. 2019年2月份至3月份,熟悉并学习quartus、modelsim软件的使用,着重学习verilog硬件描述语言,尝试实现一些简单的工程设计及其仿真,思考如何通过verilog编写实现选取的算法。
4. 参考文献
[1]高振斌,赵盼,王霞,陈洪波.印刷体数字识别系统的fpga实现[j].重庆邮电大学学报(自然科学版),2015,27(02):213-218.
[2]赵盼. 印刷体数字识别系统的fpga实现[d].河北工业大学,2015.
[3]魏子奇. 基于fpga的数字识别系统的研究与实现[d].东华大学,2016.