移动端藏文OCR识别系统设计与实现毕业论文
2021-03-21 23:57:37
摘 要
随着智能手机市场的迅速发展,近几年关于移动OCR识别系统的研究越来成熟。然而,藏文识别这一方向,在手机终端上还没有一个较为舒适丰富的应用功能。
结合光学字符识别技术以及android智能终端应用开发技术,本文开发了一款移动藏文识别的android应用软件,能够有效完成单字符藏文的识别与提取。
论文主要研究的是android开发技术和图像识别技术,重点介绍了关于藏文图像的光学字符识别过程中的图像预处理、特征提取和模版匹配等相关的一系列处理,实现了藏文字符的有效识别。
本文实现的基于android的OCR识别系统,主要包括图像采集、图像预处理和图像识别三大模块。 其中,图像采集模块主要实现自定义相机和图库两种获取待识别图片的方式;图像预处理模块采用论文改进的算法完成预处理操作;图像识别模块负责提取图像上的文本信息。
测试的结果表明,本文采用的特征提取以及模板匹配算法能有效识别藏文字符,达到了我们的预期目标。
关键词:Android;光学字符识别;OCR;NDK
Abstract
With the rapid development of the smart phone market, in recent years on the mobile OCR recognition system research more mature. However, the Tibetan language in this direction, in the mobile terminal does not have a more comfortable and rich application function.
Combined with optical character recognition technology and android intelligent terminal application development technology, this paper developed a mobile Tibetan language recognition android application software, can effectively complete the single character Tibetan recognition and extraction.
The main research is the development android technology and image recognition technology, focusing on the Tibetan image on the optical character recognition process of image preprocessing, feature extraction and template matching and other related series of processing, to achieve the effective Tibetan characters Identify.
This paper realizes the android-based OCR recognition system, which mainly includes three modules: image acquisition, image preprocessing and image recognition. The image preprocessing module adopts the improved algorithm to complete the preprocessing operation. The image recognition module is responsible for extracting the text information on the image. The image preprocessing module adopts the improved algorithm to complete the preprocessing operation. The image recognition module is responsible for extracting the text information on the image.
The results of the test show that the feature extraction and template matching algorithm can effectively recognize Tibetan characters and achieve our desired goal.
Key Words:Android;optical character recognition;OCR;NDK
目 录
第1章 绪论 2
1.1 选题背景及意义 2
1.2 藏文OCR识别研究现状 2
1.3 论文结构 3
第2章 Android相关技术介绍 4
2.1 Android系统概述 4
2.2 Android平台架构及特性 4
2.3 搭建Android开发环境 5
2.4基于Android平台的OCR开发 5
第3章 藏文OCR相关技术与算法 7
3.1 模式识别 7
3.2 特征提取 7
3.3 藏文文字特征提取 9
3.4 藏文方向特征向量提取 10
3.5 分类器设计 11
3.6 字符匹配 11
3.7 LibSvm使用 12
第4章 移动OCR藏文识别系统设计与实现 13
4.1 移动藏文OCR系统架构设计 13
4.2藏文识别系统的实现 14
4.2.1 开始 14
4.2.2 运行 15
4.2.3 OCR识别文本图像 15
第5章 全文总结与展望 18
5.1 全文总结 18
5.2 后续展望 18
参考文献 20
致 谢 21
第1章 绪论
1.1 选题背景及意义
藏文是我们国家除汉字以外,历史最为悠久,文献最为丰富恢宏的一份语言文化遗产,因此,藏文的古籍、电子化处理和文本的信息化已经成为现代社会所关注的课题[1]。包括藏文古籍整理、办公自动化、网络应用、信息搜索、学校藏文教学等领域都需要藏文的OCR识别技术。而光学字符识别( Optical Character Recognition,OCR) ,主要是用来提取文本图像中的文字内容,它的工作原理是使用扫描仪或者照相机等光学处理设备,把文本图像输入计算机得到灰度图像或者二值图像,然后进行一系列操作,将文档资料由光学信号转化为数字信号,接着通过不同模式识别算法将文本图像字符进行分析、提取特征、与识别库里面的标准字符集模板进行一对一匹配等操作,来实现识别文字的目的。
汉字的OCR识别技术已经比较成熟,通过十几年的努力,我国的汉文光学识别技术从容易的单个字符识别发展到多种不同字体混合的多体识别[2],从中文印刷体的识别发展到中英混排印刷材料的双文种识别。尽管有着汉字字符集庞大、字体字形繁多等困难,还是克服困难开发出了相当成熟的产品,已经在印刷、出版、新闻、图书馆、办公自动化等各个行业得到了广泛的应用。