手机端照片文本信息识别与提取技术研究开题报告
2021-12-30 21:25:28
全文总字数:4901字
1. 研究目的与意义及国内外研究现状
随着计算机信息技术的不断发展,我们接触到的图像数据日益增多,这些图像不仅丰富了我们的生活,同时也蕴含着很多信息。文字作为信息的载体,是人们表达和交流思想、传播知识、保存资料和典籍的主要媒介,也是图像内容的关键描述和补充。这些文字都具有明确的语义信息,有助于计算机更高层次地认知图像,最终实现计算机智能识别。因此如何从图像中快速、准确地获取我们所需要的文字信息成为了一项具有重要研究意义的课题。
ocr(全称为optical character recognition,光学字符识别)技术,是对文本资料构成的图像进行扫描,然后对图像的文本信息进行分析识别处理,获取文字及版面信息的过程。它的研究促进了模式识别、图像处理等学科的发展,使文本可以高速地输入到计算机中,解决了低速的信息输入与高速信息处理之间的矛盾,把人们从繁重的键盘输入的工作中解脱了出来。ocr 技术目前是一个极其重要的非键盘输入技术,在各行各业以至于普通人的生活中都有重要的意义。ocr技术现在被广泛地应用到各行各业,比如大可应用于银行票据、大量文字资料、档案卷宗、文案的录入和处理领域等,小可用于识别照片等图像文本信息。ocr技术给很多人的工作和生活带来了很大的便利。由于ocr是一门与识别率相关的技术,因此如何除错或利用辅助信息提高识别正确率,是ocr最重要的课题。
智能手机的不断发展及普及导致人们拍摄的照片越来越便捷,于是针对识别与提取照片文本信息的需求应运而生。因此本课题研究的目的是通过使用ocr技术,开发出在手机端能识别并提取照片文本信息的系统,并且该系统能快速、准确地识别照片的文字。研究这样的文字识别系统,可以在一定的程度上帮助用户更为准确、快速地了解照片中所包含的文本信息,有利于信息的传播和知识的推广,减轻人工读取识别的负担。所以文字识别的研究具有深刻的意义。国内外研究现状
ocr技术从原本只能识别指定的数字、字母和符号,逐步发展成为能自动进行版面分析、表格识别,实现混合文字、多字体、多字号、横竖混排识别的计算机信息快速录入技术。它对印刷体汉字的识别率大致达到98%以上,并且可识别宋体、黑体、楷体、仿宋体等多种汉字字体及它们的混合组合,也对手写体汉字的识别率达到70%以上。
2. 研究的基本内容
本文主要研究运用ocr技术,在手机端对照片的文本信息进行识别与提取,最终目标是设计一个文字识别系统,能够从手机照片中提取有用的文字信息。主要以下四个步骤进行研究:
(1)图像预处理:对照片进行灰度化、二值化,去噪声,倾斜矫正,涉及拍摄角度的调正,字符分割及归一化;
(2)ocr技术:采用多种特征提取方法来提取字符的特征,对各种分类器进行组合,通过一系列的分类判断,找到与所要识别的字符图像相匹配的特征,然后确定识别结果,以此识别出字符;
3. 实施方案、进度安排及预期效果
一、实施方案:
从课题的选择到其完成,主要经历四个阶段,以下是对四个阶段实施方案的安排:
第一阶段:根据所学知识与指导老师交流,确定选题范围,搜集、查阅相关参考资料,通过阅读分析相关文献,了解文本信息的识别与提取。
4. 参考文献
|