基于SVM实现并优化文字识别开题报告
2022-01-07 22:20:25
全文总字数:2230字
1. 研究目的与意义及国内外研究现状
近年来,随着计算机的迅速发展,模式识别技术不断取得新的进展,大大改善了人机之间的信息交互能力。计算机文字识别是模式识别的一个重要分支,它包括 数字字符识别、西方文字字符识别、东方文字字符识别。数字字符识别和英文字符 识别研究最充分,识别方法比较成熟,识别率也比较高;而东方文字字符识别比较困难,其中汉字字符识别是文字识别中最困难的部分。
汉字识别是用计算机自动辨识印刷在纸上或人写在纸上的汉字,学科上属于模 式识别和人工智能的范畴。汉字识别涉及到模式识别、图像处理、人工智能、形式 语言与自动机、模糊数学、组合数学、信息论、中文信息处理等学科,也涉及到语言文字学、心理学、仿生学等,是一门综合性技术。 计算机文字识别是使汉字和其它字符高速自动输入计算机,解决了汉字信息处 理系统中手动输入效率低这一关键问题的理想途径,是办公自动化不可缺少的文字 自动输入手段,是智能计算机智能接口的重要组成部分。同时联机手写汉字识别是 一种很方便的汉字输入方式,而且字符图像经识别后形成的代码,在信息量上减少了百分之九十九以上,对信息压缩和传输有重要意义。
汉字识别是一种难度非常大的模式识别。这是因为:从客观上讲,汉字是一种特殊的模式集合,其模式种类很多,结构非常复杂,有的模式又十分相似,加上印刷质量与干扰的影响,以及人们在书写时的随意性使字形不够规范等原因,都使得汉字字符的识别十分困难。
2. 研究的基本内容
1.静态图像不同文字提取的处理流程:
(1) 人工文字:
人工添加的文字一般来说有以下几个特点,文字大小固定,色调单一并且相对于背景色更为鲜明,分布较为集中,排列方式一般为横向或纵向。针对以上几个特点设计相应方法。具体实现:图片预处理,包括灰度化,二值化,实现基于二值化聚类的图像文字提取。
3. 实施方案、进度安排及预期效果
进度安排: 1-3周 选定研究方向,确定论文题目,完成任务书填写 4-5周 明确研究方向,研究内容,完成开题报告 6-8周 查阅相关文献,学习该课题相关专业知识 9-10周 对完成该课题制定初步设计方案和详细计划 11-12周 完成绪论与基础知识介绍部分 13-15周 进行详细实验设计,得出结果,完成初稿 16周 与导师沟通对初稿进行全面修改整理 17周 论文答辩 预期效果: 在保证对于纯汉字识别正确率不低于90%的情况下,提高汉字识别速度,尽可能达到实时识别 |
4. 参考文献
[1]姚聪.自然图像中文字检测与识别研究[d].华中科技大学,2014
最新文档
- 华北地区夏季降水多年、少年近地层水汽场及风场分布特征开题报告
- 天山地区典型流域降雪分布研究文献综述
- 2016年台风狮子山路径突变原因的初步分析开题报告
- 北京和寿县地区边界层急流观测与模型的对比文献综述
- 具有双Kelvin波结构MJO活动的再分析开题报告
- 基于单片机的温控风扇设计文献综述
- 1961-2015年江苏省气候资源的时空分布规律开题报告
- 智能搬运机器人文献综述
- 基于类型的电影推荐系统文献综述
- Bi6S2O15的合成及其降解有机污染的研究开题报告
- 不确定时滞奇异摄动系统的鲁棒控制器设计文献综述
- 小型双模SIW滤波器的研究与设计开题报告
- 我国绿色出行政策执行研究——以南京市为例文献综述
- 试论李碧华小说中的爱情悲剧开题报告
- 基于FPGA的电子相册设计文献综述