登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 理工学类 > 自动化 > 正文

视频文字识别算法研究及软件设计毕业论文

 2022-07-18 22:20:26  

论文总字数:36295字

摘 要

 视频中的文字通常含有很重要的信息,比如地点、时间、人名、主题等。视频文字作为一种高级语义信息,对视频内容的理解、索引具有重要作用。本文研究的是视频文字的提取和识别,主要包括视频文字定位、跟踪和分割三部分算法及关键技术的研究.因此,视频文字识别在信息处理、办公自动化、机器翻译、人工智能等高科技领域都有着重要的实用及理论意义。

本文研究了模式识别技术,重点介绍模式识别技术重要应用之一图像识别。通过研究模式识别技术这一理论知识得到视频文字识别的自定义算法,然后基于这一算法,通过采用VB对视频截图进行识别,获取要识别的图片,然后对图片进行灰度化、二值化、字符分割、重新排版等预处理,通过VB设计软件界面 然后调用微MODI组件完成对图片的识别。

软件正是结合现今主流识别方法原理:模板匹配与特征匹配,使所编的图像识别软件达到实用化与多功能化目的。同时通过识别,最终将图片中的视频文字信息呈现出来。

关键词:图像处理 文字识别 重新排版 字符分割

Abstract

Video text usually contains very important information, such as location, time, name, theme and so on.As an advanced video text semantic information, understanding of the content of the video, the index has an important role.This study is the video text extraction and recognition, including video text positioning, tracking and research of three parts division algorithm and key technologies.Thus, the video text recognition in information processing, high-tech field of office automation, machine translation and artificial intelligence have important practical and theoretical significance.

This paper studies the pattern recognition technology, image recognition highlights one important application of pattern recognition technology.Get customized video text recognition algorithm by studying the theory of pattern recognition technology knowledge, and then based on this algorithm, by using VB for video capture to identify, acquire images to be recognized, then the picture grayscale, binary , character segmentation, re-typeset pretreatment by VB design software interface and then call micro MODI component to complete the identification of the picture.

Software is combined with today's mainstream recognition principle: template matching and feature matching, so that the series of image recognition software to achieve practical and multi-functional purposes.By identifying the same time, the video image will ultimately rendered text message.

Keywords: image processing Character recognition Reformatting Character segmentation

目 录

摘要 I

Abstract II

第一章 绪论 1

1.1课题研究背景意义以胶国内外的发展趋势 1

1.2 主要应用领域 2

1.3开发软件介绍 4

1.4 本文主要设计内容 4

第二章 图像识别基本理论 6

2.1 图像识别技术 6

2.2.图像的预处理 7

2.3文字字符方法方法简介 11

第三章 软件系统结构与功能设计 13

3.1图像识别设计示意图 13

3.2基本方案 13

第四章 软件模块设计 15

4.1 登录模块 15

4.1.1设计步骤 15

4.1.2功能介绍及实现方法: 18

4.2.识别模式选择模块...................................................................................20

4.3图片识别模块 21

4.4图像预处理设计理念 22

第五章 软件调试 27

5.1 登录模块 27

5.2 识别方式模块 29

5.3主功能界面 29

第六章 总结与展望 32

6.1总结 32

6.2展望 32

参考文献 34

致谢 36

附录 图像识别软件所有代码 37

第一章 绪论

1.1课题研究背景意义以及国内外的发展趋势

随着计算机技术、网络技术和多媒体技术的发展与信息需求的不断增长,多媒体信息已
经成为人类信息系统的主要数据来源形式。而在多媒体数据库中视频数据占有很大的比重,数字化视频在各个方面的应用越来越普遍。对其进行系统管理和快速有效的检索人们提出了新的要求。在这样的条件下,由于传统和现有的搜索引擎只能完成基于纯文字的检索任务,使得信息检索面临很大挑战。

传统的视频检索方法是基于文字标示符的方法,即给视频数据编号、加文字或数字标签。在实际生活中,就是使用手工的方法或者借助计算机工具给视频添加一些文字描述或数字标签。当需要检索时,通过查询特定的标签或者关键词来寻找所需要的视频信息。这样一来对视频图像的查询变成了对于标签或关键词的查询。目前大多商用的多媒体视频数据库,例如:视频点播VOD系统,只能提供基于关键词的检索功能。这种检索方法虽然简单,但有几个根本问题影响视频信息的有效使用。首先视频的内容是丰富和复杂的,很难用几个字完全表达,而数字标签对于视频内容是毫无意义的,所以这种方法在查询中常出现各种错误。其次,文字描述是一种特定的抽象,如果描述的标准改变,那么所有的文字标签也要重新制作才能适合新的查询要求。最后,关键词采用人工方式编写,因而带有很大的主观性,无法客观描述视频。而且手工标注的工作量极大,不可能对所有的视频都进行这样的处理。例如,一段新闻视频的某几个镜头是我们需要的内容,往往只能检索到很长的一段录像,再在其中进行传统的快进、快退等手段才能确定我们所需要的信息所在的确切的位置,这样既浪费时间,同时把一些不必要的视频传给用户,造成传输带宽的额外开销。

请支付后下载全文,论文总字数:36295字

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图