自然场景中的文字检测开题报告
2020-04-11 17:49:16
1. 研究目的与意义(文献综述)
随着计算机技术、人工智能和思维科学研究的迅速发展,图像处理技术日益向更深层次拓展,人们开始研究如何利用计算机系统来模拟人类视觉系统,按照人类视觉认知过程来解析图像和理解外部世界。自然场景图像中的文字包含了很多重要的语义信息,如路牌上的街道名字,商店招牌上的店名、广告牌上的文字、产品包装上的文字等,这些文本字符对场景视觉信息的表达具有重要价值,是描述和理解场景内容的关键线索。因此,将场景图像中的文字抽取出来,有利于场景图像的内容分析、检索,可以广泛应用于机器人视觉和盲人导航等领域,而文本检测与定位用于确定场景图像中的文本区域,是进行精确文本抽取的前提,具有重大的理论意义和广泛的应用前景。
文本检测与定位的任务是发现场景图像中文本的位置并进行精确的定位和分割出来,在国内外,现有文本检测与定位的方法大致可以分为四类:基于连通域的方法、基于边缘检测的方法、基于纹理的方法和复合方法,下面分别介绍这四类方法的代表算法。
2. 研究的基本内容与方案
(1)研究目标
本方案利用文本的特性:在一个场景中文本的笔画宽度几乎恒定不变(我们允许缓慢的有界变换)的特点用来进行文本检测。这种方法没有提取分离每个像素特征如颜色,梯度等,而是提出像素组的特征。能够适应自然场景的特殊性,检测与识别文本。
3. 研究计划与安排
第 1-3 周:查阅相关文献资料,明确研究内容,确定方案,完成开题报告。
第 4 周:学习swt算法,canny边缘检测,连通域滤除等相关知识。
4. 参考文献(12篇以上)
[1]mariano v y, kasturi r. locating uniform-colored text in videoframes[c]//proceedings of 15th international conference on pattern recognition.barcelona : ieee,2000:539-542.
[2]蒋人杰,戚飞虎,徐 立等 基于连通分量特征的文本检测与分割[j].中国图像图形学报,2006,11(11):1653-1656.
[3]epshtein b, ofek e, wexler y. detecting text in natural scenes with strokewidth transform[c]//proceedings of ieee international conference on computer vision and pattern recognition.san francisco: ieee,2010:2963-2970.