登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 文献综述 > 计算机类 > 计算机科学与技术 > 正文

基于生成式对抗网络的文档图像二值化方法研究文献综述

 2020-04-14 20:02:34  

1.目的及意义

文档图像二值化是文档自动识别与分析的关键预处理步骤,其性能优劣直接影响系统的后续操作(如文字提取和识别)的准确度。由于图像受墨迹浸润、页面污迹、背景纹理等退化因素影响,使得低质量文档图像的二值化仍是目前的研究重点和难点。当下用于文档图像二值化的方法也有很多,而相比传统方法来说,GAN是一个比较新的生成模型方法,利用GAN的优势来进行文档图像二值化是一个值得研究的方向。

GAN是一个新的生成模型方法,在2014年由Hinton的博士生lan Goodfellow提出,随后关于GAN的改进型在学术界研究的如火如荼,到目前为止仍有很大的发展空间。GAN启发自博弈论中的二人零和博弈(two-player game),在二人零和博弈中,两位博弈方的利益之和为零或一个常数,即一方有所得,另一方必有所失,GAN模型中的两位博弈方分别由生成式模型(generative model)和判别式模型(discriminative model)充当。生成模型G捕捉样本数据的分布,判别模型是一个二分类器,估计一个样本来自于训练数据(而非生成数据)的概率。G和D一般都是非线性映射函数,例如多层感知机、卷积神经网络等。GAN强大之处在于能自动学习原始真实样本集的数据分布,不管这个分布多么的复杂,只要训练的足够好就可以学出来。传统的机器学习方法,一般会先定义一个模型,再让数据去学习。比如知道原始数据属于高斯分布,但不知道高斯分布的参数,这时定义高斯分布,然后利用数据去学习高斯分布的参数,得到最终的模型。而GAN的生成模型最后可以通过噪声生成一个完整的真实数据。GAN一开始并不知道这个规律是什么样,也就是说GAN是通过一次次训练后学习到的真实样本集的数据分布。

自Goodfellow于2014 年提出GAN 以来,各种基于GAN 的衍生模型被提出,这些模型的创新点包括模型结构改进、理论扩展及应用等。比如, CGAN:CGAN首次提出为GAN增加限制条件,从而增加GAN的准确率;DCGAN:即将深度学习中的卷积神经网络应用到了对抗神经网络中,这个模型为工业界具体使用CNN的对抗生成网络提供了非常完善的解决方案,并且生成的图片效果质量精细,为之后GAN的后续再应用领域的发展奠定了很好的基础,等等。

对于个人而言,研究GAN是一个推动自身开展机器学习的学习、提高自身专业素养的极好方向,该课题有利与自己去加强自身在机器学习领域的学习与研究能力,对于以后在人工智能方向的发展大有补益。

{title}

2. 研究的基本内容与方案

{title}

本毕业设计研究的基本内容是:在基于生成式对抗网络的理论下,选用合适的生成式对抗网络模型框架构建自己比较熟悉的文档图像二值化的方法,配合实现基于生成式对抗网络的文档图像二值化。

本次毕业设计的具体目标是:利用基于生成式对抗网络的文档图像二值化方法实现对含有噪音的彩色图片进行处理,将需要处理的图像转换成预期标准的二值化图以便后续字符识别的目的。

本次毕业设计拟采用的技术方案及措施:

(1)重点加强生成式对抗网络的相关理论知识的学习,理解其中包含的博弈、竞争的对抗思想,熟悉并掌握基础的生成式对抗网络的模型框架,如图1,理解并运用基础的生成式对抗网络的数学理论,如图2。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图