登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 电子信息类 > 通信工程 > 正文

基于生成对抗网络的图像去模糊算法研究毕业论文

 2021-11-07 21:17:01  

摘 要

现实生活中,由于拍摄技术或者设备原因,捕捉到的图片容易出现模糊的情况。本文研究一种深度学习方案,利用神经网络搭建生成器和判别器,采用端到端的方式,将模糊图像作为生成器的输入,最后生成清晰图像,判别器用于计算生成清晰图像和原始清晰图像之间的差异。该方案可以避免传统的图像去模糊算法中,估计模糊核所带来的一系列问题,利用生成对抗网络的思想来训练模型,有效还原模糊图像的部分细节纹理。

本文首先利用图像数据集来完成此去模糊模型的训练,然后通过筛选好的模糊-清晰图像对来进行模型的测试,证明此方案取得了一定的成效。

关键字:去模糊;生成对抗网络;深度学习

Abstract

In real life, due to the technology or equipment of photography, the captured pictures are easy to be blurred. This paper studies a deep learning scheme, using neural networks to build generators and discriminators, described as an end-to-end approach, choosing the blurred image as the input of the generator, and finally generates a clear image. The discriminator is designed to calculate the difference between the generated picture and original clear image. This scheme can avoid a series of problems caused by the estimation of the kernel of the blur in the traditional image deblurring algorithm, using the idea of generative adversarial network to train the model, and effectively restore the partial detail texture of the blurred image.

This paper uses the data set of the pictures to train the deblurring model, and then tests the trained model through the filtered blur-clear images, proving that the scheme has achieved certain grades.

Key words:deblur;generative adversarial network;deep learning

目 录

第1章 绪论 1

1.1 研究背景 1

1.2 研究内容及意义 2

第2章 相关概念 3

2.1 机器学习 3

2.1.1 机器学习简介 3

2.1.2 机器学习流程 4

2.1.3 机器学习算法 4

2.2 神经网络 7

2.2.1 神经元结构 7

2.2.2 感知器模型 8

2.3 深度学习 9

2.3.1 正则化 9

2.3.2 激活函数 11

2.3.3 代价函数 12

2.3.4 批归一化 12

2.4 运动图像模糊模型 13

2.5 生成对抗网络 13

2.5.1 GAN 13

2.5.2 GAN的改进版本 14

第3章 算法实现 16

3.1 算法原理 17

3.1.1 代价函数 17

3.1.2 网络架构 17

3.2 模型的训练与测试 18

第4章 结论 20

参考文献 21

致 谢 23

第1章 绪论

交通运输、医学仪器成像、摄影行业、目标检测、追踪与识别、天文勘探等诸多领域当中,捕获图像时常有出现模糊的情况,焦距、相机抖动、目标物体的运动等因素都会造成图像产生模糊[1]

1.1 研究背景

在摄影过程中,设备的局限性,环境的复杂性,以及目标物体经常处在运动当中,拍摄仪器与目标物体之间,通常难以维持相对静止的运动状态,这些因素都会导致获取图像存在分辨率降低、失真以及强噪声等退化现象,而图像模糊是一种典型的图像退化形式。

计算机视觉领域当中,一个亟待解决的问题就是图像的去模糊。计算机视觉,就是让生成图像的设备像生物的视觉感官那样工作,通过编写程序实现对信息的处理,使得计算机能够像人类一样处理环境[2]。目前科技水平能够实现的简单的智能视觉任务主要有,拍摄目标的检测,行为的识别,捕捉图像的匹配以及将识别的图像进行分类[2]

以机器生成图像为例,如果人眼无法分辨一张图片是现实场景中拍摄的,还是机器利用程序生成的,那么就可以断定机器成功地从现实生活中学到了一些东西[3]

生成对抗网络(Generative Adversarial Networks, GAN)是Goodfellow等人[4]提出的一种生成模型。所谓生成模型,是指能够根据给定的某些参数,输入的随机样本,随机生成拟合数据的模型,形成我们所期望的联合概率分布。生成模型产生的数据,有可能服从确知的分布函数,也有可能是模糊的分布函数。

GAN解决的问题是如何从输入的随机样本中学习生成出新样本,GAN模型不需要标签作为输入,也不需要人工根据结果的好坏对参数进行调整,而是采用端到端(End-to-End),从输入直接到输出,中间利用该模型内网络互相博弈的特征,进行网络的自主学习,不需要手动进行特征的提取,不需要人工干预[5]

传统的图像去模糊算法,使用的是泛用的退化模型,通常是先计算出模糊核,然后利用边缘预测、正则化等方法,把模糊核与模糊图像作二次卷积,得到清晰图像[6]。图像复原可分为两种方式,分别是盲图像复原和非盲图像复原。现实生活中,拍摄设备运动轨迹难以预测,目标物体的运动规律不可控,因而缺乏先验信息,与非盲图像复原相比,盲图像复原具有更高的难度。

近年来,许多基于深度学习的图像去模糊算法,都是先估计出模糊核,假设退化模型已知。文献[7]提出卷积神经网络(Convolutional Neural Networks, CNN),引入了中间图像的概念,基于图像之间的卷积运算,得到模糊图像的全局模糊核;Levin[8]等人认为只有均匀模糊的过程才会导致全局一致的模糊核。Xu[9]等人从模糊图像中提取出不同的模糊核,用深度学习的方法对其进行分解并训练,最后复原出清晰图像。Schuler[10]等人提出盲图像复原,通过迭代,用粗糙到精细(Coarse-to-Fine)法,优化传统图像解卷积能量的方法,估计模糊核,得出清晰图像,并将两者合成的图像对作为数据集。Sun[11]等人则训练CNN作为解决机器学习中的分类问题的模型,然后将其引申到模糊核的处理中,优化马尔可夫随机场模型,将处理后的模糊核进行二次卷积,得到清晰图像。

振铃现象[12],图像噪声,图像处理的时效性,设计成本等因素,使得传统去模糊方法效率低下,计算一个合适的模糊核通常比较困难,而模糊核的准确性,往往决定着图像复原质量的高低。

1.2 研究内容及意义

为了避免估计模糊核所存在的一系列问题,近年来,有研究人员提出了基于GAN的图像去模糊网络,利用神经网络搭建生成器和判别器,采用端到端的方式,将模糊图像作为生成器的输入,最后生成清晰图像,判别器用于计算生成清晰图像和原始清晰图像之间的差异。文献[13]提出DeblurGAN,它类似于一个补全图像和超像素的应用实例,可处理运动图像产生的模糊。使用生成对抗网络的思想,训练生成器来接收图像噪声,产生生成的清晰图片,训练判别器,把已训练好的VGG-19模型,作为判别器中估算原始清晰图片和生成清晰图片之间差异的部分,其目标函数中包含两个函数,一是感知损失(perceptual loss),一是对抗损失(Wasserstein GAN loss),这样处理后得到的图像更加清晰。

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图