基于生成对抗网络的图像翻译算法的设计与实现开题报告
2020-02-18 19:26:35
1. 研究目的与意义(文献综述)
图像处理,计算机图形学,计算机视觉领域的许多问题都可以视为一张输入图像通过变换得到相应的另一张图像。类似于语言翻译任务,这种自动的将图像的一种表示场景变换到另一种场景的任务被称为图像翻译。传统的算法都是针对特定的应用场景而设计,建立适合特定场景的模型。近年来随着卷积神经网络的成功,其被用来作为图像翻译的模型,但对于具体任务的模型构建,损失函数设计及优化策略大不相同,这大大加重了模型设计的负担。类似于机器翻译中用一个模型来同时完成多种语言翻译任务一样,本次设计的目标是试图通过一个统一的框架来完成所有的图像翻译任务。
同时,现有的图像翻译任务都是基于监督学习的模型,需要大量的成对的训练数据,然而现实中获得这种成对的数据是很困难的,而且成本高昂。这就需要半监督算法来完成图像翻译任务。
图像翻译的想法至少可追溯到hertzmann等人的图像类比法,该算法用一个输入-输出图像对训练一个非参数自回归纹理生成模型,在试阶段可以用该模型来生成输入相对应的输出图像。该算法再图像模糊,图像浮雕,纹理合成,图像超分辨率增强,艺术滤镜等任务上取得不错的效果。最近图像翻译工作都是通过大量输入-输出图像对来训练一个卷积神经网络模型。dong等人提出一个端到端的卷积神经网络回归模型来完成图像超分辨率重建,该模型通过最小化输出和真实标签的欧氏距离来优化模型。但是通过最小化模型预测和真实标签之间的欧氏距离会使模型输出模糊的图像,这是因为最小化欧式距离的输出会取所有可能的输出结果的平均值。所以我们要设计新的损失函数来优化模型。
2. 研究的基本内容与方案
1.1 研究目标
3. 研究计划与安排
第1周:进行开题报告的撰写;
第2周:阅读毕业设计相关论文;
第3周:学习卷积神经网络;
4. 参考文献(12篇以上)
1.王坤峰,苟超,断艳杰等,生成式对抗网络gan的研究进展与展望[j].自动化学报,2017
2.吴华明,刘茜瑞,王耀宏,基于生成对抗网络的人脸图像翻译.天津大学学报,2019
3.夏应策,对偶学习的理论和实验研究.中国科学技术大学,2018