基于深度学习的空间变换网络模型研究任务书
2020-03-26 14:50:00
1. 毕业设计(论文)主要内容:
目前,图像识别技术已广泛应用于多个领域,如生物医学、卫星遥感、机器人视觉等。随着技术的发展,出现了一种基于深度学习的目标识别方法,大大提高了图像识别的准确度和识别效率,但是图像信息的扭曲变形制约了图像识别的进一步发展。本课题主要进行的是基于深度学习的空间变换网络的模型研究。该模型的构建主要基于深度学习的理念,深度学习是机器学习中一种基于对数据进行表征学习的方法。深度学习以数据的原始形态作为算法输入,经过算法层层抽象将原始数据逐层抽象为自身任务所需的最终特征表示,最后以特征到任务目标的映射作为结束,从原始数据到最终任务目标,“一气呵成”并无夹杂任何人为操作。本课题研究的基于深度学习的空间变换网络是将空间变换网络嵌入到深度学习网络(主要是卷积神经网络)中,然后通过模型训练得到合适的模型参数,最后完成整个模型的调试,使之能够自动的进行图像矫正变换并得到对应的标签信息。
2. 毕业设计(论文)主要任务及要求
(1)查阅相关文献资料15篇以上(其中近5年外文文献不少于3篇),了解本研究领域的基本理论、关键技术与研究现状。
(2)完成开题报告。
(3)搭建空间变换网络模型,并基于多个不同数据集进行模型训练; 对基于已有的图像数据集进行模型准确率检测。
3. 毕业设计(论文)完成任务的计划与安排
1、第1-3周:查阅相关文献资料,明确研究内容,学习毕业设计研究内容所需理论的基础。确定毕业设计方案,完成开题报告。
2、第4-5周:熟悉掌握基本理论,完成英文资料的翻译,熟悉开发环境。
3、第6-9周:编程实现各算法,并进行模型搭建。
4. 主要参考文献
1. max jaderberg, karen simonyan, andrew zisserman, koray kavukcuoglu: spatial transformer networks. 2015 advances in neural information processing systems.
2. shuxuan guo, li liu, wei wang, songyang lao, liang wang: an attention model based on spatial transformers for scene recognition.2016 23rd international conference on pattern recognition(icpr).
3. feng zhu, hongsheng li, wanli ouyang, nenghai yu, xionggang wang: learning spatial regularization with image-level supervisions for multi-label image classification. arxiv preprint arxiv: 1702.05891v2, 2017.