基于深度学习的细粒度图像检索开题报告
2020-02-20 09:58:59
1. 研究目的与意义(文献综述)
1.1选题目的及意义
计算机视觉是计算机学科的一个重要研究领域,是研究如何赋予计算机“看”的能力从而理解真实世界的人工智能学科分支。近些年,特别是在深度学习技术的推动下,计算机视觉领域发展迅猛。google、百度等大型互联网公司在该领域有重要布局和谋划。计算机视觉领域内重要的研究课题如图像识别(image recognition)、图像检索(image retrieval)、图像语义分割(image semantic segmentation)、人脸识别(face recognition)、动作识别(action recognition)等等。其中,图像检索是计算机视觉中最为基础的研究课题,其在电子商务、版权保护、公共安全等领域具有十分广阔的应用前景。版权保护方面,公司可以通过图像检索,检测自然场景中是否存在不正当或未授权使用其 logo 的侵权情况;公共安全方面,司法部门可以通过在监控摄像头拍摄的画面中查找相似的车辆或行人等;电子商务领域中,比如阿里巴巴的拍立淘允许用户上传想要购买的商品照片,服务器通过图像检索为用户找到相同或相似的商品,使得购物更加便捷。
随着计算机技术以及互联网技术的快速发展,人们对信息获取的要求越来越高,希望得到具有针对性和定制化的内容服务。例如:在进行图像检索时希望能根据不同的属性进行检索、在对图像分类的时候,不仅希望知道对象所属的类别,还希望知道它的具体品种或型号。细粒度图像分析技术为这种需求提供了可能的解决方案。另外,在生物研究与生物多样性保护中,利用细粒度分析技术可以实现物种鉴别,帮助科学家节约资源和时间,同时也可以降低该领域的门槛,促进科学研究的发展。
2. 研究的基本内容与方案
2.1研究的基本内容
不同于通用的图像分析任务,细粒度图像分析的所属类别和粒度更为精细,它需要能在更细分的类别下对物体进行识别。细粒度图像检索是2015年首次提出的概念,其采用以图搜图的形式。例如,给定一张“绿头鸭”的图像,则需要将同为“绿头鸭”的图像从众多不同类鸟类图像中检索出来;类似地,需要将“劳斯莱斯幻影”从包括劳斯莱斯其他车型的不同品牌不同车型的众多图像中检索出来。细粒度图像检索的难点,一是图像粒度非常细微;二是对细粒度图像而言,哪怕是属于同一子类的图像本身也具有形态、姿势、颜色、背景等巨大差异。可以说,细粒度图像检索是图像检索领域和细粒度图像分析领域的一项具有新鲜生命力的研究课题。近年来随着深度学习的快速发展,深度卷积层所提取的高水平特征相比于传统的全连接层,对图像中的目标物体具有更高质量的定位能力。本课题借鉴卷积层的特征实现对图像目标的无监督定位,并提取高质量的检索向量,用于细粒度图像检索。
1)、图像分类和检索的基础知识;
3. 研究计划与安排
1-3周:查阅文献,完成开题报告
4-6周:总体设计,完成论文综述
4. 参考文献(12篇以上)
[1] krizhevskya , sutskever i , hinton g . imagenet classification with deep convolutionalneural networks[j]. advances in neural information processing systems, 2012.