基于深度哈希算法的海量图像检索技术研究开题报告
2020-04-12 09:01:59
1. 研究目的与意义(文献综述)
随着近年来互联网、云计算、物联网、社交媒体以及其他信息技术的迅速发展,各行业产生的数据都呈爆炸式增长趋势[1][5]。其中,图像检索技术作为大规模数据应用的热门领域之一,传统的检索技术已经无法满足当前对大量图像检索的需要。而哈希学习是基于机器学习的方法得到图像的哈希索引,用于支持大规模图像的快速检索,能够有效解决海量图像的检索问题,具有优秀的时间与空间复杂度。因此,具备提高图像的检索效率同时减少储存空间的图像哈希算法受到广泛的关注[4]。
哈希学习由salakhutdinov和hinton于2007年推介到机器学习领域[4],于近几年迅速发展成为机器学习领域和大数据学习领域的一个研究热点,并广泛应用于信息检索、数据挖掘、模式识别、多媒体信息处理、计算机视觉、推荐系统、以及社交网络分析等领域。哈希学习通过机器学习机制将数据映射成二进制串的形式,显著减少了数据的存储和通信开销,从而有效提高学习系统的效率。哈希学习的目的是学到数据的二进制哈希码表示,使得哈希码尽可能地保持原空间中的近邻关系, 即保相似性。主流的哈希算法将传统的基于内容的图像检索系统中提取到的高维特征通过哈希函数生成一个固定长度的二进制编码。采用哈希方法后,一幅图片将由一个固定长度的二进制编码来表示,相似度计算度量可以直接使用海明距离(hammingdistance),计算速度大大提高,从而加快了系统的检索效率。
二进制哈希算法可以分为无监督的哈希算法、半监督的哈希算法和监督的哈希算法[2][3] 。其中,常用的无监督的哈希算法包括lsh算法,sh算法,pca-itq算法等[7]。相反地,监督的哈希算法则需要利用原始数据集的标注信息进行哈希函数的学习。监督的哈希算法包括bre、ksh等。而半监督的哈希算法介于监督哈希算法和无监督哈希算法之间,只需要对原始数据的部分数据进行标注。比较具有代表性的ssh算法。无监督的哈希算法通过无标签的数据训练哈希函数[9],其中,最具有代表性的是使用随机映射构造哈希函数的局部感知哈希,它意在把相似的数据匹配到相近的二进制编码的概率最大化。然而,lsh通常需要使用较长的哈希编码才能达到令人满意的精度[15],这导致了较大的存储空间需求和召回率普遍偏低的问题。谱哈希是另外一个具有代表性的算法,其利用非线性函数沿着数据的主成分分析方向通过设定阈值来产生二进制编码。与无监督哈希算法相比,有监督的哈希算法通常都是数据相关的,即不具备通用性。但有监督哈希算法通常能比无监督的哈希算法学习到一个更为紧凑的编码,并且哈希的效果也比无监督的要好,大量的研究证明,使用监督信息可以提高哈希编码的学习性能。
2. 研究的基本内容与方案
设计内容拟分为三部分,第一部分为综述,主要介绍图像检索、哈希学习、深度学习以及相关方法的研究现状和原理,并分析比较传统方法间的时间和空间效率。
第二部分为程序设计,我尝试将特征提取与哈希函数的学习结合在一起,提出一种基于深度卷积神经网络的快速图像哈希算法。图像检索的有监督哈希方法,最终会输出目标哈希函数和图像特征提取函数。求解目标哈希函数时[4][5],输入的相似性矩阵s被分解为h和h的转置,其中h表示训练集样本的哈希码,针对矩阵h设计了加速的求解优化算法,这一步也是我改进算法的关键。求解图像特征函数的过程中[12],采用了深层卷积神经网络来学习目标哈希函数以及学习一个能够更加准确地描述图像信息的表示特征,网络架构中选择了已训练好的深度卷积神经网络。输出层的构造可以简单地采用之前学习到的哈希码作为目标。在查询时,只需将图片输入到网络中,最后通过获取输出层中节点的值即可获得表达该图像的二进制哈希码。
与现有的哈希算法相比,新的方法将具有以下优点:该方法无需先对图像提取人工特征再进行哈希函数学习,而是直接通过原始图像信息和相似性信息来进行哈希函数的学习;通过运用已经训练的深度神经网络进行迁移学习,可以缩短训练时间,提高哈希函数训练的效率和效果。
3. 研究计划与安排
1-3周:查阅文献,完成开题报告
4-6周:总体设计,完成论文综述
7-10周:设计算法,功能模块设计
4. 参考文献(12篇以上)
[1]wu-jun li, sheng wang, wang-cheng kang. feature learning based deep supervisedhashing with pairwise labels. ijcai 2016: 1711-1717
[2]zhu h, long m, wang j, et al. deep hashing network for efficient similarityretrieval[c]//aaai. 2016: 2415-2421.
[3]erin liong v, lu j, wang g, etal.deep hashing for compact binary codeslearning[c]//proceedings of the ieee conference on computer vision and patternrecognition. 2015: 2475-2483.