基于视觉词典模型的图像搜索算法设计与实现开题报告
2022-01-04 21:01:09
全文总字数:2160字
1. 研究目的与意义及国内外研究现状
随着互联网的普及,多媒体信息在人们的日常生活中成为不可或缺的一部分,而多媒体信息获取则是一项用户对互联网的基本需求,而图像检索是其中的重要部分。图像检索以各类静态或动态的图形图像文件为检索对象,依托互联网庞大的潜在图片资源,为用户提供相关图形图像资料的检索查询服务。这种服务主要由专门的图像搜索引擎实现,基本使用方式有根据图片名称或内容相似的关键字来进行检索,通过上传相似图片或图片url进行搜索等。
而bow(bag of words)模型,即词袋模型,在包括图像搜索在内的多媒体信息检索中有重要的意义与地位,在基于内容的图像检索方式中有广泛的涉及。了解基于该模型的图像搜索算法实现过程,对于认识网络多媒体信息平台的有着重要的意义,这种搜索模型的应用必然不仅限于图像,在音视频、文档、文件资源的搜索中,bow模型的思想都有其参考意义。
国内外研究现状
现今图像搜索已经广泛应用于大众的日常生活中,为我们的工作生活提供了丰富与便利。国内外都出现了一些较为成熟的图像搜索引擎,如国内的百度识图,国外的tineye、谷歌识图等。但这些引擎以其强大的能力为我们提供快捷有效图像检索的同时,也各自有自身的不足。
2. 研究的基本内容
本课题的主要目标是实现一个基于视觉词典模型的图像搜索算法 。现今BOW模型广泛应用于图像搜索方案中,也是较为成熟的图像搜索基础模型。BOW图像检索的主要步骤包括特征提取、构建字典、字典表示、字典检索,个人认为这种模式类似于人在查阅字词时与字典间的互动过程。
我将分析这四个步骤的工作过程,在算法中具体实现这四个步骤,并争取进行实际测试,并对实现的算法予以改进。我所期待的是在经过各部分的细致剖析后,能对该图像搜索模型有整体的认识与思考,并在可能的范围内对算法中的某些部分进行优化,因为该模型只是图像搜索的一个基础理论框架,而算法的效用则需要在实际测试中不断改进,而对理论模型的认识也许会逐渐深入。3. 实施方案、进度安排及预期效果
2017.02.20-2017.03.05查阅资料,了解国内外关于bow模型图像检索的研究进展,建立对其的初步认识。
2017.03.06-2017.03.20对算法设计方案的探讨,参与导师答疑,建立算法的流程与模块设计。
2017.03.21-2017.04.10实现算法的各个功能模块,完成整体算法的实现,并经初步运行所得结果,对其加以修缮与调整。
4. 参考文献
(1)向友君,谢胜利. 图像检索技术综述. 重庆邮电学院学报(自然科学版).2006-06
(2)王莹.基于bow模型的图像分类方法研究.哈尔滨工程大学.2012
(3)刘程. 基于词袋模型的图像分类技术研究.安徽大学.2014