基于Web的图像搜索技术的研究开题报告
2020-04-08 13:20:26
1. 研究目的与意义(文献综述)
当今社会,随着计算机技术和网络技术的不断提升,网络上的图像数量正在呈几何倍数增加,人们对于图像处理的需求也日益增加,当今社会的人们,已经不仅仅满足于文字交流,用图像传递信息成为了更加主流的沟通方式,图像能以更加直观的方式传递信息,加上现如今便携图像获取设备日益普及,如何从大量图像信息中筛选出可利用的信息成为了人们迫切需要解决的问题。
图像是人类视觉的基础,是人类认识世界和人类本身的重要源泉。从20世纪70年代开始,有关图像检索的研究就已开始,当时主要是基于文本的图像检索技术(text-based image retrieval,简称tbir),利用文本描述的方式描述图像的特征,如绘画作品的作者、年代、流派、尺寸等。在图像资源规模较小的初期,这种检索方法因检索方式简单,查询效果较好而得到用户的赞赏,但是人工标注有太强的主观性,而且随着图片规模的不断增长,人工标注的工作量变得难以接受,因此这种技术在大规模图像检索应用中存在着较大的局限性,到90年代以后,为了客服人工标注效率底以及主观性强等特点,出现了对图像的内容语义,如图像的颜色、纹理、布局等进行分析和检索的图像检索技术,即基于内容的图像检索(content-based image retrieval,简称cbir)技术。然而图像的语义丰富,其语义层次由低到高可分为:特征语义、对象语义、空间关系语义、场景语义、行为语义及情感语义,由底层语义特征映射到上层语义特征的过程中存在着难以解决的语义鸿沟的问题。因此这种技术目前只应用于一些底层语义与高层语义具有强对应关系的图像检索中。如指纹识别、商标检索等。基于内容的图像检索技术模拟人类识别图像语义的过程还存在许多未解决的研究课题,其实现的复杂度及成本都相当高。
图像检索的发展是一个从简单到复杂、从低级到高级的过程,从最初的文本信息查询发展到基于内容的图像检索。同时随着人们对图像理解、图像识别研究的不断深入,提出了基于图像语义的检索,充分利用了图像的语义信息, 提高了图像检索系统的能力。另外,为了解决语义鸿沟的问题,人们提出了基于反馈的信息检索技术,利用人机交互行为,改进系统的能力,提高检索结果的准确性。随着多媒体数据压缩技术和互联网的迅速发展,信息的形式多种多样,将信息检索技术推向实用化, 也是信息技术发展的主要目标。
2. 研究的基本内容与方案
web图像检索包括基于文本的图像检tbir、基于内容的图像cbi和融合文本、图像信息的图像检索 abir。由于abir 可以综合 tbir 和 cbir 的优势,提升图像检索质量,因而成为目前研究的热点。
基于web的图像检索主要包括以下几个方面:
(1)词汇相似度计算:词汇相似度计算主要用于计算图像自动标注关键词之间的内聚性和计算自动标注关键词与图像文本、web文本关键词之间的一致性。词汇相似度包括语义相似度和分布相似度。语义相似度是指词汇相互替换后,不改变原来句子在上下文中的句法语义结构的程度。分布相似度是指两个词语经常出现在同一上下文环境中。
3. 研究计划与安排
第1周—第4周 搜集资料,撰写开题报告;
第5周—第6周 论文开题;
第7周—第12周 撰写论文初稿;
第13周—第16周 修改论文;
第17周 论文答辩。
4. 参考文献(12篇以上)
[1]车莉平. 融合文本和语义的web图像检索[d].西北大学,2014.
[2]吴瑕. 个性化web图像检索关键技术研究[d].东北林业大学,2012.
[3]黄治虎. 基于网页信息和图像特征的web图像检索研究[d].重庆大学,2015.
[4]ning zhou,jianping fan.automatic image–text alignment for large-scale web image indexing and retrieval[j]. pattern recognition,2015,48(1).
[5]段立娟,高文,林守勋,马继涌. 图像检索中的动态相似性度量方法[j]. 计算机学报. 2001.