指定视频定时间定区域物体运动状态计算方法研究开题报告
2022-01-07 22:20:32
全文总字数:2265字
1. 研究目的与意义及国内外研究现状
近年来,随着移动互联网和社交网络媒体等技术的飞速发展,互联网中每天产生数以亿计的图片、视频等多媒体数据。在移动互联网时代,人们可以随时随地拍摄各种各样的图片和视频,并在网络上与朋友分享,由此带来的是网络上数字图片和视频的爆炸式增长。目前,社交网络互联网平台facebook每天上传的图片有数亿张,微博和微信等移动互联网应用中每天上传的图片和短视频也数以亿计。相似图片和视频的检索技术是工业界许多实际应用系统中的核心技术,相关的研究受到广泛的关注。
图像检索技术的核心在于根据用户提供的信息从图像数据库中找到符合用户需求的图片,这项技术的研究从20世纪70年代就已经开始,并且至今一直都是计算机领域的一个研究热点。在图片搜索引擎(google、百度、bing、yandex)中通过图片检索技术在海量的互联网图片中检索出查询图片相似的图片。电子商务网站的应用中,需要在大量商品中找出满足要求的商品,通过手机拍照等方式输入查询图片,以实现购物导航,通过以图搜图的购物搜索技术在多个主要应用(amazon购物搜索、百度识图、淘淘搜)中被广泛应用。
本文是根据短视频进行检索工作,将视频中出现的对象进行运动轨迹的统计。对于现实生活中以大量短视频风靡时代的检索工作,提供了一种新的检索方法。
2. 研究的基本内容
随着大数据技术的发展,近年来深度学习的相关技术也被应用于大规模图像哈希算法中。Xia等人设计了基于深度神经网络的两阶段哈希编码学习框架,并在框架提出了具体的哈希算法CNNH,通过首先构造训练集的哈希编码,再通过深度神经网络训练模型的方式,得到图像检索的哈希函数,Liu等人具体实现了该哈希算法框架并公开了源代码1)。
现有的图像检索技术是在建立已有的大量图片库进行检验图像检索的效率,而本文将采用现实中的一段视频,将视频导出图像后,进行区域的划分,进而统计指定区域、指定时间内对象运动的轨迹。
3. 实施方案、进度安排及预期效果
拟定方案如下:
通过以下步骤完成统计:
4. 参考文献
1)http://www.cs.toronto.edu/~kriz/cifar.html
[1] 龚震霆;陈光喜;任夏荔;曹建收。基于卷积神经网络和哈希编码的图像检索方法[j],智能系统学报 , 2016,(03)
[2] 邱芹军;谭家政;蔡大伟;刘勇. 基于多特征融合的图像检索方法[j], 三峡大学学报(自然科学版), 2014,0(1)