视频语义特征提取技术开题报告
2021-03-08 23:11:04
1. 研究目的与意义(文献综述)
随着计算机网络和存储技术飞速发展,数字图书馆,视频点播网站以及远程教育等平台的出现使得多媒体数据呈现急剧增长的趋势,对于如何在含有丰富的时空信息的视频数据中检索到人们所需要的信息变得日益重要。比如我们在众多的网上视频中想精确地检索到某一场足球比赛中进球的视频,往往得到众多的检索结果,甚至是关于这场比赛的新闻报道,与我们所想看到的仅仅是进球的精彩场面相差甚远。因此在面对多媒体的信息海洋中,如何对这些资源进行分析和检索,有效的利用这些信息成为重要的课题。
对于这一问题的解决需要在语义概念层次对视频内容进行描述和操作,然而现有的检索都是非语义层面的,因为从视频中提取出符合人类思维的语义概念面临着从低层特征到高层语义的“语义鸿沟(semantic gap)”.比如计算机从一幅海边日出的图像中可实现提取颜色、纹理以及形状等信息,而我们需要计算机从中提取出海边,日出等高层语义概念以便实现查找海边日出时检索到该图片。因此如何实现从视频底层特征到高层语义的映射,跨越语义鸿沟成为研究热点。
目前已有许多学者进行了大量尝试。在高层语义视频检索中,r.naphade提出了训练语义概念的步骤:设计语义标注集的界面,建立基于标号样本的语义概念的表示框架,实现基于关键词的查询系统。用于描述各种不同类型的多媒体信息的描述符的标准集合mpeg-7出现为各类多媒体信息提供了标准化的描述。由美国国家标准技术研究所组织的国际影视检索评测(trecvid)已有70多个国家和地区的大学与研究机构参与。trecvid提供了标准数据集,对基于内容的视频检索中的各种算法性能进行评测。国内浙江大学的语义联想支撑基于内容的视频检索系统提取字幕中的文本信息,通过语义联想方法提高检索性能。清华大学研究了tv-fi视频节目管理系统,提供基于关键字、示例的查询,按视频结构或用户自己定义的类别进行浏览。
2. 研究的基本内容与方案
一.基本内容
1. 了解现有的视频检索系统;
2. 了解基于内容的视频检索和相应的系统;
3. 研究计划与安排
1/14-2/22 查阅文献,分析课题任务基本理论和研究现状;
2/23-2/28 阅读文献,完成开题报告;
3/01-3/07 英文文献翻译;
4. 参考文献(12篇以上)
[1] 吴震东. 基于机器学习的人脸识别及汉语语义特征提取研究[d]. 浙江大学, 2015.
[2] 贺莉娜. 贺莉娜. 视频语义特征提取的研究[d]. 北京交通大学, 2008.
[3] 刘颖, 范九伦. 基于内容的图像检索技术综述[j]. 西安邮电大学学报, 2012.