基于图像聚类与挖掘的视频摘要生成毕业论文
2021-03-30 20:16:15
摘 要
学院(系): 信息工程学院
专业班级: 电子信息工程1302班
学生姓名: 李思齐
指导教师: 黄朝兵
学位论文原创性声明
本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包括任何其他个人或集体已经发表或撰写的成果作品。本人完全意识到本声明的法律后果由本人承担。
作者签名:
年 月 日
学位论文版权使用授权书
本学位论文作者完全了解学校有关保障、使用学位论文的规定,同意学校保留并向有关学位论文管理部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权省级优秀学士论文评选机构将本学位论文的全部或部分内容编入有关数据进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。
本学位论文属于1、保密囗,在 年解密后适用本授权书
2、不保密囗 。
(请在以上相应方框内打“√”)
(宋体小四号)
作者签名: 年 月 日
导师签名: 年 月 日
(注:此页内容装订在论文扉页)
摘 要
21世纪的到来使信息化产业迅速发展,同时也带来了互联网和多媒体行业的蓬勃发展,数字视频已越来越频繁地进入公众视野,在网络视频数量爆炸式增长的同时,我们也越来越关注一个问题,我们如何准确高效地在瀚如烟海的视频数据库中找到我们感兴趣的视频呢?随着关注度的不断上升,越来越多的专家和学者开始从事这方面的研究,也终于取得了可喜的进步,人们从时长长、数据量大的完整视频中提取出时长短但能体现原始视频大意的视频摘要来呈现给用户,以使他们快速找到自己想要的视频。
本文便是基于这一目的,先了解视频结构,再在此基础之上对测试视频进行结构化分析,检测出其镜头边界之后,从单个镜头中提取出镜头关键帧并对这些关键帧进行图像聚类[1]。视频经过结构化处理之后可以大大减少其数据量,但也保留了原始视频所要表达的含义。最后再以幻灯片的形式呈现给用户,以达到他们快速浏览视频的目的。
研究结果表明,我所采取的方法能够大致满足要求,即既减小视频数据量同时保留原始视频大意,如此便可以帮助用户快速浏览以找到他们需要的视频。
关键词:视频摘要;镜头边界;关键帧;图像聚类
Abstract
With the rapid development of Internet and multimedia technology, the application of digital video in daily life has become more and more popular. As the number of online video increases, we are paying more and more attention to one problem. How can we accurately and efficiently to find the videos we are interested in? In recent years, more and more people began to engage in this research, and finally made gratifying progress, people extracted shorter video summary from the original video,which can reflect the meaning of the original video.then present the summary to the user so that they can find the video they want quickly.
From the purpose,this paper based on the structure of the video ,analysing the structure of the testing video.After detecting the shot boundary,we can extract key frames from a single lens and then clustering these key frames. Through this method, can greatly reduce the amount of video data, but also retain the meaning of the original video , and finally presented to the user in the form of slides to achieve their fast browsing video purposes.
The results show that the approach I have taken can meet the requirements, that is, both to reduce the amount of video data while retaining the meaning of the original video, so that users can quickly browse video and find the video they need.
Key Words:video summary;shot boundary;key frame;image clustering
目 录
摘 要 I
Abstract II
第1章 绪论 1
1.1 研究目的及意义 1
1.2 国内外研究现状 1
1.3 论文研究内容及组织结构 2
第2章 基于图像聚类挖掘的视频摘要生成概述 3
2.1 视频摘要概述 3
2.1.1 视频结构化分析 4
2.1.2 视频摘要表现形式 5
2.2 视频摘要的聚类挖掘方法 6
第3章 镜头边界检测概述 8
3.1 关于镜头的基本概念 8
3.1.1 镜头边界检测的概念及意义 8
3.1.2 镜头分类 8
3.2 镜头分割算法概述 9
3.2.1 传统的突变镜头检测方法 9
3.2.2 渐变镜头检测算法 12
3.3 阈值选择 14
第4章 关键帧的提取方法 16
4.1 关于关键帧的基本知识 16
4.1.1 什么是关键帧 16
4.1.2 提取关键帧的意义 16
4.2 关键帧的提取 16
4.2.1 提取关键帧的基本原则 16
4.2.2 提取关键帧的常用方法 17
4.3 K-means聚类算法 17
第5章 视频摘要生成 20
5.1 镜头边界检测 20
5.2 图像特征提取 21
5.3 关键帧提取 22
5.4 成果展示与对比分析 22
5.5 总结与展望 25
参考文献 27
致 谢 28
第1章 绪论
1.1 研究目的及意义