视频分割及关键帧提取算法设计及实现毕业论文
2022-02-06 18:53:48
论文总字数:27429字
摘 要
视频镜头的分割是指将一整段视频进行分割成每一帧图像的形式,关键帧提取算法是一种将视频镜头内容以图像的形式提取出来的技术。当代社会俨然是一个信息量爆炸的时代,快节奏的生活方式充斥着社会的每一个角落,人们没有足够的时间去从带有大量无效的信息中去挑选有效信息。通过将视频镜头的关键内容提取出来,可以快速的查阅视频内容以节约人们的阅读时间,从而快速的了解整个视频的核心内容及表达的意义。
针对视频镜头的分割问题,本文采用两种算法:基于帧差的关键帧提取算法和基于聚类的关键帧提取算法。基于帧差的关键帧提取是将视频先进行分割成每一帧图像的形式,再用算法将视频里带有重要内容的图像单个提取出来以达到快速阅读的效果,核心内容分成两步进行,首先要进行分割视频成图像的基础步骤,然后才能在此基础上对图像进行关键信息的提取。本文针对源文件test1.avi前11秒的视频流进行了基于帧差算法的关键帧提取,得到了8张关键帧图像。基于聚类算法的关键帧提取与之有所不同,聚类算法是以整个视频为研究对象,结合视频的内容、底纹、场景等,将视频分成若干个种类,再对每一个种类进行关键内容的提取,整个过程一气呵成,无需分为两个步骤进行。本文针对整个源文件test1.avi视频进行了基于聚类算法的关键帧提取,得到了40张关键帧图像。
关键词:视频镜头 算法设计 自适应 阈值
Video Shot Segmentation Algorithm Design and Implementation
Abstract
The division of the video shot refers to the division of an entire video into each frame of the image. The key frame extraction algorithm is a technique for extracting the video shot content in the form of an image. The contemporary society has suddenly become an age of explosion of information. The fast-paced lifestyle is full of every corner of the society. People do not have enough time to pick effective information from a large amount of invalid information. By extracting the key content of the video shot, the video content can be quickly accessed to save people's reading time, so as to quickly understand the core content of the entire video and the meaning of the expression.
For the problem of video camera segmentation, this paper uses two algorithms: frame-based key frame extraction algorithm and cluster-based key frame extraction algorithm. The keyframe extraction based on frame difference is to split the video into the format of each frame first. Then the algorithm extracts the image with the important content in the video to achieve fast reading effect. The core content is divided into two steps. To perform the basic steps of dividing the video into images, the key information can then be extracted from the image. In this paper, the key frame extraction based on the frame difference algorithm is performed for the video stream of the first 11 seconds of the source file test1.avi, and 8 key frame images are obtained. The key frame extraction based on clustering algorithm is different from it. The clustering algorithm takes the entire video as the research object, combines the content, shading, and scene of the video, divides the video into several types, and then carries out the key for each type. Content extraction, the entire process in one go, without the need to divide into two steps. In this paper, the extraction of key frames based on clustering algorithm is performed for the source file test1.avi, and 40 keyframe images are obtained.
Key Words:Video shot ; Algorithm design ; Adaptive ; Threshold
目 录
摘 要 I
Abstract II
第一章 论文概述 1
1.1视频分割和关键帧算法研究目的及意义 1
1.2视频镜头分割的研究现状 3
1.3关键帧提取的研究现状 5
1.4视频分割和关键帧提取算法的发展趋势 7
第二章 视频分割的典型算法 9
2.1几种基本算法的介绍 9
2.2本文所采取的分割算法 11
2.2.1自适应阈值分割介绍 12
2.2.2自适应分割注意事项 13
第三章 基于帧差自适应阈值的关键帧提取 14
3.1关于帧差欧式距离算法 14
3.2帧差距离算法的基本原理 15
3.3视频镜头分割算法的实现 15
3.4帧差距离算法的实现 17
3.4.1帧差算法的提取步骤 18
3.4.2帧差算法的运行结果 19
第四章 基于聚类自适应阈值的关键帧提取 24
4.1聚类算法的基本原理 24
4.2聚类自适应算法的提取步骤 25
4.3聚类自适应算法的实现 27
4.3.1阈值差异性比较 28
4.3.2聚类算法的运行结果 31
第五章 总结与展望 32
5.1总结 32
5.2展望 33
参考文献 35
附录 38
致谢 46
第一章 论文概述
当代科学技术的不断发展,视频镜头等各种各样的多媒体数据在现实生活中运用得越来越多,范围也是在不断的扩大。从微观的角度来进行分析,视频是由很多个图像按照一套连贯的动作,以每一帧为一个图像进行排列,从而得到如今肉眼所见的视频。从宏观的角度看,视频则是记录物体或人类运动的轨迹、事物发展的时间顺序等等。在感官系统的世界里,视频镜头中所记录的是人们感官功能中视觉的基本信息,也是人们获取外界信息最直观、最真实、最亲切的一种方法。因此,如何以一种快捷方便的方法去获取视频镜头中的有效图像信息就成为亟待解决的一个难题,这也是当代信息时代所研究的一个热门课题。
1.1视频分割和关键帧算法研究目的及意义
众所周知的是,感官世界中视觉是人们感知外界世界的第一手段,也是最基础最重要的方法。此时视频就发挥出了极大的作用,随之而来的是视频镜头在各个领域和行业内变得尤其重要,但凡是学习的学科,都离不开视频镜头带来的应用。随着各学科的不断发展,科学的不断进步,学科门类对于视频镜头的要求也变得越来越高。本文对视频镜头分割算法的设计研究与实现有着十分重要的意义。
请支付后下载全文,论文总字数:27429字