数字图像运动估计和预测的研究与实现毕业论文
2021-08-02 20:56:45
摘 要
数字图像的运动估计和预测在社会的各个领域都表现除了其卓越的地位和作用。特别是在工商业,以及国防、医学等领域都表现出了其作用。近几年,由于块匹配技术拥有的复杂度的计算以及其高压缩效率,大多的视频编码都采用块匹配计术。更是在实际应用中,以及理论研究中,得到了长足的进步与发展,成为了数字图像的研究热点。
数字图像的运动估计和预测的基本思路就是尽量准确地得到序列图像帧间的运动位移,也就是运动矢量。对于运动目标的估计与预测,如果要想预测得越是准确,那么预测出来的图片质量也就越高,残余差也就较小,预测编码所需要的数位也就较少,比特率传输较小,运动目标补偿是用获得的运动目标的矢量,使其在帧与帧之间完成运动目标补偿,运动目标的补偿残差(difference)在历经离散余弦变换、编码量化后的运动补偿残差与运动目标的矢量同时进行熵编码,然后是用比特流形式将其发出。
在数字图像的运动估计和预测中,有两个关键的技术:一个是运动目标估计的技术,一个是运动目标补偿的技术。这两个技术在视频序列时间冗余度的降低以及编码效率的提高有不可忽视的作用。决定了图像编码器的编码效率就是运动估计的精准度,本论文主要研究了全搜索算法以及三步搜索算法和菱形搜索算法,通过几种搜索算法的对比研究,得到了各种搜索算法的优缺点。
关键字:运动目标估计 运动目标预测 全搜索 三步搜索
Abstract
Motion digital images of estimates and projections in all areas of society have shown in addition to its outstanding position and role. Especially in the areas of industry and commerce, as well as defense, medical and so on have shown its role. In recent years, due to the computational complexity of the block matching technique has its high compression efficiency and, most video coding are used a block matching technique count. But in practice, theory and research, has been considerable progress and development, has become a hot topic of digital images.
The basic idea of digital image motion estimation and forecasting is possible to accurately obtain the displacement motion sequence image frames, which is the motion vector. For estimates and projections moving target, if it is to the more accurate prediction, the forecast out of the picture quality, the higher the residual difference also less predictive coding required digits also less than the transmission bit rate small, moving targets compensation vector is obtained by moving target, so that in between frames to complete the moving target compensation, the compensation residual moving targets (difference) in the motion compensation residual after discrete cosine transform coding quantized and vector moving target while entropy coding, then the bit stream in the form of its issue.
In the motion estimation and forecasting digital images, there are two key technologies: a moving target estimation technique, is a moving target compensation technology. Both technologies have a significant role in reducing the coding efficiency and improved video sequence temporal redundancy. It determines the image encoder is coding efficiency of motion estimation accuracy, this thesis, the full search algorithm and three-step search algorithm and diamond search algorithm, through comparative study of several search algorithm to obtain the advantages of various search algorithms shortcomings.
Keywords: motion estimation motion goal target forecast three-step search full search
目录
第一章 绪论 1
1.1 论文研究背景及意义 1
1.2 研究现状 2
1.3 本文的主要内容以及结构安排 2
第二章 数字图像运动估计原理综述 3
2.1 数字图像预处理 3
2.2 数字图像运动目标估计原理 3
2.3 本章小结 4
第三章 数字图像运动估计算法介绍 5
3.1 全搜索算法(Full Search Method,FS)分析 5
3.2 三步搜索法(TSS,Three-Step Search) 6
3.3 新三步搜索算法 7
3.4 四步搜索算法 9
3.5 钻石形搜索算法 10
3.6 本章小结 11
第四章 仿真结果分析 13
4.1 全搜索算法的仿真 13
4.2 三步搜索算法的仿真 17
4.4 本章小结 20
第五章 总结与展望 21
1 总结 21
2 展望 21
参考文献 23
致谢 24
第一章 绪论
1.1 论文研究背景及意义
随着信社会的不断发展以及信息时代的到来。我们对信息数据的需求也是越发的多,我们一直期望不管在哪,不管什么时候都可以快速,准确的通过各种方式进行通信以及数据传输,其中的关于视觉的信息(包括图像及视频)可以使我们直接的感受信息。其中图像和视频的传输便是非常重要的[1]。多媒体的应用之说以能够成为一个研究热点,与数字信号以及网络技术的高速发展不可分割。在这里面,把电视机技术、计算技术以及通信传输技术合并起来的技术是最重要的,这便是运用到了视频的处理技术以及视频传输技术。[2]而关于视频的技术在各个通信行业,计算机行业中有了大量的应用,已经是生活中必不可少的一个东西。
视频所需要的数据传输量是很大的,如果不通过视频压缩传输,那么数字视频所拥有的本身的数据量以及传输造成的大量带宽占用,就会使得数字视频变的鸡肋,而且数字视频与数字图像的大量数据里面的数据拥有大量相关性,有着大量的重复信息,故而,我们可以通过消除重复的信息的来实现数字视频的压缩[3]。这些多余的信息各种的形式,主要的亢余有:时间、结构、空间等形式的亢余,因此,数字数字视频和数字图像的压缩方法就是通过消除亢余,来实现用较少的数据量来表示信息。
数字图像运动目标估计和预测的本质是对序列图像进行分析研究,找出图像中的运动目标并进行目标估计和预测,其中的运动目标估计和预测作为监控中的核心技术,向来都是模式辨别方向、图像处理的关键课题,同时也是一个重要的环节连接了关于目标的描述以及目标行为处理[4]。
数字图像的运动目标估计的结果主要是表现在数字图像本身的图形质量以及数字图像压缩的编码效率。还有最后一个的便是图像的搜索速度。其原理便是使用数字图像块序列中帧与帧之间所拥有的时间关系来组建数字图像序列帧间上的关系,使时间重复率降低最后使得图像压缩码率。对于实际的应用来说,调高运动目标估计速度便是重中之重,所以运动目标估计的重点便是要提高运动目标估计速度,而要提高运动目标估计算法的效率主要是要确定最优的搜索起点和确定较优的块匹配方法以及对于目标运动的搜索方式[5]。
数字图像运动目标估计方法是:估计,补偿,预测。即对运动目标的位移进行估计,获得运动矢量,对前一幅图像进行补偿,最后就可以让预测图像更家与本帧相似。所以,运动估计重点便是运动矢量的获得,运动矢量估计的越准确,那么相应的预测误差越小以及压缩编码效率的压缩比越大[6]。由于数字图像运动目标估计的这些特点可以明显的减少较时间相关性,其已经是被大量的用于各种数字视频以及数字图像的压缩编码里面,已经是数字视频以及数字图像实现的重要技术[7]。
1.2 研究现状
关于数字图像运动目标估计与预测问题的研究在技术上涉及到很多关键问题。数字图像由于其在模式辨别以及智能化监控等领域的较高研究价值,引起了大量学者的广泛关注:目前,国外已经是推出了部分公司自主研发的智能化监控产品,在国内,智能监控技术则是起步比较慢,但还是有一些科研单位以及公司在努力追赶[8]。