定向DCT及其实现开题报告
2020-02-18 19:30:43
1. 研究目的与意义(文献综述)
所谓图像压缩就是在保证一定图像质量和满足任务要求的前提下,减少原始图像数据量的处理过程,图像数据可以被压缩,说明图像数据存在着冗余性。
随着数据化时代的开启,图像压缩技术越来越成熟并且应用越来越广泛。近几年来,随着多媒体技术以及实时通信技术的广泛应用,图像以及视频的传输和存储效率对通信系统实时性以及可靠性的影响日益显著。目前,大多数的图像及视频数据是以压缩形式存放和传输的,如jpeg、mpeg等。而在jpeg和mpeg的编、解码过程中,dct及ddct计算量占编、解码过程的40%。因此,定向dct算法的计算效率对压缩编码算法性能具有较大的影响。本文提出了一种新的dct计算模式,将随机计算理论与蝶形快速dct算法相结合,提高了定向dct算法的计算效率,减少计算能耗。
定向dct变换的全称是定向离散余弦变换(discrete cosine transform),是指将一组光强数据转换成频率数据,以便得知强度变化的情形。本文研究的真正方向性dct变换,这种方法可以根据图像块中最主导的方向边缘信息来选择沿最匹配的方向进行dct变换编码。并且该变换能够完全被限制在每个n*n图像块区域内,可以与当前的图像压缩标准相兼容。相信这对图像压缩编码的发展与完善将会有重要的意义。
2. 研究的基本内容与方案
一.传统DCT
DCT变换利用傅立叶变换的性质。采用图像边界褶翻将像变换为偶函数形式,然后对图像进行二维傅立叶变换,变换后仅包含余弦项,所以称之为离散余弦变换。
DCT编码属于正交变换编码方式,用于去除图像数据的空间冗余。发送者首先将输入图像分解为或块,然后再对每个图像块进行二维DCT变换,接着再对DCT系数进行量化、编码和传输;接收者通过对量化的DCT系数进行解码,并对每个图像块进行的二维DCT反变换。最后将操作完成后所有的块拼接起来构成一幅单一的图像。对于一般的图像而言,大多数DCT系数值都接近于0,所以去掉这些系数不会对重建图像的质量产生较大影响。因此,利用DCT进行图像压缩确实可以节约大量的存储空间。
基于DCT的JPEG图像压缩编码算法原理可用下图表示:
(a)编码器
(b)解码器
图1 DCT算法原理框图
在编码过程中,首先将输入图像颜色空间转换后分解为8×8大小的数据块,然后用正向二维DCT把每个块转变成64个DCT系数值,接下来对DCT系数进行量化,这是整个过程中的主要有损运算,也是图像质量下降的最主要原因。将量化后的系数进行“Z”字形编排,能够更大程度地进行压缩。最后将变换得到的量化的DCT系数进行编码和传送,这样就完成了图像的压缩过程。
在解码过程中,形成压缩后的图像格式,先对已编码的量子化的DCT系数进行解码,然后求逆量化并把DCT系数转化为8×8样本像块(使用二维DCT反变换),最后将操作完成后的块组合成一个单一的图像。这样就完成了图像的解压过程。
一个块的二维DCT的定义如下:
(1)
将离散余弦变换变换写为矩阵形式为:
(2)
(3)
其中,为正交变换矩阵,为原图像块,为变换域图像块。
二.传统DCT的改进——DDCT和SDCT
对于4*4的图形快,其亮度信号有八种预测模式,具体的预测模式为:竖直预测(模式0)、水平预测(模式1)、对角线左下预测(模式3)、对角线右下预测(模式4)、竖直向右预测(模式5)、水平向下预测(模式6)、竖直向左预测(模式7)、水平向上预测(模式8)。
其实每种预测模式都代表了图像块的一种方向信息,这种思想可以直接用在N*N的图像方块中。方向DCT框架中定义了8种方向模式,通过分析可知,模式4可以由模式3水平或竖直翻转得到;模式5可以由转置模式6而得到;模式7和模式8可以由模式5或模式6水平或竖直翻转而得到。
为使考虑结果具有一般性,先考虑一个大小为N*N的图像块应用与对角线左下方模式的情况,接着在扩展 其他方向模式。下面以4*4图像块为例详细介绍方向DCT算法。
采用方向DCT能够取得较好的编码增益,对于每个图像块来说,依据图像块的方向纹理,从所有的方向变换模式中选择最佳的方向DCT对其变换处理,实验证明可以取得良好的率失真编码性能。
人们可以设想的最佳可行策略是反复交替最小化,允许得到一个当地最小或马鞍。这是我们第一次的基础提出的算法,通过交替命名为可操纵DCT最小化(SDCT-AM)。如果适当初始化,SDCT-AM实践证明,始终跑赢DCT的研发方面。
从图表开始网格图的变换,我们设计了一个新的变换,称为可操纵DCT(SDCT),可通过以下方式获得将2D-DCT基础旋转一个给定的角度图像块。可操纵DCT(SDCT),允许以灵活的方式旋转成对的基矢量,并且能够精确匹配每个图像中的方向性阻止,提高编码效率。最佳旋转SDCT的角度可以表示为合适的解率失(RD)问题。
我们将无向图表示为,其中是顶点集合、是边缘集合。特定两个图和,令是和的乘积图。 假设和。 然后和在中相邻并且只有满足下列条件之一:a)且; b)和。对于任何图形与,我们定义了邻接矩阵,其中是节点i和j之间的边,否则。
图的拉普拉斯矩阵定义为,其中是邻接矩阵,是具有的对角矩阵等于入射到节点的边数。任何信号可以与图相关联与; 每个分量是与顶点相关联。在上,我们定义了所谓的的傅里叶变换如下:,其中是矩阵,其列是特征向量。可以通过反演从中轻松检索:。人们还可以将一些现有的变换重铸为图形傅里叶变换特定拓扑。
对于每个具有多重性,我们可以旋转相关的特征向量; 个特征向量对应于的对应旋转成对和,如果是偶数不旋转。
在2D-DCT中矩阵,对和被旋转替换获得新的变换矩阵。
只能通过旋转角度来定义使用,我们必须传输到解码器。数字使用的角度等于旋转对的数量,即, 可以写入新的变换矩阵如。
我们的新变换,以下将是被称为SDCT,定义如下:
等式表明SDCT可以分解为a旋转矩阵和2D-DCT变换的乘积矩阵.让是DCT系数。
在信号中,可以计算出SDCT以下方式:
这样,SDCT的复杂性可以大大提高减少因为可以使用可分 离性来计算DCT属性。然后,为了计算SDCT系数,是乘以稀疏矩阵。
我们提出迭代方法搜索这样的解决方案,我们开发了一个完全成熟的图像编码器,实际上将我们的技术与其他技术进行比较变换。分析和数值结果证明了这一点SDCT优于DCT和最先进的方向变换。
3. 研究计划与安排
第1-3周:查阅相关文献资料,明确研究内容,了解研究所需理论基础。确定方案,完成开题报告。
第4-5周:熟悉掌握基本理论,学习一门仿真语言(如matlab等)相关知识。
第6-9周:编程实现各算法,并进行仿真调试。
4. 参考文献(12篇以上)
[1] 基于整数函数的低复杂度8点dct逼近
[2] 应用于图像压缩的dct近似
[3]n ahmed,tnatarajan,k.t.rao. discrete cosine transform[j].ieee tran.on computers,1974,