引言
DCT变换的全称是离散余弦变换(Discrete Cosine Transform),主要用于数据或图像的压缩,能够将空域的信号转换到频域上,具有良好的去相关性的性能。
DCT变换本身是无损的,但是在图像编码等领域给接下来的量化、哈弗曼编码等创造了很好的条件,同时,由于DCT变换是对称的,所以,我们可以在量化编码后利用DCT逆变换,在接收端恢复原始的图像信息。DCT变换在当前的图像分析以及压缩领域有着极为广大的用途,我们常见的JPEG静态图像编码以及MJPEG、MPEG动态编码等标准中都使用了DCT变换。
一维DCT变换
一维DCT变换是二维DCT变换的基础,所以我们先来讨论一下一维DCT变换。一维DCT变换共有8种形式,其中最常用的是第二种形式,由于其运算简单、适用范围广,我们在这里只讨论这种形式,其表达式如下:
其中,f(i)为原始的信号,F(u)是DCT变换后的系数,N为原始信号的点数,c(u)可以认为是一个补偿系数,可以使DCT变换矩阵为正交矩阵。
二维DCT变换
二维DCT变换其实是在一维DCT变换的基础上再做了一次DCT变换,其公式如下:
由公式我们可以看出,上面只讨论了二维图像数据为方阵的情况,在实际应用中,如果不是方阵的数据,一般都是补齐之后再做变换的,重构之后可以去掉补齐的部分,得到原始的图像信息,这个尝试一下,应该比较容易理解。
另外,由于DCT变换高度的对称性,在使用python进行相关的运算时,可以使用更简单的矩阵处理方式:
二维DCT逆变换
在图像的接收端,根据DCT变化的可逆性,我们可以通过DCT逆变换恢复出原始的图像信息,公式如下:
同样的道理,我们利用之前的矩阵运算公式可以推导出DCT逆变换相应的矩阵形式:
仿真实验
接下来使用python对变换过程进行仿真实验:
实验代码
1 | import numpy as np |
实验结果
由实验结果可以看出,我们采用的公式的方法和python openCV模块自带的dct函数结果是一致的,验证了我们方法的正确性。
如果原始信号是图像等相关性较大的数据的时候,我们可以发现在变换之后,系数较大的集中在左上角,而右下角的几乎都是0,其中左上角的是低频分量,右下角的是高频分量,低频系数体现的是图像中目标的轮廓和灰度分布特性,高频系数体现的是目标形状的细节信息。DCT变换后,能量主要集中在低频分量处,这也是DCT变换去相关性的一个体现。之后在量化和编码阶段,我们可以用“Z”字形编码,这样就可以得到大量的连续的0,这大大简化了编码的过程。
另外我们也可以看到逆变换后无损的恢复了原始信息,所以证明了方法的正确性。但是在实际过程中,需要量化编码或者直接舍弃高频分量等处理,所以会出现一定程度的误差,这个是不可避免的。