离散余弦变换 (DCT)

离散余弦变换 (DCT)

离散余弦变换 (DCT)

离散余弦变换(Discrete Cosine Transform, DCT)是FFT最重要的变种衍生形式,本质上是处理具有偶对称性质的实信号的傅里叶变换。DCT在多媒体信号压缩方面表现出压倒性的优势,是JPEG、MPEG、H.264/H.265、MP3、AAC等编解码标准的绝对底层基石。

与DFT的关键区别

  • 边界连续性:DCT基于偶对称延拓,确保信号在块边界的平滑过渡,避免了DFT周期延拓导致的阶跃不连续
  • 能量集中特性:DCT能够将几乎所有的信号能量压缩在频率矩阵左上角的极少数低频系数中,实现高效压缩
  • 纯实域计算:DCT是完全的实数正交变换,不涉及虚数运算,直接输出单一的实数幅度系数

改进型离散余弦变换 (MDCT)

在感知音频压缩(如MP3)领域,为了消除块与块之间的"咔哒"伪影,声学工程师开发了MDCT,通过时间混叠机制消融了块边界的突变,使得MP3能够在极低比特率下重构出流畅、自然的高保真音质。

分享到