Demucs

Demucs

Demucs

Demucs是由Facebook Research(现Meta)开发的基于深度学习的音轨分离工具。它能够将混合音频文件分离成独立的音轨(如人声、低音、鼓点、其他),是音频可视化流程中实现多层波形独立显示的关键技术前提。

核心原理

Demucs使用监督学习模型,训练于大规模数据集,预测每个时间帧的源分离掩码。它能够将单轨WAV文件拆分为多个独立音轨,如vocal.wav、bass.wav、drums.wav、other.wav。

在音频可视化中的应用

在[[2026-03-25-audio-visualization-python-houdini.md]]中,Demucs被用于:

  • 将混合音频分离成人声、合成器、低音、鼓点等独立音轨
  • 为后续librosa特征提取提供干净的每层音频数据
  • 实现视频中五层清晰独立的波形显示

替代方案

  • [[Spleeter]]:Deezer开发的音轨分离工具,功能类似
分享到