librosa

librosa

librosa

librosa是一个Python音频分析库,专门用于音乐和音频信号的提取、分析和可视化。在音频可视化流程中,librosa是核心的"数据工厂",负责从音频文件中提取各种时域和频域特征。

核心功能

  • RMS能量提取librosa.feature.rms(),量化瞬时响度
  • 谱质心计算librosa.feature.spectral_centroid(),描述音色"重心"
  • 谱通量检测librosa.feature.spectral_flux(),检测音色变化
  • MFCC提取librosa.feature.mfcc(),模拟人耳对数感知
  • 峰值检测与Onsetlibrosa.onset_detect(),找出鼓点瞬时
  • 节拍跟踪librosa.beat_track(),检测节奏点

在音频可视化中的应用

在[[2026-03-25-audio-visualization-python-houdini.md]]中,librosa被用于:

  • 提取每层音轨的RMS能量,驱动波形高度脉动
  • 计算谱质心,映射为颜色渐变(蓝→红)
  • 检测Onset峰值,触发Drop时刻的粒子爆发
  • 生成多维特征数据,导出为CSV供Houdini使用

相关工具

  • [[Houdini]]:3D渲染引擎,接收librosa输出的特征数据
  • [[Demucs]]:音轨分离工具,提供librosa处理的独立音轨
分享到