librosa
librosa是一个Python音频分析库,专门用于音乐和音频信号的提取、分析和可视化。在音频可视化流程中,librosa是核心的"数据工厂",负责从音频文件中提取各种时域和频域特征。
核心功能
- RMS能量提取:
librosa.feature.rms(),量化瞬时响度 - 谱质心计算:
librosa.feature.spectral_centroid(),描述音色"重心" - 谱通量检测:
librosa.feature.spectral_flux(),检测音色变化 - MFCC提取:
librosa.feature.mfcc(),模拟人耳对数感知 - 峰值检测与Onset:
librosa.onset_detect(),找出鼓点瞬时 - 节拍跟踪:
librosa.beat_track(),检测节奏点
在音频可视化中的应用
在[[2026-03-25-audio-visualization-python-houdini.md]]中,librosa被用于:
- 提取每层音轨的RMS能量,驱动波形高度脉动
- 计算谱质心,映射为颜色渐变(蓝→红)
- 检测Onset峰值,触发Drop时刻的粒子爆发
- 生成多维特征数据,导出为CSV供Houdini使用
相关工具
- [[Houdini]]:3D渲染引擎,接收librosa输出的特征数据
- [[Demucs]]:音轨分离工具,提供librosa处理的独立音轨