Whisper

Whisper

Whisper是由OpenAI开发的通用语音识别模型。在音频可视化领域，Whisper被用于生成歌词时间戳，实现歌词与音乐的精确同步显示。

核心功能

高精度语音识别
生成带时间戳的转录文本
支持多语言

在音频可视化中的应用

在[[2026-03-25-audio-visualization-python-houdini.md]]中，Whisper被用于：

生成歌词时间戳，实现歌词同步浮现
通过Python表达式驱动Houdini中的Text SOP，在特定时间点显示歌词