home/categories/documents/infquest-vibe-ops-plugin-skills-audio-transcribe-skill-md
documentscontent-media

audio-transcribe

使用 Whisper 将音频/视频转换为文字,支持词级别时间戳。Use when user wants to 语音转文字, 音频转文字, 视频转文字, 字幕生成, transcribe audio, speech to text, generate subtitles, 识别语音.

InfQuest
maintainer
InfQuest
更新于 1/19/2026
星标
0
分支
0
quick start

Installation and usage

使用 Whisper 将音频/视频转换为文字,支持词级别时间戳。Use when user wants to 语音转文字, 音频转文字, 视频转文字, 字幕生成, transcribe audio, speech to text, generate subtitles, 识别语音.

安装
$ install --globalskills.sh
使用

安装后,您可以通过在终端运行以下命令来使用此技能:

skills use audio-transcribe