home/categories/productivity-tools/yonatangross-skillforge-claude-plugin-skills-audio-language-models-skill-md
productivity-toolstools

audio-language-models

Gemini Live API, Grok Voice Agent, GPT-4o-Transcribe, AssemblyAI patterns for real-time voice, speech-to-text, and TTS. Use when implementing voice agents, audio transcription, or conversational AI.

yonatangross
maintainer
yonatangross
আপডেট হয়েছে 1/19/2026
স্টার
26
ফর্ক
4
quick start

Installation and usage

Gemini Live API, Grok Voice Agent, GPT-4o-Transcribe, AssemblyAI patterns for real-time voice, speech-to-text, and TTS. Use when implementing voice agents, audio transcription, or conversational AI.

ইনস্টলেশন
$ install --globalskills.sh
ব্যবহার

ইনস্টল করার পর, টার্মিনালে নিচের কমান্ড চালিয়ে আপনি এই স্কিল ব্যবহার করতে পারবেন:

skills use audio-language-models