home/categories/llm-ai/hotriluan-alkana-dashboard-claude-skills-ai-multimodal-skill-md

llm-aidata-ai

ai-multimodal

Name: ai-multimodal
Author: hotriluan

Analyze images/audio/video with Gemini API (better vision than Claude). Generate images (Imagen 4), videos (Veo 3). Use for vision analysis, transcription, OCR, design extraction, multimodal AI.

View Source llm-ai

maintainer

hotriluan

Updated 1/20/2026

Stars

Forks

quick start

Installation and usage

Analyze images/audio/video with Gemini API (better vision than Claude). Generate images (Imagen 4), videos (Veo 3). Use for vision analysis, transcription, OCR, design extraction, multimodal AI.

Installation

$ install --globalskills.sh

Usage

Once installed, you can use this skill by running the following command in your terminal:

skills use ai-multimodal