home/categories/llm-ai/openclaw-skills-skills-aidescend-minimax-image-understanding-skill-md
llm-aidata-ai

minimax-image-understanding

使用多模态大模型理解图片内容,生成业务含义描述。支持多种模型:(1) MiniMax VLM (2) OpenAI GPT-4V (3) Claude Vision。用于理解截图、图表、文档照片等,生成精准的文字描述。

openclaw
maintainer
openclaw
Updated 3/9/2026
Stars
4001
Forks
1095
quick start

Installation and usage

使用多模态大模型理解图片内容,生成业务含义描述。支持多种模型:(1) MiniMax VLM (2) OpenAI GPT-4V (3) Claude Vision。用于理解截图、图表、文档照片等,生成精准的文字描述。

Installation
$ install --globalskills.sh
Usage

Once installed, you can use this skill by running the following command in your terminal:

skills use minimax-image-understanding