home/categories/llm-ai/openclaw-skills-skills-aidescend-minimax-image-understanding-skill-md
llm-aidata-ai

minimax-image-understanding

使用多模态大模型理解图片内容,生成业务含义描述。支持多种模型:(1) MiniMax VLM (2) OpenAI GPT-4V (3) Claude Vision。用于理解截图、图表、文档照片等,生成精准的文字描述。

openclaw
maintainer
openclaw
更新于 3/9/2026
星标
4001
分支
1095
quick start

Installation and usage

使用多模态大模型理解图片内容,生成业务含义描述。支持多种模型:(1) MiniMax VLM (2) OpenAI GPT-4V (3) Claude Vision。用于理解截图、图表、文档照片等,生成精准的文字描述。

安装
$ install --globalskills.sh
使用

安装后,您可以通过在终端运行以下命令来使用此技能:

skills use minimax-image-understanding