framework-internalsdevelopment
llama-cpp
Run quantized LLMs locally with llama.cpp — CPU+GPU inference, GGUF format, OpenAI-compatible server, and Python bindings.
maintainer
AlexAI-MCP
Обновлено 4/7/2026
Звёзды
62
Форки
14
quick start
Installation and usage
Run quantized LLMs locally with llama.cpp — CPU+GPU inference, GGUF format, OpenAI-compatible server, and Python bindings.
Установка
$ install --globalskills.sh
Использование
После установки вы можете использовать этот skill, выполнив следующую команду в терминале:
skills use llama-cpp