framework-internalsdevelopment
llama-cpp
Run quantized LLMs locally with llama.cpp — CPU+GPU inference, GGUF format, OpenAI-compatible server, and Python bindings.
maintainer
AlexAI-MCP
اپ ڈیٹ ہوا 4/7/2026
اسٹارز
62
فورکس
14
quick start
Installation and usage
Run quantized LLMs locally with llama.cpp — CPU+GPU inference, GGUF format, OpenAI-compatible server, and Python bindings.
انسٹالیشن
$ install --globalskills.sh
استعمال
انسٹال کرنے کے بعد، آپ یہ اسکل ٹرمینل میں درج ذیل کمانڈ چلا کر استعمال کر سکتے ہیں:
skills use llama-cpp