turboquant-pytorch

PyTorch implementation of TurboQuant for LLM KV cache compression using two-stage vector quantization (random rotation + Lloyd-Max + QJL residual correction).

سورس دیکھیں framework-internals

maintainer

Aradotso

اپ ڈیٹ ہوا 3/28/2026

اسٹارز

فورکس

quick start

Installation and usage

PyTorch implementation of TurboQuant for LLM KV cache compression using two-stage vector quantization (random rotation + Lloyd-Max + QJL residual correction).

انسٹالیشن

$ install --globalskills.sh

استعمال

انسٹال کرنے کے بعد، آپ یہ اسکل ٹرمینل میں درج ذیل کمانڈ چلا کر استعمال کر سکتے ہیں:

skills use turboquant-pytorch