evaluation

Name: evaluation
Author: NVIDIA

Evaluates accuracy of quantized or unquantized LLMs using NeMo Evaluator Launcher (NEL). Triggers on "evaluate model", "benchmark accuracy", "run MMLU", "evaluate quantized model", "accuracy drop", "run nel". Handles deployment, config generation, and evaluation execution. Not for quantizing models (use ptq) or deploying/serving models (use deployment).

Ver código-fonte machine-learning

maintainer

NVIDIA

Atualizado 4/3/2026

Estrelas

2429

Forks

344

quick start

Installation and usage

Instalação

$ install --globalskills.sh

Uso

Depois de instalar, você pode usar esta skill executando o seguinte comando no terminal:

skills use evaluation