nemo-evaluator

Name: nemo-evaluator
Author: eyadsibai

Use when evaluating LLMs, running benchmarks like MMLU/HumanEval/GSM8K, setting up evaluation pipelines, or asking about "NeMo Evaluator", "LLM benchmarking", "model evaluation", "MMLU", "HumanEval", "GSM8K", "benchmark harnesses"

Ver código fuente machine-learning

maintainer

eyadsibai

Actualizado 1/15/2026

Estrellas

Forks

quick start

Installation and usage

Instalación

$ install --globalskills.sh

Uso

Después de instalarlo, puedes usar este skill ejecutando el siguiente comando en tu terminal:

skills use nemo-evaluator