evaluation

Name: evaluation
Author: Treytucker05

Evaluate agent and LLM outputs. Use when asked to evaluate agent performance, build evaluation frameworks, implement LLM-as-judge, compare model outputs, create rubrics, mitigate evaluation bias, or design evaluation pipelines and quality gates.

Ver código fuente productivity-tools

maintainer

Treytucker05

Actualizado 1/20/2026

Estrellas

Forks

quick start

Installation and usage

Instalación

$ install --globalskills.sh

Uso

Después de instalarlo, puedes usar este skill ejecutando el siguiente comando en tu terminal:

skills use evaluation