home/categories/academic/greyhaven-ai-claude-code-config-grey-haven-plugins-core-skills-evaluation-skill-md

academicresearch

grey-haven-evaluation

Evaluate LLM outputs with multi-dimensional rubrics, handle non-determinism, and implement LLM-as-judge patterns. Essential for production LLM systems. Use when testing prompts, validating outputs, comparing models, or when user mentions 'evaluation', 'testing LLM', 'rubric', 'LLM-as-judge', 'output quality', 'prompt testing', or 'model comparison'.

Ver código-fonte academic

maintainer

greyhaven-ai

Atualizado 1/10/2026

Estrelas

Forks

quick start

Installation and usage

Instalação

$ install --globalskills.sh

Uso

Depois de instalar, você pode usar esta skill executando o seguinte comando no terminal:

skills use grey-haven-evaluation