advanced-evaluation

Name: advanced-evaluation
Author: sickn33

This skill should be used when the user asks to "implement LLM-as-judge", "compare model outputs", "create evaluation rubrics", "mitigate evaluation bias", or mentions direct scoring, pairwise comparison, position bias, evaluation pipelines, or automated quality assessment.

ソースを表示 machine-learning

maintainer

sickn33

更新日 3/20/2026

スター

32093

フォーク

5340

quick start

Installation and usage

インストール

$ install --globalskills.sh

使い方

インストール後、ターミナルで以下のコマンドを実行してこのスキルを使用できます：

skills use advanced-evaluation