home/categories/lab-tools/miosa-osa-canopy-library-skills-ai-patterns-validate-evaluator-skill-md

lab-toolsresearch

validate-evaluator

Name: validate-evaluator
Author: Miosa-osa

Calibrate LLM-as-Judge evaluators against human labels. Computes TPR, TNR, precision, recall, F1, and Cohen's kappa. Detects systematic biases and recommends prompt corrections. Produces a calibration report with confidence intervals. Triggers on: "validate evaluator", "calibrate judge", "judge accuracy", "evaluator validation", "judge metrics"

स्रोत देखें lab-tools

maintainer

Miosa-osa

अपडेट किया गया 3/19/2026

स्टार

172

फोर्क

quick start

Installation and usage

इंस्टॉलेशन

$ install --globalskills.sh

उपयोग

इंस्टॉल करने के बाद, आप टर्मिनल में यह कमांड चलाकर इस स्किल का उपयोग कर सकते हैं:

skills use validate-evaluator