home/categories/llm-ai/caphtech-claude-marketplace-caphtech-plugin-skills-llm-eval-designer-skill-md

llm-aidata-ai

llm-eval-designer

Name: llm-eval-designer
Author: CAPHTECH

LLM生成システムの検証設計スキル。assay-kitフレームワークを活用し、LLM特有の失敗モード（幻覚、例への過学習、部分的処理）を考慮した総合的なテストケース設計を支援する。使用タイミング: - LLMベースのワークフロー/エージェントの評価設計時 - ゴールデンデータセット（golden-dataset.yaml）の設計・拡張時 - 既存テストが特定パターンに過学習していないか検証時 - LLM出力の品質スコアラー設計時 - 「なぜこのテストケースが必要か」の根拠を示す時

檢視原始碼 llm-ai

maintainer

CAPHTECH

更新於 1/18/2026

星標

分支

quick start

Installation and usage

安裝

$ install --globalskills.sh

使用

安裝後，您可以透過在終端機執行以下指令來使用此技能：

skills use llm-eval-designer