home/categories/machine-learning/lifangda-claude-plugins-cli-tool-skills-library-llm-application-dev-llm-evaluation-skill-md

machine-learningdata-ai

llm-evaluation

Implement comprehensive evaluation strategies for LLM applications using automated metrics, human feedback, and benchmarking. Use when testing LLM performance, measuring AI application quality, or establishing evaluation frameworks.

ソースを表示 machine-learning

maintainer

lifangda

更新日 10/29/2025

スター

フォーク

quick start

Installation and usage

インストール

$ install --globalskills.sh

使い方

インストール後、ターミナルで以下のコマンドを実行してこのスキルを使用できます：

skills use llm-evaluation