home/categories/testing/langchain-ai-deepagentsjs-agents-skills-eval-creator-skill-md

testingtesting-security

eval-writer

Name: eval-writer
Author: langchain-ai

Create new eval suites for the deepagentsjs monorepo. Handles dataset design, test case scaffolding, scoring logic, vitest configuration, and LangSmith integration. Use when the user asks to: (1) create an eval, (2) write an evaluation, (3) add a benchmark, (4) build an eval suite, (5) evaluate agent behaviour, (6) add test cases for a capability, or (7) implement an existing benchmark (e.g. oolong, AgentBench, SWE-bench). Trigger on phrases like 'create eval', 'new eval', 'add eval', 'benchmark', 'evaluate', 'eval suite', 'write evals for'.

Посмотреть исходный код testing

maintainer

langchain-ai

Обновлено 3/17/2026

Звёзды

1058

Форки

168

quick start

Installation and usage

Установка

$ install --globalskills.sh

Использование

После установки вы можете использовать этот skill, выполнив следующую команду в терминале:

skills use eval-writer