computational-chemistryresearch
evaluation-v2
Anthropic-aligned medical safety evaluation with pass^k metrics, failure taxonomy, and anti-gaming graders
maintainer
GOATnote-Inc
Обновлено 1/17/2026
Звёзды
3
Форки
1
quick start
Installation and usage
Anthropic-aligned medical safety evaluation with pass^k metrics, failure taxonomy, and anti-gaming graders
Установка
$ install --globalskills.sh
Использование
После установки вы можете использовать этот skill, выполнив следующую команду в терминале:
skills use evaluation-v2