ServiceNow AI выпустила EVA-Bench Data 2.0 для оценки ИИ-агентов
Краткая выжимка по источнику: EVA-Bench Data 2.0 расширяет набор данных для проверки ИИ-агентов на 3 домена, 121 инструмент и 213 сценариев.
Hugging Face
ServiceNow AI
EVA-Bench
бенчмарки
ИИ-агенты
датасеты
Читать выжимку