Эвалы
При работе с агентскими системами можно выделить несколько важных компонентов поверх собственно нейросетевой архитектуры LLM, обеспечивающих решение задач: управление контекстом, промпты, управление цепочкой рассуждений, харнесс, рои и пр., а также — оценки успешности (evals). Естественное стремление автоматизировать всё и вся приводит к тому, что каждый из этих компонентов также становится...