🤖 DRIFT: аудит глубоких исследовательских агентов

Представлен фреймворк DRIFT для локализации ошибок в траекториях выполнения автономных агентов. Система использует модули Claim Keeper, Support Seeker и Dependency Tracer, повышая точность обнаружения ошибок на 30%.

🌍 Позволяет оценивать не только результат, но и процесс работы агента.

👤 Помогает разработчикам точно находить моменты «галлюцинаций» ИИ.

Источник 1: https://nju-link.github.io/DRIFT/ Источник 2: https://arxiv.org/abs/2606.02060