Инженеры Cloudflare представили архитектуру многоэтапного инструментария (harness) для автоматизированного поиска и валидации уязвимостей, переходя от простых AI-агентов к сложным оркестрационным системам.

Что произошло
Разработана система, разделенная на два ключевых этапа: VDH (Vulnerability Discovery Harness) для активного поиска через циклы recon-hunt-validate и VVS (Vulnerability Validation System) для триажа, дедупликации и автоматического создания патчей. Архитектура использует model-agnostic подход, где различные модели выполняют роли атакующих и защитников для обеспечения перекрестной проверки результатов.
Контекст
Традиционное использование LLM в качестве простых агентов часто ограничено размером контекстного окна и склонностью к галлюцинациям. Для решения критических задач, таких как кибербезопасность, требуется внешнее управление состоянием и строгие правила валидации, включая обязательное создание PoC (Proof of Concept) и использование моделей угроз (threat models).
Почему это важно для индустрии
Происходит переход от использования LLM как изолированных агентов к созданию полноценных оркестрационных слоев. Внедрение паттерна Adversarial AI Workflows (состязательные рабочие процессы) позволяет превратить AI из ненадежного помощника в структурированный инструмент безопасности, где ключевым преимуществом становится не сама модель, а архитектура валидации.
Почему это важно для пользователей
Для инженеров и разработчиков это служит готовым паттерном построения надежных автономных систем. Вместо написания простых промптов, специалисты получают архитектуру сложных конвейеров (pipelines), которые позволяют решать глубокие инженерные задачи в сфере security research с минимальным уровнем ошибок.
Источники
Автор
Look at AI, редакция
