Инженеры Cloudflare представили архитектуру многоэтапного инструментария (harness) для автоматизированного поиска и валидации уязвимостей, переходя от простых AI-агентов к сложным оркестрационным системам.

image

Что произошло

Разработана система, разделенная на два ключевых этапа: VDH (Vulnerability Discovery Harness) для активного поиска через циклы recon-hunt-validate и VVS (Vulnerability Validation System) для триажа, дедупликации и автоматического создания патчей. Архитектура использует model-agnostic подход, где различные модели выполняют роли атакующих и защитников для обеспечения перекрестной проверки результатов.

Контекст

Традиционное использование LLM в качестве простых агентов часто ограничено размером контекстного окна и склонностью к галлюцинациям. Для решения критических задач, таких как кибербезопасность, требуется внешнее управление состоянием и строгие правила валидации, включая обязательное создание PoC (Proof of Concept) и использование моделей угроз (threat models).

Почему это важно для индустрии

Происходит переход от использования LLM как изолированных агентов к созданию полноценных оркестрационных слоев. Внедрение паттерна Adversarial AI Workflows (состязательные рабочие процессы) позволяет превратить AI из ненадежного помощника в структурированный инструмент безопасности, где ключевым преимуществом становится не сама модель, а архитектура валидации.

Почему это важно для пользователей

Для инженеров и разработчиков это служит готовым паттерном построения надежных автономных систем. Вместо написания простых промптов, специалисты получают архитектуру сложных конвейеров (pipelines), которые позволяют решать глубокие инженерные задачи в сфере security research с минимальным уровнем ошибок.

Источники

Автор

Look at AI, редакция