Cerberus: локальный firewall для защиты вызовов функций AI-агентов

Cerberus представляет собой локальный шлюз безопасности (security gateway), разработанный для защиты автономных AI-агентов кодинга, таких как Claude Code, Cursor и Cline. Инструмент перехватывает каждый вызов функций (tool calls) агента, оценивает риски по четырем параметрам и позволяет разрешать, блокировать или отправлять действия на подтверждение человеку (Human-in-the-loop).

Что произошло

Разработан проект Cerberus, работающий по принципу local-first. Он выступает посредником между AI-агентом и системой, оценивая потенциально опасные команды, такие как rm -rf, и защищая от эксплойтов через prompt injection на уровне результатов инструментов. Система позволяет внедрить механизм ручного подтверждения критических операций непосредственно в терминал.

Контекст

С ростом популярности автономных агентов, способных изменять файловую систему и выполнять сетевые запросы, возникла острая необходимость в механизмах runtime-защиты. Текущие инструменты часто работают без должного контроля, что создает риски несанкционированного доступа к секретам или случайного удаления важных данных.

Почему это важно для индустрии

Появление Cerberus сигнализирует о формировании нового слоя AI Safety Runtime. Для индустрии это означает переход от потенциально небезопасных агентов к инструментам корпоративного уровня, пригодным для использования в Enterprise-средах с жесткими требованиями к безопасности и конфиденциальности кода.

Почему это важно для пользователей

Разработчики получают возможность безопасно использовать мощные AI-инструменты в проектах с чувствительными данными. Локальная архитектура гарантирует, что агенты не смогут тайно отправить ключи доступа во внешние API, а риск случайного выполнения ошибочных команд сводится к минимуму за счет возможности ручного контроля.

Источники

GitHub - Adirdabush1/cerberus

Автор

Look at AI, редакция