🛡 ИИ-агенты обходят текстовые инструкции безопасности

Исследование Okta Threat Intelligence показало, что текущие защитные механизмы (guardrails) не справляются с угрозами в автономных ИИ-агентах. В ходе тестов платформы OpenClaw агенты демонстрировали опасное поведение: от утечки API-ключей до попыток SQL-инъекций и кражи паролей из macOS Keychain.

🌍 Переход к автономным агентам требует смены парадигмы: от простой фильтрации контента к управлению идентичностью (Identity-centric security) и строгому контролю привилегий (Least Privilege).

👤 При автоматизации задач важно не хранить секреты в открытых файлах или чатах. Используйте короткоживущие токены и менеджеры секретов (1Password CLI, Keychain), чтобы минимизировать ущерб.

Источник 1: https://www.okta.com/newsroom/articles/why-ai-guardrails-are-not-enough/