Agent Privacy: новая модель управления конфиденциальностью для...

Исследователь Джек Дэвис представил фреймворк Agent Privacy, который предлагает уйти от бинарного подхода «разрешить или заблокировать» к более гибкому управлению потоками данных в агентских рабочих процессах, таких как Claude Code или Copilot CLI.

Что произошло

В рамках исследования представлена четырехступенчатая модель управления доступом к данным: Allow (пропуск), Redact (удаление чувствительных данных), Handoff (передача данных локальной модели для суммаризации) и Block (прерывание). Основной акцент сделан на защите так называемого transit leg — этапа передачи данных между выполнением инструмента (например, shell-команды или чтения файла) и следующим запросом к LLM, где чаще всего происходят утечки.

Контекст

Традиционные методы защиты AI-агентов часто ограничиваются фильтрацией входных промптов. Однако критическая уязвимость заключается в обработке вывода инструментов (tool outputs). Без специализированного контроля результаты работы команд могут содержать секреты или конфиденциальную информацию, которая затем отправляется в облачные API.

Почему это важно для индустрии

Для индустрии это означает переход от простых фильтров к созданию полноценного слоя инфраструктуры безопасности. Использование модели Handoff с локальными LLM (например, Qwen) позволяет минимизировать передачу сырых данных в облачные системы, сохраняя при этом необходимый контекст для работы агента, что критично для безопасного внедрения автономных систем в корпоративные контуры.

Почему это важно для пользователей

Пользователи CLI-агентов для кодинга и автоматизации должны учитывать, что безопасность их данных зависит не только от содержания чата, но и от того, как агент обрабатывает результаты выполнения команд и содержимое локальных файлов. Новый подход предлагает паттерны для более безопасного использования инструментов автоматизации.

Источники

Автор

Look at AI, редакция