Компания Anthropic заявила о проведении крупномасштабной «атаки дистилляции» со стороны Alibaba. Согласно официальному письму в Сенат США, китайский технологический гигант использовал сеть из 25 000 подставных аккаунтов для систематического извлечения продвинутых возможностей флагманской модели Claude.

Что произошло

В ходе масштабной кампании было сгенерировано около 29 миллионов запросов к API Claude. Целью этих действий являлось извлечение специфических навыков модели, включая агентное рассуждение (agentic reasoning), навыки программной инженерии и способность к выполнению долгосрочных задач, для последующего использования в собственных разработках Alibaba.

Контекст

Под «атакой дистилляции» (distillation attack) понимается метод, позволяющий «копировать» поведение и знания сильной модели без прямого доступа к её весам. Это достигается путем использования ответов целевой модели для обучения менее крупных или конкурирующих моделей, что фактически превращает возможности интеллектуальной собственности в сырые данные для обучения.

Почему это важно для индустрии

Инцидент сигнализирует о переходе конкуренции в сфере ИИ в фазу промышленного шпионажа. Это создает острую необходимость в разработке новых методов защиты интеллектуальной собственности, таких как AI Watermarking и Model Fingerprinting, а также стимулирует дискуссии о законодательном регулировании методов обучения моделей на данных сторонних ИИ.

Почему это важно для пользователей

Для конечных пользователей и разработчиков это может означать ужесточение правил доступа к API и облачным вычислениям. Внедрение более агрессивного поведенческого анализа трафика, усиление проверок аккаунтов и потенциальное удорожание доступа к топовым моделям станут следствием мер безопасности, направленных на предотвращение подобных атак.

Источники

Автор

Look at AI, редакция