Компания Anthropic возобновляет предоставление доступа к модели Claude Fable 5 с 1 июля, после снятия экспортных ограничений США. Возвращение модели сопровождается внедрением строгой системы классификации запросов для предотвращения киберугроз.


Что произошло
С 1 июля пользователи могут снова использовать Claude Fable 5. Для обеспечения безопасности Anthropic внедрила новый классификатор, который способен перенаправлять сложные или потенциально опасные запросы на модель Opus 4.8. До 7 июля владельцы подписок Pro, Team, Max и Premium Enterprise смогут использовать Fable 5 в рамках 50% своих еженедельных лимитов, после чего потребуется использование кредитов.
Контекст
Доступ к модели был временно ограничен из-за отчета исследователей из Amazon. Было обнаружено, что Claude Fable 5 обладает способностью находить и демонстрировать эксплойты для уязвимостей в программном обеспечении. Этот инцидент вызвал интерес регуляторов США и подчеркнул риски использования мощных моделей в качестве инструментов для кибератак.
Почему это важно для индустрии
Данный кейс демонстрирует высокую скорость реакции регуляторов на риски кибербезопасности через инструменты экспортного контроля. Ситуация стимулирует разработку новых индустриальных стандартов оценки тяжести «джейлбрейков» и протоколов red-teaming при участии крупнейших игроков, таких как Amazon, Google и Microsoft. Также наблюдается переход к архитектуре с динамической маршрутизацией запросов (classifier-based routing) как стандарту для Enterprise-grade AI продуктов.
Почему это важно для пользователей
Пользователям Claude следует учитывать, что новые механизмы защиты могут приводить к росту числа false positives. Это означает, что безобидные запросы, связанные с написанием или отладкой кода, могут ошибочно блокироваться или перенаправляться на менее мощную модель Opus 4.8, что может повлиять на стабильность и качество ответов.
Что пока неизвестно / ограничения
Существует неопределенность относительно того, как именно новый классификатор повлияет на latency и общую стоимость инференса при использовании динамической маршрутизации.
Источники
Автор
Look at AI, редакция
