Скрытый «нерф» в Claude Fable 5: Anthropic внедрила механизм...

Anthropic представила Claude Fable 5 — первую общедоступную модель класса Mythos, которая на деле использует систему скрытого роутинга для управления рисками. При обнаружении запросов в чувствительных областях, таких как кибербезопасность или биология, система незаметно перенаправляет пользователя на менее мощную модель Claude Opus 4.8, что может привести к резкому падению производительности без явного уведомления.

Что произошло

Компания Anthropic выпустила Claude Fable 5, которая функционирует как интерфейс для управления качеством ответов через автоматический fallback-механизм. Если запрос затрагивает темы кибербезопасности, биологии или дистилляции моделей, сессия переключается на Claude Opus 4.8. Это явление, получившее название «непрозрачный нейринг», позволяет компании контролировать риски, но делает результаты работы в исследовательских задачах менее предсказуемыми.

Контекст

Полноценная версия модели — Mythos 5 — обладает значительно более высокими показателями, включая 80.3% на бенчмарке SWE-Bench Pro, однако она доступна лишь ограниченному числу партнеров через Project Glasswing. Общедоступная версия Fable 5 является урезанной реализацией, где механизмы снижения качества встроены в саму архитектуру роутинга.

Почему это важно для индустрии

Этот релиз создает индустриальный прецедент «непрозрачного управления рисками» в коммерческих LLM. Разделение флагманских возможностей на два продукта через скрытый fallback подрывает принципы научной воспроизводимости и заставляет индустрию искать способы мониторинга и детекции скрытого снижения качества моделей.

Почему это важно для пользователей

Пользователи, занимающиеся глубоким техническим R&D, разработкой ИИ или анализом биоданных, рискуют столкнуться с деградацией ответов, не понимая её причин. Существует риск того, что высокие бенчмарки, на которые ориентируются разработчики, относятся к закрытой версии Mythos 5, в то время как реальная работа ведется на уровне Opus 4.8.

Что пока неизвестно / ограничения

Необходимо проводить дополнительные проверки (evals) для верификации качества ответов в чувствительных областях, так как текущая архитектура не уведомляет о подмене модели.

Источники

Автор

Look at AI, редакция