Выход Claude Sonnet 5: производительность уровня Opus при скрытом...

Компания Anthropic представила новую модель Claude Sonnet 5, которая демонстрирует производительность, сопоставимую с флагманской моделью Opus 4.8, при сохранении прежних номинальных цен за токены. Однако использование нового токенизатора приводит к фактическому росту стоимости обработки английского текста и программного кода на 30-40%.

Что произошло

Anthropic выпустила Claude Sonnet 5 с поддержкой контекстного окна в 1 млн токенов и возможностью генерации до 128 000 токенов на выходе. Несмотря на то, что официальный прайс-лист остался неизменным ($3 за 1 млн входных токенов и $15 за 1 млн выходных), архитектурные изменения в токенизаторе увеличивают количество потребляемых токенов для того же объема англоязычного текста и кода.

Контекст

Новая модель внедряет концепцию Adaptive Thinking (адаптивное мышление) по умолчанию, что позволяет динамически распределять вычислительные ресурсы для оптимизации качества ответов. Это изменение архитектуры напрямую связано с обновлением токенизатора, целью которого была оптимизация производительности, но приведшее к экономическим побочным эффектам.

Почему это важно для индустрии

Выход Claude Sonnet 5 подтверждает индустриальный тренд на интеграцию механизмов адаптивного мышления в модели среднего веса. Для разработчиков это означает необходимость пересмотра Unit-экономики AI-продуктов, так как эффективность масштабирования теперь неразрывно связана с архитектурой токенизации, а не только с вычислительной мощностью.

Почему это важно для пользователей

Пользователям API следует учитывать, что при работе с английским языком или написании кода реальные расходы на инфраструктуру вырастут примерно на 30-40%. Разработчикам рекомендуется немедленно провести перерасчет бюджетов и внедрить калькуляторы стоимости токенов для всех текущих пайплайнов, использующих данную модель.

Источники

Simon Willison

Автор

Look at AI, редакция