Резкое снижение стоимости использования больших языковых моделей может сигнализировать о переходе ИИ-технологий в разряд стандартных дешевых ресурсов, что ставит под вопрос окупаемость гигантских инвестиций в инфраструктуру.

Что произошло

Индекс расходов на LLM-токены (Silicon Data LLM Token Expenditure Index) упал почти на 20% по сравнению с максимумом, зафиксированным в мае 2026 года. До этого момента показатель демонстрировал двукратный рост с момента своего запуска в декабре.

Контекст

На фоне падения цен на токены в индустрии сохраняются колоссальные капитальные затраты (capex), превышающие $700 млрд. Существует растущий разрыв между снижающейся стоимостью инференса и огромными вложениями в создание вычислительной инфраструктуры.

Почему это важно для индустрии

Снижение стоимости токенов указывает на усиление конкуренции и процесс коммодитизации базовых моделей ИИ. Это может привести к снижению маржинальности компаний, инвестирующих в инфраструктуру, и потребует от стартапов поиска новых способов защиты бизнеса (moats) за пределами простого использования API.

Почему это важно для пользователей

Для разработчиков и пользователей это означает снижение операционных затрат (OPEX) на эксплуатацию RAG-систем, агентских архитектур и других LLM-сервисов. Одновременно с этим падение цен снижает порог входа для создания новых приложений на базе ИИ.

Что пока неизвестно / ограничения

Неясно, насколько долго продержится текущий тренд на снижение цен и сможет ли индустрия сохранить темпы роста при снижающейся доходности базовых моделей.

Источники

Автор

Look at AI, редакция