Резкое снижение стоимости использования больших языковых моделей может сигнализировать о переходе ИИ-технологий в разряд стандартных дешевых ресурсов, что ставит под вопрос окупаемость гигантских инвестиций в инфраструктуру.
Что произошло
Индекс расходов на LLM-токены (Silicon Data LLM Token Expenditure Index) упал почти на 20% по сравнению с максимумом, зафиксированным в мае 2026 года. До этого момента показатель демонстрировал двукратный рост с момента своего запуска в декабре.
Контекст
На фоне падения цен на токены в индустрии сохраняются колоссальные капитальные затраты (capex), превышающие $700 млрд. Существует растущий разрыв между снижающейся стоимостью инференса и огромными вложениями в создание вычислительной инфраструктуры.
Почему это важно для индустрии
Снижение стоимости токенов указывает на усиление конкуренции и процесс коммодитизации базовых моделей ИИ. Это может привести к снижению маржинальности компаний, инвестирующих в инфраструктуру, и потребует от стартапов поиска новых способов защиты бизнеса (moats) за пределами простого использования API.
Почему это важно для пользователей
Для разработчиков и пользователей это означает снижение операционных затрат (OPEX) на эксплуатацию RAG-систем, агентских архитектур и других LLM-сервисов. Одновременно с этим падение цен снижает порог входа для создания новых приложений на базе ИИ.
Что пока неизвестно / ограничения
Неясно, насколько долго продержится текущий тренд на снижение цен и сможет ли индустрия сохранить темпы роста при снижающейся доходности базовых моделей.
Источники
Автор
Look at AI, редакция