📉 Xiaomi снизила стоимость на API семейства MiMo-V2.5

Xiaomi объявила о радикальном снижении стоимости API моделей MiMo-V2.5. Цены на входные токены упали на величину до 99%, при этом компания отказалась от дифференциации стоимости в зависимости от длины контекста. Техническим фундаментом стали оптимизации Sliding Window Attention (SWA) через SGLang HiCache.

🌍 Xiaomi усиливает ценовую конкуренцию в сегменте LLM API, используя преимущества в эффективности инференса. Это стимулирует индустрию переходить к сложным методам управления KV-кешем для сохранения маржинальности.

👤 Использование моделей Xiaomi станет дешевле и предсказуемее благодаря упрощенному биллингу. Пользователи подписок также получили прирост лимитов в 5–8 раз.

Источник 1: https://platform.xiaomimimo.com/docs/en-US/news/v2.5-price-update Источник 2: https://news.aibase.com/news/28354