Компания Meituan анонсировала LongCat 2.0 — передовую модель на архитектуре Mixture-of-Experts (MoE), обладающую общим объемом параметров 1.6 трлн. Благодаря использованию технологии LongCat Sparse Attention, модель способна эффективно обрабатывать сверхдлинные последовательности с контекстным окном до 1 млн токенов.

image

Что произошло

Разработчики Meituan обучили LongCat 2.0 на 35 триллионах токенов, используя специализированные ИИ-ASIC суперпуды вместо традиционных GPU. Модель работает по принципу MoE, где при общем масштабе в 1.6 трлн параметров для обработки каждого отдельного токена активно задействуется около 48 млрд параметров. Высокую эффективность в задачах программирования и агентского планирования модель подтвердила результатами в бенчмарках SWE-bench и Terminal-Bench.

Контекст

В отличие от большинства современных frontier-scale моделей, опирающихся на инфраструктуру NVIDIA, LongCat 2.0 была создана с акцентом на аппаратную независимость. Использование кастомных AI ASIC позволяет оптимизировать процесс обучения и инференса масштабных моделей, предлагая альтернативный путь масштабирования вне сложившейся экосистемы GPU.

Почему это важно для индустрии

Для индустрии этот релиз является демонстрацией жизнеспособности альтернативных путей обучения frontier-scale моделей на специализированном железе. Это снижает критическую зависимость от NVIDIA и стимулирует развитие архитектур, оптимизированных под сверхдлинный контекст и задачи автономных агентов.

Почему это важно для пользователей

Пользователи получают доступ к мощному инструменту для кодинга и глубокого анализа документации или репозиториев через API, совместимый с форматами OpenAI и Anthropic. Это позволяет быстро интегрировать продвинутые агентские пайплайны в существующие рабочие процессы без необходимости владения собственной дорогостоящей инфраструктурой.

Что пока неизвестно / ограничения

На данный момент отсутствуют подробные данные о задержках (latency), стоимости инференса и требованиях к безопасности API для промышленного использования. Также не уточняется статус публикации весов модели на Hugging Face для локального развертывания.

Источники

Автор

Look at AI, редакция