Представлена новая флагманская модель GLM-5.2 с открытыми весами под лицензией MIT. Ключевой особенностью релиза является поддержка стабильного контекстного окна объемом 1 миллион токенов и внедрение архитектуры IndexShare, которая позволяет снизить вычислительную нагрузку при работе с длинными последовательностями на 2.9x.

image
image
image

Что произошло

Разработчики выпустили модель GLM-5.2, которая включает два режима рассуждений: max для обеспечения максимального качества и high для оптимального баланса скорости и затрат. Модель демонстрирует высокую эффективность в задачах программирования и агентного управления, сопоставимую с проприетарными решениями уровня Claude Opus 4.8 и GPT-5.5.

Контекст

Архитектура модели базируется на оптимизированном MTP-слое и инновационной технологии IndexShare. Это позволяет эффективно обрабатывать экстремально длинные контексты, что ранее было прерогативой исключительно закрытых коммерческих API.

Почему это важно для индустрии

Появление мощной open-source модели с поддержкой 1M контекста существенно снижает порог входа для создания автономных ИИ-агентов, способных анализировать целые репозитории кода. Это стимулирует переход от традиционных RAG-систем к методам Full-context Reasoning и позволяет компаниям внедрять сложные инструменты разработки без зависимости от сторонних проприетарных API.

Почему это важно для пользователей

Пользователи получают возможность запускать сверхмощные модели локально (через vLLM, SGLang и другие движки) или использовать их через API для глубокого анализа огромных массивов данных. Это критически важно для разработчиков, работающих со сложными программными системами и обширной документацией.

Что пока неизвестно / ограничения

Наблюдается разница в фокусе восприятия технологии: от научной новизны архитектуры до вопросов операционных рисков и юридической ответственности за использование открытых весов в коммерческих продуктах.

Источники

Автор

Look at AI, редакция