Администрация Рио-де-Жанейро представила Rio 3.5 Open 397B — масштабную мультимодальную языковую модель, построенную на архитектуре Mixture-of-Experts (MoE) и обладающую экстремально длинным контекстным окном.

image
image
image

Что произошло

Модель Rio 3.5 Open 397B была разработана путем слияния Nex-N2-Pro и Qwen3.5-397B-A17B с применением метода On-Policy Distillation для повышения качества. Несмотря на общий объем в 397 млрд параметров, благодаря архитектуре MoE в каждый момент времени задействовано около 17 млрд параметров. Модель поддерживает контекстное окно объемом до 1 010 000 токенов и распространяется под свободной лицензией MIT.

Контекст

Разработка опирается на использование продвинутых методов передачи знаний от более мощных систем к базовым моделям семейства Qwen. Применение архитектуры MoE позволяет эффективно управлять огромным количеством параметров, обеспечивая высокую производительность при меньших вычислительных затратах на один токен по сравнению с плотными моделями аналогичного масштаба.

Почему это важно для индустрии

Появление мощного решения формата Open Weights с поддержкой сверхдлинного контекста усиливает конкуренцию с проприетарными системами уровня GPT-4. Это демонстрирует эффективность дистилляции знаний и открывает путь к созданию высокопроизводительных локальных аналитических систем, снижая зависимость бизнеса от закрытых API.

Почему это важно для пользователей

Для разработчиков и исследователей это означает возможность использовать возможности моделей уровня SOTA в собственных проектах бесплатно и локально. Огромное контекстное окно позволяет обрабатывать целые книги или масштабные кодовые базы за один запрос, что делает модель идеальной для создания сложных автономных агентов и глубокого анализа данных.

Что пока неизвестно / ограничения

Практическое применение модели ограничено колоссальными требованиями к объему видеопамяти (VRAM) для ее запуска, а также отсутствием публичных данных о задержках (latency) в реальных рабочих сценариях.

Источники

Автор

Look at AI, редакция