🤖 NVIDIA представила Nemotron 3 Ultra (550B-A55B)

Это самая мощная open-weight модель компании с гибридной архитектурой Mamba2 + Transformer. Модель содержит 550 млрд параметров (55 млрд активных) и поддерживает контекст до 1 млн токенов.

🌍 Переход к гибридным архитектурам позволяет увеличить пропускную способность инференса до 6x при сохранении точности на длинных контекстах.

👤 Модель становится мощным открытым конкурентом проприетарным решениям, особенно в задачах автономных агентов и работы с огромными объемами данных.

Источник 1: https://research.nvidia.com/labs/nemotron/files/NVIDIA-Nemotron-3-Ultra-Technical-Report.pdf Источник 2: https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16