Представлена модель Agents-A1 — компактный 35B MoE агент, способный демонстрировать производительность моделей триллионного масштаба в решении сложных задач. В отличие от традиционных методов, фокус смещен с увеличения количества параметров на расширение «горизонта агента» — сложности и длины логических цепочек.

image
image

Что произошло

Разработчики представили Agents-A1, модель с архитектурой Mixture-of-Experts (MoE) на 35 миллиардов параметров. Модель прошла трехэтапную дистилляцию знаний от специализированных «учителей» в шести различных доменах и поддерживает контекстное окно объемом до 256K токенов. Инновация заключается в масштабировании сложности траекторий рассуждений вместо простого наращивания объема весов.

Контекст

Современный подход к развитию LLM опирается на Scaling Laws, где рост возможностей достигается за счет колоссального увеличения числа параметров. Agents-A1 предлагает альтернативный путь — «горизонтальное масштабирование», где эффективность повышается через усложнение когнитивных процессов и использование высококачественных дистиллированных данных, что позволяет компактным моделям конкурировать с гигантами в специализированных агентских сценариях.

Почему это важно для индустрии

Этот подход меняет экономику развертывания ИИ-агентов. Вместо гонки за количеством параметров индустрия может сфокусироваться на оптимизации «когнитивного горизонта» и сложности траекторий. Это открывает путь к созданию высокоэффективных специализированных систем, которые можно запускать на менее дорогом оборудовании, не полагаясь исключительно на сверхмощные проприетарные API.

Почему это важно для пользователей

Для конечных пользователей и разработчиков это означает появление мощных, быстрых и доступных ИИ-агентов. Высокоэффективные решения для инженерных и научных задач теперь могут работать локально или в рамках частных инфраструктур, не требуя вычислительных мощностей уровня GPT-5 или DeepSeek-V4.

Источники

Автор

Look at AI, редакция