Исследователи представили OpenThoughts-Agent (OT-Agent) — открытый конвейер подготовки данных, предназначенный для обучения высокоэффективных агентных моделей. Флагманская модель OpenThinkerAgent-32B на базе Qwen3-32B продемонстрировала среднюю точность 44.8% на семи бенчмарках, обойдя Nemotron-Terminal-32B.
Что произошло
Разработан OT-Agent, который использует многоэтапную фильтрацию данных для создания качественных обучающих наборов. Основной упор сделан на отбор задач по длине ответов GPT-5 и использование траекторий выполнения, состоящих из 5 и более шагов (turns), что критически важно для многократного взаимодействия в сложных сценариях.
Контекст
Традиционный подход к обучению через дистилляцию часто полагается на простую передачу знаний от сильной модели к слабой. Однако новые исследования показывают, что для агентных способностей качество синтетических данных определяется не только мощью модели-учителя, но и сложностью и разнообразием траекторий выполнения задач.
Почему это важно для индустрии
Работа меняет парадигму обучения: эффективность агентных моделей теперь связывается с управлением сложностью траекторий, а не только с brute-force масштабированием моделей. Это открывает путь к созданию высококачественных специализированных моделей в open-source сегменте без прямой зависимости от самых мощных проприетарных API.
Почему это важно для пользователей
Для разработчиков и энтузиастов это означает доступ к открытому пайплайну, позволяющему создавать автономных ИИ-агентов для программирования и работы в терминале. Это снижает порог входа в создание сложных систем, не требуя использования закрытых и дорогих API.
Что пока неизвестно / ограничения
Практическая применимость метода может быть ограничена скоростью обновления базовых открытых моделей, таких как семейства Qwen3/Qwen3.5.
Источники
Автор
Look at AI, редакция