Data Recipes для агентных моделей: представлен открытый конвейер...

Исследователи представили OpenThoughts-Agent (OT-Agent) — открытый конвейер подготовки данных, предназначенный для обучения высокоэффективных агентных моделей. Флагманская модель OpenThinkerAgent-32B на базе Qwen3-32B продемонстрировала среднюю точность 44.8% на семи бенчмарках, обойдя Nemotron-Terminal-32B.

Что произошло

Разработан OT-Agent, который использует многоэтапную фильтрацию данных для создания качественных обучающих наборов. Основной упор сделан на отбор задач по длине ответов GPT-5 и использование траекторий выполнения, состоящих из 5 и более шагов (turns), что критически важно для многократного взаимодействия в сложных сценариях.

Контекст

Традиционный подход к обучению через дистилляцию часто полагается на простую передачу знаний от сильной модели к слабой. Однако новые исследования показывают, что для агентных способностей качество синтетических данных определяется не только мощью модели-учителя, но и сложностью и разнообразием траекторий выполнения задач.

Почему это важно для индустрии

Работа меняет парадигму обучения: эффективность агентных моделей теперь связывается с управлением сложностью траекторий, а не только с brute-force масштабированием моделей. Это открывает путь к созданию высококачественных специализированных моделей в open-source сегменте без прямой зависимости от самых мощных проприетарных API.

Почему это важно для пользователей

Для разработчиков и энтузиастов это означает доступ к открытому пайплайну, позволяющему создавать автономных ИИ-агентов для программирования и работы в терминале. Это снижает порог входа в создание сложных систем, не требуя использования закрытых и дорогих API.

Что пока неизвестно / ограничения

Практическая применимость метода может быть ограничена скоростью обновления базовых открытых моделей, таких как семейства Qwen3/Qwen3.5.

Источники

Автор

Look at AI, редакция