Исследователи представили TMax — открытый метод обучения агентских моделей работе в терминале с использованием Reinforcement Learning (RL). В основе подхода лежит создание базы из 15 000 сложных задач (TMAX-15K), что позволяет превращать абстрактные навыки в измеримые цели с качественной обратной связью.


Что произошло
В рамках исследования была обучена модель с 9 миллиардами параметров, которая продемонстрировала результат 27% в бенчмарке TerminalBench-2.0. Метод TMax использует Reinforcement Learning для освоения сложных операций в терминале, что эффективнее стандартного этапа pre-training.
Контекст
Традиционное развитие ИИ часто фокусируется на увеличении количества параметров и объемов данных. Метод TMax предлагает смену парадигмы: переход от масштабирования весов к качественному обучению конкретным навыкам (reasoning, verification, tool-use) через структурированные задачи.
Почему это важно для индустрии
Технология открывает путь к созданию эффективных малых моделей (Small Language Models, SLM), способных конкурировать с крупными проприетарными системами в узких агентских сценариях. Это позволяет компаниям быстрее прототипировать специализированных терминальных агентов, не требуя огромных вычислительных ресурсов.
Почему это важно для пользователей
Для разработчиков и специалистов это означает возможность создания более управляемых и предсказуемых ИИ-агентов. Развитие смещается в сторону качественных «рецептов» обучения, что делает создание эффективных помощников для DevOps и системного администрирования более доступным.
Что пока неизвестно / ограничения
Текущий результат в 27% в TerminalBench-2.0 указывает на значительный технологический разрыв между исследовательским прототипом и решением, готовым к промышленной эксплуатации (production-ready).
Источники
- Tmax: A simple recipe for terminal agents
- [The Data Recipe for Teaching AI New Skills [video]](https://www.youtube.com/watch?v=I9F_VFfLTmM)
Автор
Look at AI, редакция
![The Data Recipe for Teaching AI New Skills [video]](/assets/tg-news-media/9a/9a662201826149d59610cf0e4421a0f8239fc51722f6b737880d99eb2cb7c203.jpg)