Microsoft представила специализированного GUI-агента GELab-Zero-4B-preview-Sico-Evolution с 4 миллиардами параметров. Благодаря использованию LoRA-адаптации на траекториях взаимодействия с Microsoft Edge и Copilot, модель демонстрирует выдающиеся результаты в управлении интерфейсами, конкурируя с крупнейшими проприетарными решениями.


Что произошло
Разработчики из Microsoft представили модель GELab-Zero-4B-preview-Sico-Evolution, предназначенную для автоматизации действий в графических интерфейсах. Применение итеративного конвейера эволюции GUI-моделей позволило увеличить показатель успешности задач (Task Success Rate) с базовых 39,8% до 82,9%. Этот результат превосходит показатели таких моделей, как gpt-5.4 (79,7%) и Claude-Opus-4.7 (82,1%) в рамках тестирования управления интерфейсом.
Контекст
В основе успеха лежит метод LoRA-адаптации, обучающий модель на конкретных траекториях взаимодействия с экосистемами Microsoft Edge и Copilot. Это позволяет маленькой модели (4B параметров) достигать высокой точности в узкоспециализированной области Computer Use, не требуя при этом масштабов универсальных гигантских LLM.
Почему это важно для индустрии
Прорыв подтверждает гипотезу о том, что специализированные малые модели (SLM) могут быть эффективнее универсальных гигантов в задачах Computer Use. Это меняет экономику индустрии, предлагая путь к созданию дешевых, быстрых и эффективных агентов с низким latency, что снижает порог входа для разработки ИИ-ассистентов и уменьшает зависимость от закрытых API.
Почему это важно для пользователей
Для конечных пользователей это означает приближение эры полноценных ИИ-помощников, которые смогут работать локально на пользовательских устройствах. Такие агенты смогут самостоятельно выполнять сложные действия в браузерах и приложениях, имитируя движения человека, обеспечивая высокую автономность при сохранении приватности.
Что пока неизвестно / ограничения
Текущая версия проекта является preview-релизом, что требует дополнительной проверки надежности в реальных production-средах. Также существуют риски конфиденциальности и интеллектуальной собственности при обучении моделей на траекториях взаимодействия внутри закрытых экосистем.
Источники
Автор
Look at AI, редакция
