Microsoft представила GELab-Zero-4B-preview-Sico-Evolution: малая...

Microsoft представила специализированного GUI-агента GELab-Zero-4B-preview-Sico-Evolution с 4 миллиардами параметров. Благодаря использованию LoRA-адаптации на траекториях взаимодействия с Microsoft Edge и Copilot, модель демонстрирует выдающиеся результаты в управлении интерфейсами, конкурируя с крупнейшими проприетарными решениями.

Что произошло

Разработчики из Microsoft представили модель GELab-Zero-4B-preview-Sico-Evolution, предназначенную для автоматизации действий в графических интерфейсах. Применение итеративного конвейера эволюции GUI-моделей позволило увеличить показатель успешности задач (Task Success Rate) с базовых 39,8% до 82,9%. Этот результат превосходит показатели таких моделей, как gpt-5.4 (79,7%) и Claude-Opus-4.7 (82,1%) в рамках тестирования управления интерфейсом.

Контекст

В основе успеха лежит метод LoRA-адаптации, обучающий модель на конкретных траекториях взаимодействия с экосистемами Microsoft Edge и Copilot. Это позволяет маленькой модели (4B параметров) достигать высокой точности в узкоспециализированной области Computer Use, не требуя при этом масштабов универсальных гигантских LLM.

Почему это важно для индустрии

Прорыв подтверждает гипотезу о том, что специализированные малые модели (SLM) могут быть эффективнее универсальных гигантов в задачах Computer Use. Это меняет экономику индустрии, предлагая путь к созданию дешевых, быстрых и эффективных агентов с низким latency, что снижает порог входа для разработки ИИ-ассистентов и уменьшает зависимость от закрытых API.

Почему это важно для пользователей

Для конечных пользователей это означает приближение эры полноценных ИИ-помощников, которые смогут работать локально на пользовательских устройствах. Такие агенты смогут самостоятельно выполнять сложные действия в браузерах и приложениях, имитируя движения человека, обеспечивая высокую автономность при сохранении приватности.

Что пока неизвестно / ограничения

Текущая версия проекта является preview-релизом, что требует дополнительной проверки надежности в реальных production-средах. Также существуют риски конфиденциальности и интеллектуальной собственности при обучении моделей на траекториях взаимодействия внутри закрытых экосистем.

Источники

Microsoft GELab-Zero на Hugging Face

Автор

Look at AI, редакция