Компания Cognition разработала Devin Fusion — новую гибридную архитектуру для автоматизации программирования, которая позволяет снизить расходы на использование ИИ на 35% согласно результатам бенчмарка FrontierCode. Система базируется на подходе «напарника» (Sidekick), разделяя задачи между сверхмощными моделями и более легкими специализированными агентами.

image

Что произошло

Cognition внедрила архитектуру Devin Fusion, которая использует динамическую маршрутизацию между моделями разного класса. Мощные LLM (например, GPT-5.5 или Claude 4.8 Opus) отвечают за высокоуровневое планирование и ревью кода, в то время как более компактные модели выполняют непосредственно написание кода и создание тестов. В сочетании со сжатием контекста это позволяет переключать модели практически без дополнительных затрат на кэширование. На бенчмарке FrontierCode архитектура показала снижение стоимости на 35%, а при использовании Fable 5 этот показатель достигает 41%. Внутри самой Cognition система уже демонстрирует 88% успешных Pull Requests.

Контекст

Традиционный подход к разработке с помощью ИИ-агентов часто опирается на одну сверхмощную модель для всех задач, что ведет к экспоненциальному росту затрат на API (TCO — Total Cost of Ownership). Переход к мульти-модельным системам (multi-model harnesses) с четким разделением ролей между «планировщиком» и «исполнителем» становится необходимым условием для масштабирования ИИ-инженерии.

Почему это важно для индустрии

Для индустрии это означает смену парадигмы: от использования монолитных моделей к оркестрации специализированных агентов. Стандартизация паттернов 'orchestrator-worker' и развитие библиотек для динамической маршрутизации запросов станут базовым уровнем для построения сложных агентских систем, позволяя масштабировать ИИ-разработку без пропорционального увеличения бюджета на вычисления.

Почему это важно для пользователей

Для разработчиков и компаний это означает появление более дешевых и эффективных инструментов вроде Devin. ИИ-агенты смогут брать на себя рутинные задачи, такие как написание тестов и рефакторинг, используя легкие модели, при этом сохраняя «интеллект» основной модели для решения сложных архитектурных проблем.

Что пока неизвестно / ограничения

Технические эксперты отмечают риск снижения производительности при работе со сложной бизнес-логикой (например, в стеках React/Redux) и возможные трудности при делегировании кросс-файловых задач, требующих глубокого понимания связей между множеством файлов.

Источники

Автор

Look at AI, редакция