Google реструктурирует свою специализированную команду по разработке ИИ для кодинга, отказываясь от надежд на автоматическое освоение программирования базовыми моделями в пользу новой стратегии midtraining.

image

Что произошло

Компания Google проводит реорганизацию своего «strike team» по разработке ИИ для кодинга. Вместо того чтобы полагаться на то, что способности к программированию проявятся сами собой в процессе обучения базовых моделей, Google внедряет этап midtraining. Этот метод предполагает использование специализированных наборов данных в промежутке между предварительным (pre-training) и финальным (post-training) этапами обучения для повышения точности моделей в узких областях.

Контекст

Решение продиктовано необходимостью сократить технологический разрыв с конкурентами, такими как Anthropic и OpenAI. Ранее подход, ориентированный на чистое масштабирование и надежду на эмерджентные способности универсальных LLM, оказался недостаточно эффективным для сложных доменных задач. В частности, инструмент Antigravity и модель Gemini 3.5 Flash столкнулись с критикой, что вынудило компанию пересмотреть архитектуру обучения.

Почему это важно для индустрии

Этот шаг знаменует признание стратегической ошибки в подходе к обучению моделей программированию и подчеркивает растущую важность специализированных этапов обучения. Индустрия может ожидать смены парадигмы: переход от стратегии «больше данных» к созданию высококачественных промежуточных этапов обучения, что может стать индустриальным стандартом для всех узкопрофильных ИИ-агентов (медицина, право, инженерия).

Почему это важно для пользователей

Разработчики могут ожидать появления новых версий моделей Gemini с существенно улучшенными способностями к написанию кода и более глубоким пониманием логики, а не только синтаксиса. Переход к глубоко оптимизированным инструментам вместо универсальных моделей обещает более качественных специализированных ИИ-ассистентов.

Что пока неизвестно / ограничения

Существует критический риск, связанный с происхождением специализированных данных (data provenance), что требует особого контроля со стороны юридических специалистов по вопросам конфиденциальности и интеллектуальной собственности (global_ai_ip_privacy_counsel).

Источники

Автор

Look at AI, редакция