На конференции Volcano Engine FORCE 2026 в Пекине компания ByteDance представила новую линейку моделей, включая видеомодель Seedance 2.5, способную создавать до 30 секунд непрерывного видео одним сегментом, а также мультимодальную модель Doubao 2.1 Pro для агентских задач и кодинга.

Что произошло
ByteDance представила видеомодель Seedance 2.5, которая поддерживает до 50 мультимодальных референсов (изображений и видео) для точного контроля стиля и консистентности. Модель позволяет генерировать до 30 секунд видео за один проход и включает функцию 3D white-box preview для планирования движения камеры. Также были анонсированы мультимодальная модель Doubao 2.1 Pro, ориентированная на кодинг и работу AI-агентов, и имиджевая модель Seedream 5.0 Pro. Публичный релиз Seedance 2.5 запланирован на начало июля 2026 года.
Контекст
Технологический сдвиг заключается в переходе от генерации коротких разрозненных клипов к созданию полноценных длинных сцен. Инновационный подход с использованием 3D-превизуализации позволяет оптимизировать вычислительные ресурсы, позволяя пользователям планировать сцену до финального рендеринга, что приближает инструменты генеративного AI к профессиональным режиссерским рабочим процессам.
Почему это важно для индустрии
Выпуск новых моделей усиливает конкуренцию с игроками вроде OpenAI и Runway, особенно в части контроля над консистентностью персонажей и стилей. Появление мощных API, таких как Doubao 2.1 Pro, способных конкурировать с Claude Opus 4.6, меняет ландшафт высокопроизводительных моделей для разработки и автоматизации сложных задач.
Почему это важно для пользователей
Для ML-исследователей и создателей контента это означает переход к парадигме 'референс + 3D-превизуализация -> видео'. Профессиональные пользователи смогут интегрировать эти инструменты в существующие пайплайны для создания более сложных и связных видеопроизведений с меньшими затратами на склейку сегментов.
Что пока неизвестно / ограничения
Для инженерного внедрения на текущий момент критически не хватает данных о стоимости инференса, задержках (latency) и наличии публичного API.
Источники
Автор
Look at AI, редакция
