Представлена новая версия Sonilo v1.1 — специализированной AI-модели для генерации музыки на основе видеоконтента. Обновление фокусируется на улучшении ритмической и эмоциональной синхронизации, а также на возможности интеграции саундтреков без потери оригинальной речи в видео.


Что произошло
Разработчики Sonilo выпустили версию v1.1, которая существенно улучшила качество video-to-music генерации. В ходе тестов синхронизация ритма и соответствие эмоциям видео достигли показателя в 78% предпочтений пользователей. Новые возможности включают сегментированное управление через промпты для разных частей видео и функцию сохранения оригинальной речи при наложении музыки. Модель доступна через API, платформу fal.ai и ComfyUI.
Контекст
В отличие от стандартных решений text-to-music, Sonilo v1.1 ориентирована на создание семантически связанного аудиовизуального опыта. Для обеспечения коммерческой безопасности при использовании модели в профессиональном продакшене применяется лицензированный датасет от Shutterstock.
Почему это важно для индустрии
Для индустрии это означает переход от простого наложения фонового шума к глубокой автоматизации саунд-дизайна. Использование лицензированных данных гарантирует юридическую чистоту контента, а доступность через API и ComfyUI позволяет встраивать генерацию аудио в автоматизированные рабочие процессы видеопроизводства (workflow 'video-to-ready-video').
Почему это важно для пользователей
Создатели контента — от блогеров до рекламных агентств — получают инструмент для быстрого создания профессиональных саундтреков. Автоматизация процессов синхронизации и приглушения музыки (ducking) под голос значительно сокращает время на ручной аудиомонтаж в таких форматах, как влоги, туториалы и рекламные ролики.
Что пока неизвестно / ограничения
Техническая оценка указывает на отсутствие подробных данных о фундаментальной научной новизне архитектуры; обновление характеризуется скорее как качественное продуктовое улучшение существующих механизмов.
Источники
Автор
Look at AI, редакция
