В видеогенератор Wan2GP интегрирована технология In-Context LoRA (IC-LoRA), позволяющая управлять созданием видео с помощью референсных изображений. Для работы метода требуется использование модели LTX-2 2.3 Distilled 22B и специализированного адаптера ltx-2.3-22b-ic-lora-ingredients-0.9.


Что произошло
Технология IC-LoRA внедряется в пайплайн Wan2GP, обеспечивая управление контентом через визуальные «ингредиенты» — объекты, размещенные на черном фоне. Для достижения оптимального качества генерации необходимо соблюдать строгие технические параметры: разрешение изображений 768×448 px, частота 24 FPS и длительность в 121 кадр.
Контекст
В отличие от стандартных LoRA, которые обычно используются для изменения общего стиля или «настроения» видео, IC-LoRA (In-Context LoRA) фокусируется на прецизионном управлении конкретными визуальными компонентами. Это переводит процесс из режима текстового промпт-инжиниринга в режим визуального дирижирования объектами.
Почему это важно для индустрии
Для индустрии это означает переход от промпт-центричного творчества к профессиональному VFX-пайплайну. Возможность точного управления контентом через визуальные сигналы приближает AI-видео к инструментам с управляемым ассетами, что критически важно для автоматизации производства и интеграции нейросетей в традиционные студийные процессы.
Почему это важно для пользователей
Пользователи получают гораздо более предсказуемый результат: вместо того чтобы пытаться описать нужный объект текстом, можно буквально показать его нейросети. Это существенно снижает количество неудачных генераций и сокращает время на итерации, позволяя точнее контролировать композицию и содержание видео.
Что пока неизвестно / ограничения
Наблюдается различие в фокусе обсуждения: от чисто инженерного описания пайплайна до потенциальных юридических рисков, связанных с использованием сторонних визуальных «ингредиентов» в качестве референсов.
Источники
Автор
Look at AI, редакция
