Разработчик lajjadred представил набор кастомных узлов comfyui-lrw-nodes для ComfyUI, которые используют принципы римановой геометрии для повышения качества видеогенерации в модели WAN2.2.

image

Что произошло

Выпущен новый инструмент comfyui-lrw-nodes, позволяющий вычислять геодезические пути в латентном пространстве модели WAN2.2. Основная функция заключается в мягком подмешивании геодезических ключевых кадров в латентный поток перед KSampler, что обеспечивает более плавную анимацию между первым и последним кадрами (First-Last Frame).

Контекст

Традиционные методы видеогенерации часто полагаются на простую линейную интерполяцию в латентном пространстве, что приводит к визуальным артефактам и искажениям при резких сменах ракурса или позы. Использование неевклидовой геометрии позволяет учитывать кривизну пространства признаков модели для более точного описания траекторий движения.

Почему это важно для индустрии

Применение геометрических методов для управления латентным пространством открывает новые пути контроля консистентности в диффузионных моделях. Это снижает зависимость от линейной интерполяции и может стать индустриальным стандартом, заменяя или дополняя существующие методы обеспечения временной связности видео.

Почему это важно для пользователей

Пользователи ComfyUI получают способ исправить критическую проблему «разваливания» картинки в середине ролика при сложных движениях. Это позволяет создавать физически корректные и плавные анимации без необходимости использования тяжелых и ресурсозатратных ControlNet-решений.

Источники

Автор

Look at AI, редакция