🎨 Lightricks выпустила Wan2.2-NVFP4-Sparse — экстремально быструю версию модели генерации видео Wan 2.2 (14B параметров).

Модель использует квантование NVFP4 и разреженное внимание (Sparse Attention), оптимизированные под архитектуру NVIDIA Blackwell. Инференс сокращен до 4 шагов, что дает ускорение в 50-60 раз: генерация 720p занимает всего 45 секунд вместо 2668 секунд на RTX 5090.

🌍 Это демонстрирует возможности глубокой оптимизации под новое поколение GPU (Blackwell), делая тяжелые видео-модели пригодными для работы в реальном времени.

👤 Теперь создание качественного видео высокого разрешения может занимать меньше минуты вместо десятков минут, что радикально меняет рабочий процесс в AI-продакшене.

Источник 1: https://huggingface.co/lightx2v/Wan2.2-NVFP4-Sparse