Вышли квантованные веса в формате GGUF для высокопроизводительной модели Krea 2 (v1.0), построенной на архитектуре Diffusion Transformer (DiT) с 12–13 млрд параметров. Теперь запуск генерации изображений такого уровня возможен на потребительском оборудовании с ограниченным объемом видеопамяти через ComfyUI.

image
image
image

Что произошло

Для модели Krea 2 доступны варианты Krea 2 Base и оптимизированная Krea 2 Turbo в формате GGUF. Для полноценной работы через ComfyUI требуются специфические кастомные узлы ComfyUI-GGUF_KREA-2, а также вспомогательные компоненты: модель Qwen3-VL-4B и VAE от Qwen.

Контекст

Архитектура Diffusion Transformer (DiT) обеспечивает высокое качество генерации, но требует значительных вычислительных ресурсов. Использование формата GGUF позволяет перенести тяжелые модели с серверных GPU на домашние ПК, существенно снижая требования к VRAM без критической потери качества.

Почему это важно для индустрии

Переход крупных DiT-моделей на формат GGUF расширяет возможности локального использования нейросетей уровня Krea.ai. Это снижает порог входа для разработчиков и исследователей, подрывая монополию облачных API и позволяя внедрять качественную генерацию в локальные приложения и автономные пайплайны без зависимости от платных сервисов.

Почему это важно для пользователей

Пользователи с домашними ПК получают доступ к качеству генерации уровня профессиональных облачных сервисов. Квантованные версии позволяют экономить видеопамять, делая использование мощных нейросетей более доступным и приватным, а также снижая необходимость в дорогих подписках.

Что пока неизвестно / ограничения

Для работы требуется установка дополнительных кастомных узлов и вспомогательных моделей, что усложняет первоначальную настройку рабочего окружения.

Источники

Автор

Look at AI, редакция