Bonsai Image 4B — чудеса квантизации

🤖 Bonsai Image 4B — чудеса квантизации

Стартап PrismML представил Bonsai Image 4B — экстремально сжатую версию модели FLUX.2 Klein 4B. Благодаря 1-битной квантизации (Gemlite INT1) Diffusion Transformer занимает всего 0,93 ГБ, а тернарная версия — 1,21 ГБ. Полный комплект с текстовым энкодером Qwen3-4B весит около 3,5 ГБ, что позволяет запускать генерацию на устройствах с 2 ГБ ОЗУ через WebGPU.

🌍 Демонстрирует возможности экстремального сжатия (8.3x относительно FP16) без потери качества, открывая путь к локальному инференсу тяжелых моделей на edge-устройствах.

👤 Теперь можно генерировать качественные изображения прямо в браузере или на смартфоне без мощных облачных GPU.

Источник 1: https://huggingface.co/prism-ml/bonsai-image-binary-4B-gemlite-1bit Источник 2: https://huggingface.co/collections/prism-ml/bonsai-image

Sources