🤖 Unsloth выпустила квантованные версии GLM-5.2 в формате GGUF.
На Hugging Face доступен широкий спектр уровней квантования: от BF16 и Q8_0 до экстремально сжатых IQ1, IQ2, IQ3 и K-Quants. Для минимизации потери качества при сильном сжатии использовалась матрица важности (imatrix).
🌍 Доступность оптимизированных форматов GGUF ускоряет внедрение передовых архитектур в локальные решения и снижает порог входа для разработчиков с ограниченными вычислительными ресурсами.
👤 Теперь мощную модель GLM-5.2 можно запускать на обычном домашнем компьютере или устройствах с малым объемом VRAM, выбирая баланс между скоростью и качеством.
Источник 1: https://huggingface.co/unsloth/GLM-5.2-GGUF/tree/main
