Выпуск Qwen3.6-34B-80L-Fable-5-Heretic: новая веха в дистилляции...

Представлена модель Qwen3.6-34B-80L-Fable-5-Heretic, которая сочетает в себе архитектуру Qwen3.6-27B с увеличенным количеством слоев и продвинутыми методами дистилляции агентских траекторий для качественного улучшения логического вывода.

Что произошло

Разработчики выпустили модель Qwen3.6-34B-80L-Fable-5-Heretic, представляющую собой дистилляцию 4665 агентских траекторий Fable-5. В отличие от базовой архитектуры Qwen3.6-27B, данная модель была расширена до 80 слоев, что позволило достичь ~34 млрд параметров. Обучение проводилось методом QLoRA с использованием гибридного механизма внимания (Linear/Full attention) и поддержкой Multi-Token Prediction (MTP) для ускорения инференса.

Контекст

Развитие reasoning-моделей (моделей с цепочкой рассуждений, CoT) требует не только увеличения параметров, но и качественных данных для обучения. Использование специализированных агентских траекторий позволяет переносить сложные логические паттерны в более компактные архитектуры, такие как модели среднего размера (Medium LLMs).

Почему это важно для индустрии

Применение гибридного внимания и MTP-весов существенно повышает пропускную способность при работе с длинным контекстом (до 256K токенов), что критически важно для создания автономных AI-агентов. Дистилляция сложных рассуждений в модели размером 34B открывает путь к эффективному развертыванию мощных reasoning-систем без необходимости использования сверхкрупных проприетарных моделей.

Почему это важно для пользователей

Пользователи получают возможность запускать высокопроизводительную логическую модель на собственном оборудовании среднего уровня. Благодаря оптимизации под vLLM и поддержке спекулятивного декодирования, модель работает примерно в 2 раза быстрее стандартных аналогов при сохранении высокого качества рассуждений, что делает ее идеальной для локальных исследовательских и агентских задач.

Что пока неизвестно / ограничения

Существуют риски, связанные с отсутствием официальной поддержки и потенциальной сложностью контроля модели в корпоративной среде.

Источники

hiebo/Qwen3.6-34B-80L-Fable-5-Heretic · Hugging Face

Автор

Look at AI, редакция