🤖 Релиз модели Qwen3.6-34B-80L-Fable-5-Heretic

Представлена модель Qwen3.6-34B-80L-Fable-5-Heretic, которая является дистилляцией агентских траекторий Fable-5 на базе архитектуры Qwen3.6-27B. За счет увеличения числа слоев с 64 до 80 модель достигла 34 млрд параметров и улучшенных способностей к CoT-рассуждениям.

🌍 Использование гибридного внимания и MTP-весов повышает пропускную способность при работе с длинным контекстом до 256K токенов, что критично для ИИ-агентов.

👤 Модель позволяет запускать мощные логические системы локально. Благодаря оптимизации под vLLM и поддержке спекулятивного декодирования, она работает в ~2 раза быстрее аналогов.

Источник 1: https://huggingface.co/hiebo/Qwen3.6-34B-80L-Fable-5-Heretic