Представлена новая агентная модель Qwopus-3.6-27B-Coder в формате GGUF, специально оптимизированная для работы с целыми репозиториями и выполнения сложной отладки кода. Благодаря использованию технологии Multi-Token Prediction (MTP), модель демонстрирует высокую скорость генерации и способности к глубокому логическому выводу.

Что произошло
Разработчик представил Qwopus-3.6-27B-Coder, базирующуюся на архитектуре Qwopus3.6-27B-v2. Модель поддерживает технологию Multi-Token Prediction (MTP), которая ускоряет процесс генерации примерно в 1.66 раза. Кроме того, в обучении применялся метод Trace Inversion, позволяющий модели перенимать цепочки рассуждений (CoT) от более мощных систем, таких как Claude Opus. Модель показала результаты 87,43% на MMLU-Pro и 75,25% на SWE-bench Verified.
Контекст
В основе эффективности модели лежат методы дистилляции рассуждений и оптимизация под формат GGUF, что позволяет переносить способности высокоуровневых облачных моделей на локальные устройства. Использование MTP и Trace Inversion направлено на сокращение задержек и повышение качества работы автономных агентов в задачах программирования.
Почему это важно для индустрии
Появление эффективных локальных агентных моделей среднего размера (27B) снижает критическую зависимость разработчиков и стартапов от дорогостоящих проприетарных API. Это открывает возможности для создания приватных и высокопроизводительных инструментов разработки (DevTools), которые могут быть интегрированы непосредственно в локальные IDE и CI/CD пайплайны без облачных затрат.
Почему это важно для пользователей
Пользователи могут запустить мощного ИИ-ассистента для программирования на обычном домашнем оборудовании, например, на видеокарте уровня RTX 5090. Модель способна понимать структуру всего проекта и помогать в отладке, работая быстрее стандартных решений и обеспечивая высокий уровень приватности данных.
Источники
Автор
Look at AI, редакция
