VibeThinker-3B: прорыв в области сверхмалых рассуждающих моделей

Компания WeiboAI представила VibeThinker-3B — компактную языковую модель с 3 миллиардами параметров, способную демонстрировать уровень рассуждений, сопоставимый с флагманскими системами в специализированных STEM-задачах.

Что произошло

Разработанная на базе Qwen2.5-Coder-3B, модель VibeThinker-3B использует метод обучения Spectrum-to-Signal Principle (SSP) и стратегию тестирования Claim-Level Reliability Assessment (CLR). Это позволило ей достичь выдающихся результатов на олимпиадных бенчмарках: 97.1 балла на AIME26 и 95.4 балла на HMMT25.

Контекст

VibeThinker-3B является частью растущего тренда на экстремальную специализацию Small Language Models (SLM). Вместо стремления к универсальности, такие модели фокусируются на задачах с верифицируемым результатом, такими как программирование, математика и другие STEM-дисциплины.

Почему это важно для индустрии

Выход модели доказывает, что качество логического вывода (reasoning) может быть достигнуто в сверхмалых весах. Это радикально снижает стоимость и требования к вычислительным ресурсам (TCO), позволяя создавать высокоточные специализированные инструменты вместо использования тяжелых и дорогих облачных API.

Почему это важно для пользователей

Для конечных пользователей это означает возможность запускать мощные «рассуждающие» AI-агенты локально на обычном потребительском железе. Это открывает путь к интеграции высокоточных логических модулей непосредственно в рабочие процессы, такие как IDE или научное ПО, без зависимости от интернета и облачных провайдеров.

Что пока неизвестно / ограничения

Модель ориентирована на верифицируемые задачи, что делает её идеальной для кодинга и математики, но может ограничивать её эффективность в творческих или энциклопедических сценариях.

Источники

Автор

Look at AI, редакция