Компания WeiboAI представила VibeThinker-3B — компактную языковую модель с 3 миллиардами параметров, способную демонстрировать уровень рассуждений, сопоставимый с флагманскими системами в специализированных STEM-задачах.



Что произошло
Разработанная на базе Qwen2.5-Coder-3B, модель VibeThinker-3B использует метод обучения Spectrum-to-Signal Principle (SSP) и стратегию тестирования Claim-Level Reliability Assessment (CLR). Это позволило ей достичь выдающихся результатов на олимпиадных бенчмарках: 97.1 балла на AIME26 и 95.4 балла на HMMT25.
Контекст
VibeThinker-3B является частью растущего тренда на экстремальную специализацию Small Language Models (SLM). Вместо стремления к универсальности, такие модели фокусируются на задачах с верифицируемым результатом, такими как программирование, математика и другие STEM-дисциплины.
Почему это важно для индустрии
Выход модели доказывает, что качество логического вывода (reasoning) может быть достигнуто в сверхмалых весах. Это радикально снижает стоимость и требования к вычислительным ресурсам (TCO), позволяя создавать высокоточные специализированные инструменты вместо использования тяжелых и дорогих облачных API.
Почему это важно для пользователей
Для конечных пользователей это означает возможность запускать мощные «рассуждающие» AI-агенты локально на обычном потребительском железе. Это открывает путь к интеграции высокоточных логических модулей непосредственно в рабочие процессы, такие как IDE или научное ПО, без зависимости от интернета и облачных провайдеров.
Что пока неизвестно / ограничения
Модель ориентирована на верифицируемые задачи, что делает её идеальной для кодинга и математики, но может ограничивать её эффективность в творческих или энциклопедических сценариях.
Источники
Автор
Look at AI, редакция
