Исследователи из Thinking Machines Lab совместно с Bridgewater AIA Labs представили новый метод обучения моделей на основе экспертных суждений для решения сложных финансовых задач. Использование базовой модели Qwen3-235B с применением специализированного рецепта обучения позволило создать систему, которая значительно превосходит существующие frontier-модели в узких доменах при радикальном снижении затрат.



Что произошло
В ходе исследования была продемонстрирована работа специализированного пайплайна, включающего Interleaved Batching, CISPO loss и On-Policy Distillation. Применение этих методов на базе Qwen3-235B позволило достичь точности в 84.7%, что на 29.8% выше показателей стандартных frontier-моделей. При этом стоимость инференса (inference cost) сократилась в 13.8 раза.
Контекст
Традиционный подход к обучению LLM ориентирован на массовый сбор данных из открытого интернета, что ведет к созданию универсальных, но менее точных в узких нишах моделей. Новый подход предлагает переход к парадигме «дифференцированного интеллекта» (differentiated intelligence), где фокус смещается с объема параметров на качество «сигнала» через использование экспертных суждений и процессов Human-in-the-loop.
Почему это важно для индустрии
Кейс подтверждает жизнеспособность стратегии вертикального AI: создание узкоспециализированных систем становится экономически и технически более выгодным, чем использование универсальных гигантских моделей. В индустрии намечается сдвиг от гонки масштабирования параметров (scaling laws) к гонке качества экспертных данных и эффективности методов обучения на них.
Почему это важно для пользователей
Для бизнеса это означает возможность внедрения высокоточных кастомных решений для критически важных процессов, таких как финансовая аналитика, комплаенс и риск-менеджмент. Компании смогут проектировать эффективные внутренние системы, которые будут работать точнее и значительно дешевле, чем использование публичных API от OpenAI или Anthropic.
Что пока неизвестно / ограничения
Существует критический юридический риск, связанный с вопросами интеллектуальной собственности (IP) при использовании закрытой корпоративной экспертизы в качестве обучающего сигнала для моделей.
Источники
Автор
Look at AI, редакция
