🤖 Qwen-AgentWorld обошёл Claude Opus и GPT-5.4

Команда Qwen представила Qwen-AgentWorld — новые open-weight модели (35B MoE и 397B), обученные как языковые модели мира для симуляции web, terminal, coding, search, OS, Android и MCP. Модель 397B набрала 58.71 балла в бенчмарке AgentWorldBench, обойдя GPT-5.4 и Claude Opus 4.8.

🌍 Появление специализированных моделей-симуляторов позволяет масштабировать обучение агентного Reinforcement Learning (RL) в цифровых средах, обходя ограничения реальности. Это ускоряет создание универсальных ИИ-агентов с глубоким планированием.

👤 Вы можете использовать открытые веса моделей для создания собственных агентов, способных эффективно работать в терминале, браузере или ОС.

Источник 1: https://arxiv.org/abs/2606.24597 Источник 2: https://qwen.ai/blog?id=qwen-agentworld