Audio-Interaction: потоковая языковая модель на базе Qwen2.5-Omni

🎧 Audio-Interaction: потоковая модель для работы с аудио в реальном времени

Представлена Audio-Interaction — модель на базе Qwen2.5-Omni (3 млрд параметров). Благодаря циклу perceive-decide-respond она автономно решает, когда слушать, а когда отвечать.

🌍 Переход к стримингу позволяет создавать ИИ-агентов с минимальной задержкой, способных проактивно реагировать на звуки без команды пользователя.

👤 Это шаг к естественным помощникам, которые понимают контекст окружения.

Источник 1: https://huggingface.co/zhifeixie/AudioInteraction Источник 2: https://github.com/xzf-thu/Audio-Interaction

Sources