🎧 Audio-Interaction: потоковая модель для работы с аудио в реальном времени
Представлена Audio-Interaction — модель на базе Qwen2.5-Omni (3 млрд параметров). Благодаря циклу perceive-decide-respond она автономно решает, когда слушать, а когда отвечать.
🌍 Переход к стримингу позволяет создавать ИИ-агентов с минимальной задержкой, способных проактивно реагировать на звуки без команды пользователя.
👤 Это шаг к естественным помощникам, которые понимают контекст окружения.
Источник 1: https://huggingface.co/zhifeixie/AudioInteraction Источник 2: https://github.com/xzf-thu/Audio-Interaction
