🎙 Голосовой AI в реальном времени: новый open-source стек

Hugging Face и Cerebras представили модульную систему для создания голосовых AI-агентов с минимальной задержкой. Стек объединяет распознавание Nvidia Parakeet, мультимодальную Gemma 4 31B (через быстрый инференс Cerebras) и синтез голоса Alibaba Qwen3TTS. Технология уже используется в роботах Reachy Mini для живого диалога.

🌍 Переход к открытым модульным стекам позволяет снизить задержки (latency) до уровня, необходимого для Embodied AI (робототехники), где мгновенная реакция критична.

👤 Теперь можно создавать высокоскоростных голосовых помощников на открытых моделях, делая персональных AI-агентов доступнее и отзывчивее.

Источник 1: https://huggingface.co/blog/cerebras-gemma4-voice-ai Источник 2: https://github.com/huggingface/speech-to-speech