🤖 Miso Labs представила MisoTTS 8B
Это open-source модель для высококачественной генерации разговорной речи. Она использует архитектуру RVQ Transformer с бэкбоном Llama-8B и компактным аудиодекодером Llama-300M, обеспечивая задержку в 110 мс.
🌍 MisoTTS задает новый стандарт для голосовых ИИ-агентов, позволяя работать в реальном времени и обеспечивая возможность локального развертывания для сохранения конфиденциальности.
👤 Теперь можно создавать сверхбыстрых голосовых помощников на базе open-source моделей, которые практически не отличимы от живого общения и не требуют облачных API.
Источник 1: https://github.com/MisoLabsAI/MisoTTS Источник 2: https://www.misolabs.ai/