🎙 X-Voice: кросс-язычное клонирование голоса на базе F5-TTS

Представлен фреймворк X-Voice, который позволяет переносить голос на 30 различных языков в режиме zero-shot. Модель с 0,4 млрд параметров использует IPA для унификации произношения, что минимизирует акцент при переносе.

🌍 Технология решает проблему «утечки акцента» (accent leakage), обеспечивая высокое качество синтеза даже на основе неструктурированных аудиоданных.

👤 Пользователи могут создать цифровой слепок своего голоса и заставить его «говорить» на десятках языков, сохраняя уникальную интонацию без посторонних акцентов.

Источник 1: https://github.com/sunnyxrxrx/X-Voice Источник 2: https://arxiv.org/abs/2605.05611