⚽️ ИИ-комментатор для спортивных трансляций в реальном времени
Разработчик Zico создал WorldCupVoice — систему, которая анализирует видеопоток через Agora RTC, извлекает кадры с помощью vision-моделей и генерирует эмоциональную озвучку, используя OpenAI TTS, ElevenLabs или Fish Audio.
🌍 Проект демонстрирует возможности интеграции мультимодальных LLM (Vision + TTS) в низкозадержечные real-time потоки (RTC), открывая путь к автоматизированному и персонализированному вещанию.
👤 Это делает стриминговые сервисы более интерактивными и доступными, в том числе для людей с нарушениями зрения.
Источник 1: https://github.com/zicojiao/worldcupvoice Источник 2: https://x.com/zicohacks/status/2070401037018788301
