Компания xAI представила в бета-версии Voice Agent Builder — инструмент для быстрого создания голосовых ИИ-агентов на базе технологии Grok Voice без необходимости написания кода. Платформа позволяет интегрировать агентов с внешними сервисами и базами знаний, обеспечивая естественное голосовое взаимодействие.
Что произошло
xAI выпустила no-code платформу Voice Agent Builder, которая использует нативную технологию Grok Voice для создания голосовых агентов. Система поддерживает более 80 предустановленных голосов и функцию клонирования собственного голоса по 120-секундному образцу. Агенты могут быть интегрированы с такими инструментами, как Gmail, Notion и Outlook, через Model Context Protocol (MCP). При регистрации пользователям предоставляется бесплатный номер телефона для совершения звонков агентом, а стоимость использования составляет 0.05$ за минуту.
Контекст
Разработка голосовых интерфейсов традиционно опиралась на раздельный конвейер обработки сигналов: распознавание речи (STT), обработку текста большой языковой моделью (LLM) и синтез речи (TTS). Переход xAI к архитектуре speech-to-speech через Grok Voice позволяет обрабатывать аудио напрямую, что критически важно для снижения задержек и сохранения интонаций.
Почему это важно для индустрии
Для индустрии ИИ это означает переход от модульных текстоцентричных систем к нативным мультимодальным решениям. Использование MCP в голосовых агентах превращает их из простых собеседников в операционных помощников, способных управлять бизнес-процессами. Это может привести к консолидации рынка вокруг единых speech-to-speech моделей, делая старые STT/TTS стеки менее конкурентоспособными.
Почему это важно для пользователей
Пользователи и малый бизнес получают возможность развернуть полноценного ИИ-секретаря или службу поддержки всего за 2 минуты без привлечения разработчиков. Низкий порог входа и доступная стоимость делают автоматизацию клиентского сервиса и записи на прием доступной для широкого круга энтузиастов и предпринимателей.
Что пока неизвестно / ограничения
Для крупного бизнеса остаются открытыми вопросы безопасности, управления данными (governance) и соответствия корпоративным стандартам при использовании платформы.
Источники
Автор
Look at AI, редакция
