Компания Hume AI представила Empathic Voice Interface (EVI) — инновационную систему распознавания речи формата Speech-to-Speech, которая способна анализировать не только содержание слов, но и эмоциональный подтекст через просодию, включая ритм, тон и тембр голоса.

image
image

Что произошло

Hume AI запустила технологию EVI, которая измеряет более 48 эмоций и 600 вокальных дескрипторов. Система передает эти данные через JSON-массивы, что позволяет легко интегрировать эмоциональный контекст в сторонние приложения. Благодаря работе моделей в едином сервисе, технология обеспечивает низкую задержку, необходимую для живого взаимодействия.

Контекст

Традиционные голосовые интерфейсы опираются на последовательный конвейер STT (Speech-to-Text), LLM и TTS (Text-to-Speech), что часто приводит к потере эмоциональных нюансов и высокой задержке. Решение от Hume AI переходит к мультимодальному анализу просодии непосредственно в процессе Speech-to-Speech, позволяя выявлять несоответствия между словами и интонацией пользователя.

Почему это важно для индустрии

Появление полноценных API для эмоционального анализа открывает рынок «эмпатичных» ИИ-агентов. Это создает возможности для создания новых вертикальных решений в сферах HR, медицины, EdTech и клиентской поддержки, где критически важно распознавать скрытые состояния пользователя, такие как стресс, выгорание или сарказм.

Почему это важно для пользователей

Разработчики получают готовый инструментарий для внедрения эмоционального интеллекта в свои продукты без необходимости обучения собственных тяжелых моделей анализа звука. Это позволяет создавать более человечные голосовые интерфейсы с функциями динамической подстройки тона ответа или корректного прерывания речи.

Что пока неизвестно / ограничения

Инженерные и юридические специалисты указывают на необходимость оценки вычислительной стоимости инференса (баланс задержки и затрат), а также на серьезные риски, связанные с несанкционированным профилированием биометрических данных пользователей.

Источники

Автор

Look at AI, редакция