Представлен проект Anti-Vocale — Android-приложение, позволяющее преобразовывать голосовые сообщения в текст полностью локально на устройстве, обеспечивая максимальную приватность и автономность.

image
image
image

Что произошло

Разработчики выпустили Anti-Vocale, мобильное приложение для Android, которое поддерживает работу широкого спектра моделей ASR (Automatic Speech Recognition), включая Whisper, Gemma, Parakeet, Qwen3-ASR и Nemotron 3.5. Пользователи могут выбирать конкретную модель через меню «Поделиться» в мессенджерах. Для корректной работы требуется смартфон с объемом оперативной памяти от 4 ГБ и около 500 МБ свободного места, хотя сами модели могут занимать до 4.2 ГБ.

Контекст

Проект реализует концепцию on-device ASR, перенося обработку речи с облачных серверов непосредственно на мобильное железо. Использование оптимизированных архитектур, таких как Parakeet TDT, и сжатых версий моделей (например, Whisper Turbo large размером около 1 ГБ), делает возможным высокоточное распознавание речи на потребительских устройствах без необходимости постоянного подключения к сети.

Почему это важно для индустрии

Развитие инструментов on-device ASR повышает приватность данных и снижает экономическую зависимость разработчиков от облачных API. Появление таких open-source решений, как Anti-Vocale, снижает порог входа для создания приватных сервисов и предоставляет платформу для тестирования различных ASR-архитектур на реальном мобильном железе в условиях отсутствия связи.

Почему это важно для пользователей

Приложение гарантирует полную конфиденциальность, так как аудиофайлы не отправляются в облако. Это полезно для тех, кто хочет иметь текстовую версию голосовых сообщений для быстрого поиска по истории или вынужден просматривать сообщения в шумных местах, при этом сохраняя возможность работать полностью офлайн.

Источники

Автор

Look at AI, редакция