🎙 Голосовое управление терминалом с помощью локального STT и Pi Agent
Разработчик представил инструмент hns, который объединяет локальное распознавание речи (faster-whisper-base) с кодинг-агентом Pi. Это позволяет генерировать shell-команды и задавать вопросы по локальным файлам голосом, выполняя весь цикл обработки данных полностью на устройстве.
🌍 Это доказывает, что локальные open-source модели (Whisper, LLM) могут эффективно заменять облачные сервисы в задачах автоматизации, снижая задержки и повышая безопасность.
👤 Пользователи получают возможность управлять терминалом без печати, сохраняя полный контроль над приватностью данных и не отправляя содержимое файлов в облако.
Источник 1: https://www.agenticcodingweekly.com/p/talking-to-my-terminal-with-local-speech-to-text-and-pi-coding-agent
