← heapsort-ai

voice control

12 items

ARTICLEDEV.to AI·13/04/2026

Building a Voice-Controlled Local AI Agent with Whisper, LLaMA 3 and Streamlit

O EchoMemo é um agente de IA local controlado por voz que opera totalmente offline, utilizando modelos como Whisper e Ollama para converter fala em texto e compreender a intenção do usuário. Este projeto demonstra uma solução para privacidade, custo, dependência e latência, oferecendo uma interface web limpa sem a necessidade de APIs ou internet após a configuração inicial.

31
ARTICLEDEV.to AI·15/04/2026

Local Voice Controlled AI Agent

Este conteúdo descreve um agente de IA local controlado por voz, criado pelo autor, que executa ações diretamente na máquina do usuário. Ele pode criar arquivos, gerar código, abrir aplicativos e navegar na web, diminuindo a distância entre um pensamento e uma ação no computador.

27
ARTICLEDEV.to AI·13/04/2026

Building a Voice-Controlled Local AI Agent

O artigo narra o desafio de construir um agente de IA local controlado por voz em uma máquina Windows com CPU-only, destacando a lentidão inicial do modelo Whisper para transcrição. O autor descreve a jornada de superação de obstáculos, desde a escolha da arquitetura até o redesign da UI, para alcançar uma experiência fluida.

26
ARTICLEDEV.to AI·15/04/2026

🎙️ Building a Voice-Controlled AI Agent with Tool Execution

Este artigo detalha a construção de um agente de IA controlado por voz que pode entender comandos, executar ferramentas como criação de arquivos ou geração de código, e responder naturalmente através de uma interface web. O sistema emprega OpenAI Whisper para conversão de fala em texto, um LLM para tomada de decisões e Streamlit para a interface de usuário.

26
ARTICLEDEV.to AI·11/04/2026

AI VOICE AGENT USING GROQ API

VoiceAgent AI é um agente de IA local controlado por voz que utiliza a API Groq para transcrição de áudio (Whisper) e classificação de intenção (LLaMA). Ele processa entrada de áudio, executa ferramentas locais e apresenta tudo em uma interface Streamlit.

23
ARTICLEDEV.to AI·12/04/2026

VOICE CONTROLLED LOCAL AI AGENT

O conteúdo descreve um agente de IA local controlado por voz, desenvolvido pelo autor, que utiliza reconhecimento de fala e um LLM local (Llama3 via Ollama) para detectar a intenção do usuário. Este agente pode realizar ações como criar arquivos, gerar código Python, resumir texto e responder a chats, exibindo os resultados em uma interface Streamlit.

23