← heapsort-ai

voice control

12 items

ARTICLEDEV.to AI·13/4/2026

Building a Voice-Controlled Local AI Agent with Whisper, LLaMA 3 and Streamlit

EchoMemo es un agente de IA local controlado por voz que funciona completamente sin conexión, utilizando modelos como Whisper y Ollama para convertir voz a texto y comprender la intención del usuario. Este proyecto demuestra una solución para la privacidad, el costo, la dependencia y la latencia, ofreciendo una interfaz web limpia sin necesidad de APIs o internet después de la configuración inicial.

31
ARTICLEDEV.to AI·15/4/2026

Local Voice Controlled AI Agent

Este contenido describe un agente de IA local controlado por voz, construido por el autor, que actúa directamente en la máquina del usuario. Puede crear archivos, generar código, abrir aplicaciones y navegar por sitios web, reduciendo la brecha entre un pensamiento y una acción en el ordenador.

27
ARTICLEDEV.to AI·13/4/2026

Building a Voice-Controlled AI Agent Using Whisper and Ollama

Este artículo describe la construcción de un agente de IA controlado por voz en un entorno local, utilizando Whisper para la conversión de voz a texto y Ollama para la detección de intenciones y la ejecución de acciones. El agente automatiza tareas como la creación de archivos, la generación de código y el resumen, todo gestionado a través de una interfaz de usuario de Streamlit.

26
ARTICLEDEV.to AI·13/4/2026

Building a Voice-Controlled Local AI Agent

El artículo narra el desafío de construir un agente de IA local controlado por voz en una máquina Windows solo con CPU, destacando la lentitud inicial del modelo Whisper para la transcripción. El autor describe el viaje para superar obstáculos, desde la elección de la arquitectura hasta el rediseño de la interfaz de usuario, para lograr una experiencia fluida.

26
ARTICLEDEV.to AI·15/4/2026

🎙️ Building a Voice-Controlled AI Agent with Tool Execution

Este artículo describe la creación de un agente de IA controlado por voz que puede entender comandos, ejecutar herramientas como la creación de archivos o la generación de código, y responder de forma natural a través de una interfaz web. El sistema emplea OpenAI Whisper para la conversión de voz a texto, un LLM para la toma de decisiones y Streamlit para la interfaz de usuario.

26
ARTICLEDEV.to AI·11/4/2026

AI VOICE AGENT USING GROQ API

VoiceAgent AI es un agente de IA local controlado por voz que utiliza la API Groq para transcripción de audio (Whisper) y clasificación de intenciones (LLaMA). Procesa la entrada de audio, ejecuta herramientas locales y presenta todo en una interfaz Streamlit.

23
ARTICLEDEV.to AI·12/4/2026

VOICE CONTROLLED LOCAL AI AGENT

El contenido describe un agente de IA local controlado por voz, desarrollado por el autor, que integra el reconocimiento de voz con un LLM local (Llama3 a través de Ollama) para detectar la intención del usuario. Este agente multifuncional puede crear archivos, generar código Python, resumir texto y responder a chats, mostrando los resultados a través de Streamlit.

23