← heapsort-ai

voice control

12 items

ARTICLEDEV.to AI·13/04/2026

Building a Voice-Controlled Local AI Agent with Whisper, LLaMA 3 and Streamlit

EchoMemo est un agent d'IA local à commande vocale fonctionnant entièrement hors ligne, utilisant des modèles comme Whisper et Ollama pour convertir la parole en texte et comprendre l'intention de l'utilisateur. Ce projet démontre une solution pour la confidentialité, le coût, la dépendance et la latence, offrant une interface utilisateur web propre sans API ni internet après la configuration initiale.

31
ARTICLEDEV.to AI·15/04/2026

Local Voice Controlled AI Agent

Ce contenu décrit un agent IA local contrôlé par la voix, développé par l'auteur, qui agit directement sur la machine de l'utilisateur. Il peut créer des fichiers, générer du code, ouvrir des applications et naviguer sur le web, réduisant ainsi l'écart entre une pensée et une action sur l'ordinateur.

27
ARTICLEDEV.to AI·13/04/2026

Building a Voice-Controlled AI Agent Using Whisper and Ollama

Cet article décrit la construction d'un agent IA à commande vocale en environnement local, utilisant Whisper pour la conversion parole-texte et Ollama pour la détection d'intention et l'exécution d'actions. L'agent automatise des tâches telles que la création de fichiers, la génération de code et la résumé, le tout géré via une interface utilisateur Streamlit.

26
ARTICLEDEV.to AI·13/04/2026

Building a Voice-Controlled Local AI Agent

L'article raconte le défi de construire un agent d'IA local à commande vocale sur une machine Windows uniquement CPU, soulignant la lenteur initiale du modèle Whisper pour la transcription. L'auteur décrit le parcours pour surmonter les obstacles, du choix de l'architecture à la refonte de l'interface utilisateur, afin d'obtenir une expérience fluide.

26
ARTICLEDEV.to AI·15/04/2026

🎙️ Building a Voice-Controlled AI Agent with Tool Execution

Cet article détaille la création d'un agent IA à commande vocale capable de comprendre les commandes, d'exécuter des outils comme la création de fichiers ou la génération de code, et de répondre naturellement via une interface web. Le système utilise OpenAI Whisper pour la transcription vocale, un LLM pour la prise de décision et Streamlit pour l'interface utilisateur.

26
ARTICLEDEV.to AI·11/04/2026

AI VOICE AGENT USING GROQ API

VoiceAgent AI est un agent d'IA local à commande vocale utilisant l'API Groq pour la transcription audio (Whisper) et la classification d'intention (LLaMA). Il traite l'entrée audio, exécute des outils locaux et présente le tout dans une interface Streamlit.

23
ARTICLEDEV.to AI·12/04/2026

VOICE CONTROLLED LOCAL AI AGENT

Le contenu décrit un agent IA local à commande vocale, développé par l'auteur, qui intègre la reconnaissance vocale avec un LLM local (Llama3 via Ollama) pour détecter l'intention de l'utilisateur. Cet agent multifonctionnel peut créer des fichiers, générer du code Python, résumer du texte et répondre aux chats, avec des résultats affichés via Streamlit.

23