← heapsort-ai

Whisper

11 items

ARTICLE↑ trendingReddit r/MachineLearning·10/04/2026

Building a chatbot with ASR [P]

Um desenvolvedor busca a melhor abordagem ASR para integrar speech-to-text em um chatbot, enfrentando restrições orçamentárias e de segurança que o levam a preferir modelos auto-hospedados como Whisper em vez de APIs externas. Ele solicita insights sobre os trade-offs entre modelos locais e APIs, performance e facilidade de implantação para um lançamento de MVP.

35
ARTICLEDEV.to AI·13/04/2026

Building a Voice-Controlled Local AI Agent with Whisper, LLaMA 3 and Streamlit

EchoMemo est un agent d'IA local à commande vocale fonctionnant entièrement hors ligne, utilisant des modèles comme Whisper et Ollama pour convertir la parole en texte et comprendre l'intention de l'utilisateur. Ce projet démontre une solution pour la confidentialité, le coût, la dépendance et la latence, offrant une interface utilisateur web propre sans API ni internet après la configuration initiale.

31
ARTICLEDEV.to AI·15/04/2026

voice- Agent model

Cet article décrit la création d'un Agent d'IA moderne et réactif contrôlé par la voix, capable de comprendre le contexte et d'exécuter des tâches techniques complexes. Il détaille l'architecture, qui comprend l'utilisation du moteur d'inférence Groq LPU et de Whisper Large V3 pour une transcription vocale ultra-rapide.

27
ARTICLEDEV.to AI·13/04/2026

Building a Voice-Controlled AI Agent Using Whisper and Ollama

Cet article décrit la construction d'un agent IA à commande vocale en environnement local, utilisant Whisper pour la conversion parole-texte et Ollama pour la détection d'intention et l'exécution d'actions. L'agent automatise des tâches telles que la création de fichiers, la génération de code et la résumé, le tout géré via une interface utilisateur Streamlit.

26
ARTICLEDEV.to AI·10/04/2026

Building VoxAgent: A Local Voice-Controlled AI Agent with Whisper, Ollama, and Safe File Actions

O texto introduz o VoxAgent, um agente de IA local e controlado por voz, projetado para ir além das demos tradicionais de IA ao executar ações seguras e visíveis em uma máquina real. Ele suporta entrada de microfone, processamento local de fala, entendimento de intenção e tarefas como criação de arquivos e geração de código.

26
ARTICLEDEV.to AI·15/04/2026

Voice-Controlled AI Agent Using Whisper and Local LLM

Ce contenu décrit un agent d'IA à commande vocale construit à l'aide de Whisper et d'un LLM local (Llama3 via Ollama). Le système traite les entrées audio et textuelles, détecte l'intention de l'utilisateur et effectue des actions telles que la création de fichiers, la génération de code et la résumé, le tout conçu pour fonctionner localement sans API payantes.

24