Whisper

11 items

ARTICLEDEV.to AI·hace 2d

Free Video subtitles in seconds — no signup, no watermark, no upload

Captionly es una herramienta gratuita y sin registro para subtítulos de video que se ejecuta completamente en el navegador utilizando WebGPU, WebCodecs y Transformers.js. Esto permite un procesamiento local que garantiza privacidad, velocidad y elimina la necesidad de subir videos a servidores.

Open Source Whisper Video Processing AI

ARTICLE↑ trendingReddit r/MachineLearning·10/4/2026

Building a chatbot with ASR [P]

Um desenvolvedor busca a melhor abordagem ASR para integrar speech-to-text em um chatbot, enfrentando restrições orçamentárias e de segurança que o levam a preferir modelos auto-hospedados como Whisper em vez de APIs externas. Ele solicita insights sobre os trade-offs entre modelos locais e APIs, performance e facilidade de implantação para um lançamento de MVP.

self-hosted AI Whisper Chatbot Speech-to-Text

ARTICLEDEV.to AI·13/4/2026

Building a Voice-Controlled Local AI Agent with Whisper, LLaMA 3 and Streamlit

EchoMemo es un agente de IA local controlado por voz que funciona completamente sin conexión, utilizando modelos como Whisper y Ollama para convertir voz a texto y comprender la intención del usuario. Este proyecto demuestra una solución para la privacidad, el costo, la dependencia y la latencia, ofreciendo una interfaz web limpia sin necesidad de APIs o internet después de la configuración inicial.

Whisper Llama 3 Streamlit Local AI

ARTICLEDEV.to AI·12/4/2026

Creating an Offline AI Voice Agent Using Whisper and Ollama

El artículo describe la creación de un Agente de Voz con IA completamente offline, capaz de escuchar, comprender intenciones y ejecutar operaciones. Este sistema innovador funciona sin depender de APIs de pago, utilizando el modelo Whisper para el reconocimiento de voz y la detección de intenciones basada en reglas.

Whisper AI Voice Agent Speech-to-Text offline AI

ARTICLEDEV.to AI·15/4/2026

voice- Agent model

Este artículo describe la creación de un Agente de IA Controlado por Voz moderno y receptivo, capaz de comprender el contexto y realizar tareas técnicas complejas. Detalla la arquitectura, que incluye el uso del motor de inferencia Groq LPU y Whisper Large V3 para una transcripción de voz a texto ultrarrápida.

Whisper AI agent Groq LPU Speech-to-Text

ARTICLEDEV.to AI·12/4/2026

Building a Voice-Controlled Local AI Agent with Groq Whisper and Llama 3.3-70b

Este artículo describe la construcción de un agente de IA local controlado por voz, utilizando Groq, Whisper y Llama 3.3-70b para la detección de intenciones y ejecución de acciones. Aborda la arquitectura, los modelos seleccionados y los desafíos al crear un pipeline con componentes de Speech-to-Text y Detección de Intención.

Groq Whisper Llama 3 AI agent

ARTICLEDEV.to AI·10/4/2026

How AI is Changing Video Editing: Whisper, MediaPipe, and the Future of Short-Form Content

Este artigo explora como a inteligência artificial está transformando a edição de vídeo, automatizando tarefas como transcrição e detecção de cenas, antes feitas manualmente. Essa automação é essencial para suprir a demanda massiva por conteúdo de formato curto em plataformas como TikTok e YouTube Shorts.

Whisper MediaPipe short-form content AI

ARTICLEDEV.to AI·13/4/2026

Building a Voice-Controlled AI Agent Using Whisper and Ollama

Este artículo describe la construcción de un agente de IA controlado por voz en un entorno local, utilizando Whisper para la conversión de voz a texto y Ollama para la detección de intenciones y la ejecución de acciones. El agente automatiza tareas como la creación de archivos, la generación de código y el resumen, todo gestionado a través de una interfaz de usuario de Streamlit.

Whisper Ollama AI agent Speech-to-Text

ARTICLEDEV.to AI·10/4/2026

Building VoxAgent: A Local Voice-Controlled AI Agent with Whisper, Ollama, and Safe File Actions

O texto introduz o VoxAgent, um agente de IA local e controlado por voz, projetado para ir além das demos tradicionais de IA ao executar ações seguras e visíveis em uma máquina real. Ele suporta entrada de microfone, processamento local de fala, entendimento de intenção e tarefas como criação de arquivos e geração de código.

Controle por Voz IA Local Whisper Ollama

ARTICLEDEV.to AI·15/4/2026

Voice-Controlled AI Agent Using Whisper and Local LLM

Este contenido describe un agente de IA controlado por voz construido con Whisper y un LLM local (Llama3 a través de Ollama). El sistema procesa entradas de audio y texto, detecta la intención del usuario y realiza acciones como la creación de archivos, la generación de código y el resumen, todo diseñado para funcionar localmente sin APIs de pago.

Whisper voice_ai local_llm llama3

ARTICLEDEV.to AI·10/4/2026

Building a Voice-Controlled Local AI Agent with Whisper, Groq & Streamlit

Este conteúdo descreve a construção de um agente de IA local controlado por voz, desenvolvido como uma tarefa de estágio. O agente utiliza Whisper e Groq para transcrição de fala e classificação de intenção, executando comandos como criar arquivos ou gerar código, tudo através de uma interface Streamlit.

Groq Whisper Streamlit LLM