← heapsort-ai

Ollama

56 items

DOCDEV.to AI·11/5/2026

How to Deploy Llama 3.2 with Ollama + WebSocket Streaming on a $5/Month DigitalOcean Droplet: Real-Time Inference at 1/200th Claude Cost

Este artículo explica cómo desplegar Llama 3.2 con Ollama y streaming WebSocket en un Droplet de DigitalOcean de 5 $/mes, permitiendo inferencia en tiempo real a una fracción del coste de las APIs comerciales de IA. Detalla una solución de bajo coste para construir un endpoint LLM listo para producción, evitando los altos gastos de servicios como Claude o GPT-4.

27
ARTICLEDEV.to AI·30/4/2026

BizNode sends personalized follow-up emails automatically to every lead your bot captures — nurture prospects while you sleep

BizNode es un operador de negocios de IA autónomo que funciona localmente sin dependencia de la nube, ofreciendo control, privacidad y previsibilidad de costos. Utiliza un bot de IA de Telegram con Ollama Qwen3.5 y un sistema de memoria semántica Qdrant RAG para capturar leads e interactuar con usuarios, manteniendo todos los datos privados en su máquina.

27
ARTICLEDEV.to AI·hace 21d

What I shipped during I/O 2026 week: Gemma 4 on Ollama with a five-piece safety stack

Durante la semana de Google I/O 2026, el autor implementó con éxito Gemma 4 en Ollama, utilizando una "pila de seguridad de cinco piezas" para abordar desafíos comunes con modelos de 2B parámetros. Esta configuración permitió la operación de un bucle de agente de investigación al mitigar problemas como el formato JSON incorrecto y las alucinaciones de argumentos de herramientas.

27
ARTICLEDEV.to AI·15/4/2026

How to Set Up a Free Coding Agent on Your Machine in 10 Minutes

Este artículo detalla cómo configurar un agente de codificación gratuito y de código abierto localmente en solo 10 minutos, haciendo hincapié en la privacidad de los datos y la eliminación de costos recurrentes. Utiliza herramientas como Ollama para ejecutar modelos de IA directamente en la máquina del usuario, permitiendo la lectura, escritura de código y ejecución de comandos.

27
DOCDEV.to AI·hace 9d

How to Deploy Llama 3.2 with Ollama + Kubernetes on a $8/Month DigitalOcean Droplet: Production-Grade Multi-Node Inference at 1/150th Claude Cost

El contenido detalla cómo implementar un clúster de inferencia Llama 3.2 utilizando Ollama y Kubernetes en un Droplet de DigitalOcean de $8/mes. Esta guía busca ofrecer una alternativa rentable a las API de IA comerciales, permitiendo una inferencia multi-nodo de grado de producción con mejor latencia y sin límites de velocidad.

27