Ollama

56 items

DOCDEV.to AI·vor 24T

Productionizing Ollama: Rate Limits, Cloud Fallback, and Cost Guardrails

Dieser Artikel behandelt die Herausforderungen bei der Produktionsreife von Ollama für die Bewältigung gleichzeitiger Benutzer, wobei der Fokus auf Ratenbegrenzungen, Cloud-Fallback und Kostenschutz liegt. Er bietet Lösungen für Probleme wie Anfragenwarteschlangen, Latenzspitzen und mangelnde Budgetkontrolle beim lokalen Betrieb von LLMs.

cost management LLMs rate limits production

DOCDEV.to AI·vor 25T

Run Gemma 4 on Your Laptop — A Hands-On Guide to Google's Latest Open Multimodal LLM

Diese praktische Anleitung beschreibt, wie Googles Gemma 4, ein offenes multimodales LLM, in etwa 5 Minuten mit Ollama auf Ihrem Laptop eingerichtet und ausgeführt werden kann. Sie behandelt das Verständnis der Modellarchitektur, die Interaktion über das Terminal, das Senden von Bildern und die Nutzung des "Denkmodus".

Ollama Gemma 4 open-source AI learning

ARTICLEKDNuggets·vor 12T

Tweaking Local Language Model Settings with Ollama

Dieser Artikel untersucht ausführlich die Konfigurations-Engine von Ollama und erklärt, wie lokale Sprachmodellparameter feinabgestimmt werden können.

Configuration Ollama Local LLMs Fine-tuning

Tweaking Local Language Model Settings with Ollama

DOCKDNuggets·vor 29T

Build an AI-Powered Learning Management System That Actually Trains People

Dieser Leitfaden bietet eine Schritt-für-Schritt-Anleitung für Anfänger und fortgeschrittene Entwickler, wie man ein KI-gestütztes Lernmanagementsystem von Grund auf neu aufbaut. Es werden Technologien wie Ollama, FastAPI und React verwendet.

Ollama learning FastAPI LMS

Build an AI-Powered Learning Management System That Actually Trains People

DOCDEV.to AI·4/25/2026

How to Deploy Claude API with Local Fallback on a $12/Month DigitalOcean Droplet: Hybrid Cost Optimization

Der Inhalt beschreibt, wie eine hybride LLM-API-Architektur bereitgestellt wird, die Claude mit lokalen Modellen wie Ollama zur Kostenoptimierung kombiniert. Er erläutert die Einrichtung, um Anrufe intelligent basierend auf Echtzeit-Kostenschwellen weiterzuleiten und so die Inferenzkosten erheblich zu senken.

Ollama Claude Cost Optimization AI APIs

ARTICLEDEV.to AI·4/13/2026

Building a Voice-Controlled AI Agent Using Whisper and Ollama

Dieser Artikel beschreibt den Bau eines lokal betriebenen sprachgesteuerten KI-Agenten, der Whisper für Spracherkennung und Ollama zur Intent-Erkennung und Aktionsausführung verwendet. Der Agent automatisiert Aufgaben wie Dateierstellung, Codegenerierung und Zusammenfassung, alles über eine Streamlit-Benutzeroberfläche verwaltet.

Whisper Ollama AI agent Speech-to-Text

ARTICLEDEV.to AI·4/10/2026

Building VoxAgent: A Local Voice-Controlled AI Agent with Whisper, Ollama, and Safe File Actions

O texto introduz o VoxAgent, um agente de IA local e controlado por voz, projetado para ir além das demos tradicionais de IA ao executar ações seguras e visíveis em uma máquina real. Ele suporta entrada de microfone, processamento local de fala, entendimento de intenção e tarefas como criação de arquivos e geração de código.

Controle por Voz IA Local Whisper Ollama

ARTICLEDEV.to AI·4/24/2026

A QA engineer's first AI testing project - FastAPI + local LLM + pytest

Ein Automatisierungsingenieur teilt sein erstes KI-Testprojekt, bei dem er einen FastAPI-Dienst mit einem lokalen LLM (Ollama/llama3.2) und einer Pytest-Suite erstellt hat, motiviert durch ein Jobangebot. Ziel war es, die Nuancen von KI-/LLM-Tests im Vergleich zu traditionellen UI-/API-Tests zu verstehen, wobei der anfängliche Erfolg der Suite das Lernen erschwerte.

pytest Ollama FastAPI LLM testing

ARTICLEDEV.to AI·4/9/2026

Building Tool-Using AI Agents in Go with LangChainGo

Este conteúdo descreve como construir agentes de IA úteis em um backend Go usando LangChainGo para integrar ferramentas que buscam dados e acionam ações. Ele utiliza Ollama com o modelo qwen3.5:9b para execução local, incluindo instruções de configuração e uma introdução à definição de ferramentas no LangChainGo.

LangChainGo Ollama Go programming tool-calling

ARTICLEDEV.to AI·4/14/2026

I added a local eval loop to my personal AI assistant — here's what 800 scored interactions taught me

Der Autor integrierte eine lokale Evaluationsschleife mit einem Ollama-Modell in seinen persönlichen, selbst gehosteten KI-Assistenten, um Interaktionen nach Genauigkeit, Relevanz und angemessener Zuversicht zu bewerten. Nach der Analyse von 800 Interaktionen stellten sie fest, dass kürzere, direktere Antworten durchweg höhere Bewertungen erhielten.

AI assistant self-hosted AI Ollama DSPy

ARTICLEDEV.to AI·4/14/2026

Best Open-Source Models for Hermes Agent — Self-Hosted Setup

Dieser Artikel stellt die besten Open-Source-Modelle für den Hermes Agent vor, mit Fokus auf selbstgehostete Setups, um API-Kosten zu vermeiden. Er hebt Llama 4 Maverick für allgemeine Qualität, Qwen 3 8B für Budget-VPS und Mistral Small als leichtgewichtige Option hervor, die alle für lokales Function Calling über Ollama optimiert sind.

open source models Hermes Agent Ollama self-hosting

ARTICLEDEV.to AI·4/13/2026

Build a Local RAG System with Ollama and ChromaDB in 30 Minutes

Dieser Artikel bietet eine praktische Anleitung zum Aufbau eines lokalen Retrieval Augmented Generation (RAG)-Systems. Er demonstriert die Integration von Ollama für große Sprachmodelle mit ChromaDB als Vektordatenbank, um eine schnelle Einrichtung in nur 30 Minuten zu ermöglichen.

vector database Ollama RAG ChromaDB

ARTICLEDEV.to AI·4/14/2026

Best Qwen Models for Hermes Agent — Alibaba's Models Ranked

Dieser Artikel bewertet Alibabas Qwen-Modelle für den Einsatz mit dem Hermes Agent und empfiehlt Qwen3 Max für Cloud-Bereitstellungen aufgrund seiner starken Argumentations- und Tool-Calling-Fähigkeiten. Für den lokalen Einsatz via Ollama auf 8GB RAM wird Qwen3 8B hervorgehoben, was die flexiblen Bereitstellungsoptionen der Open-Source Qwen-Modelle unterstreicht.

Alibaba Hermes Agent Ollama DashScope

ARTICLEDEV.to AI·5/3/2026

BizNode uses Ollama (Qwen3.5) running locally on your hardware — your data never leaves your machine. True AI privacy

BizNode nutzt Ollama (Qwen3.5), um lokal auf der Hardware des Benutzers zu laufen, wodurch sichergestellt wird, dass Daten niemals die Maschine verlassen. Dies bietet echte KI-Privatsphäre und hält Benutzerinformationen sicher.

Qwen3.5 Ollama privacy security

ARTICLEDEV.to AI·4/12/2026

本地运行AI模型完整指南：用Ollama在电脑上跑GPT-4级模型

Dieser Artikel ist ein umfassender Leitfaden, wie man Ollama nutzt, um große Sprachmodelle (LLMs) lokal, kostenlos und privat auszuführen. Er beschreibt detailliert den Prozess der Bereitstellung leistungsstarker KI-Assistenten auf Ihrem Personal Computer, einschließlich Hardwareanforderungen und grundlegender Befehle.

IA Local Ollama privacidade código aberto

ARTICLEDEV.to AI·4/23/2026

I Tried OpenClaw on Windows with Ollama. I was hyped… until I wasn’t.

Der Autor versuchte, OpenClaw unter Windows mit Ollama für eine Schreibherausforderung zu installieren, stieß dabei auf eine Warnung bezüglich der nativen Windows-Unterstützung und einen Fehler wegen eines fehlenden Node.js-Moduls. Dies führte zu Skepsis und einer frustrierenden ersten Erfahrung.

installation OpenClaw Ollama Windows