← heapsort-ai

cloud computing

131 items

RESEARCHDEV.to AI·5/8/2026

Model Showdown: Benchmarking Local vs Cloud LLMs on a Real Coding Task

Der Artikel beschreibt einen Benchmark, der lokale LLMs auf Consumer-Hardware (Ollama auf RTX 5090) mit Cloud-basierten Modellen von Anthropic für eine reale Codierungsaufgabe vergleicht. Ziel war es herauszufinden, ob lokale Modelle Code produzieren können, der genauso korrekt, schnell und vollständig ist wie der von Cloud-Modellen, für eine Python CLI To-Do-App mit SQLite-Persistenz.

27
RESEARCHarXiv CS.LG·5/4/2026

Cloud Is Closer Than It Appears: Revisiting the Tradeoffs of Distributed Real-Time Inference

Diese Arbeit untersucht die Machbarkeit von Cloud-basierter Inferenz für latenzempfindliche cyber-physikalische Systeme neu und stellt die Annahme in Frage, dass die lokale Verarbeitung stets überlegen ist. Sie zeigt, dass Cloud-Plattformen mit hohem Durchsatz die Leistung von On-Device-Systemen für Echtzeit-Steuerungsaufgaben erreichen oder übertreffen können, indem sie Netzwerk- und Warteschlangenverzögerungen amortisieren.

27
CASEDEV.to AI·4/28/2026

I Built a 24/7 AI Agent System on a $6/Month VPS — Here's the Stack

Dieser Inhalt beschreibt die Einrichtung eines rund um die Uhr autonomen KI-Agentensystems, das auf einem $6/Monat VPS läuft und OpenClaw, DeepSeek V4 Pro, Playwright und Docker nutzt. Das System automatisiert die Veröffentlichung von Inhalten in sozialen Medien, Artikeln, die Verwaltung von Geschäften und Werbeaktionen und zeigt erhebliche Kosteneinsparungen im Vergleich zu anderen Modellen.

27
RESEARCHDEV.to AI·vor 13T

Kuwait AI Data Center Market: The Cloud Race Moves Into Smart Infrastructure | Ken Research

Kuwaits digitale Infrastruktur entwickelt sich zu KI-bereiten und cloud-fähigen Rechenzentren, wobei der Markt 180 Millionen USD beträgt, angetrieben durch KI-Workloads und Smart-City-Initiativen. Diese Entwicklung bietet verschiedenen Sektoren die Möglichkeit, intelligente Infrastrukturen aufzubauen, die KI-Verarbeitung und digitale Dienste mit geringer Latenz unterstützen.

27
DOCDEV.to AI·4/28/2026

How to Deploy Phi-3.5 Mini with vLLM on a $5/Month DigitalOcean Droplet: Lightweight Production Inference Under $60/Year

Dieser Artikel leitet Benutzer an, wie Microsofts Phi-3.5 Mini LLM mit vLLM auf einem 5 $/Monat DigitalOcean Droplet bereitgestellt wird. Das Setup bietet leichte Produktionsinferenz für unter 60 $ jährlich und zielt darauf ab, die Kosten im Vergleich zu teuren kommerziellen LLM-APIs drastisch zu senken.

27
NEWSOpenAI Blog·vor 8T

OpenAI frontier models and Codex are now available on AWS

Die fortschrittlichen Modelle und Codex von OpenAI sind jetzt allgemein auf AWS verfügbar, was Unternehmen einen neuen Weg bietet, mit OpenAI über ihre bestehenden AWS-Umgebungen, Kontrollen und Beschaffungsabläufe zu entwickeln. Kunden können schnell mit OpenAI auf AWS starten und den Übergang von der Evaluierung zur Produktion beschleunigen.

27
NEWSAWS Machine Learning Blog·5/5/2026

Introducing OS Level Actions in Amazon Bedrock AgentCore Browser

Der Amazon Bedrock AgentCore Browser führt jetzt „OS Level Actions“ ein, die es Agenten ermöglichen, direkt mit dem Betriebssystem und dem auf dem Bildschirm sichtbaren Inhalt zu interagieren, nicht nur über die Webebene. Diese neue Funktion verbessert die Beobachtungs-, Denk- und Handlungsfähigkeit von Agenten durch die Kombination von vollständigen Desktop-Screenshots mit Maus- und Tastatursteuerung auf OS-Ebene.

27