← heapsort-ai

cloud computing

131 items

RESEARCHDEV.to AI·8/5/2026

Model Showdown: Benchmarking Local vs Cloud LLMs on a Real Coding Task

El artículo describe un benchmark que compara LLMs locales ejecutándose en hardware de consumidor (Ollama en RTX 5090) con modelos basados en la nube de Anthropic para una tarea de codificación real. El objetivo era determinar si los modelos locales podían producir código igual de correcto, rápido y completo para una aplicación CLI de tareas en Python con persistencia SQLite.

27
DOCAWS Machine Learning Blog·7/5/2026

Secure short-term GPU capacity for ML workloads with EC2 Capacity Blocks for ML and SageMaker training plans

Esta publicación explica cómo asegurar capacidad de GPU a corto plazo para cargas de trabajo de ML utilizando EC2 Capacity Blocks para ML y planes de entrenamiento de SageMaker de Amazon. Estas soluciones abordan los desafíos de disponibilidad de GPU para validación de modelos, pruebas de carga y talleres.

27
RESEARCHarXiv CS.LG·4/5/2026

Cloud Is Closer Than It Appears: Revisiting the Tradeoffs of Distributed Real-Time Inference

Este artículo revisita la viabilidad de la inferencia basada en la nube para sistemas ciberfísicos sensibles a la latencia, desafiando la suposición de que el procesamiento en el dispositivo es siempre superior. Demuestra que las plataformas en la nube de alto rendimiento pueden igualar o superar el rendimiento en el dispositivo para tareas de control en tiempo real, amortizando los retrasos de la red y las colas.

27
CASEDEV.to AI·28/4/2026

I Built a 24/7 AI Agent System on a $6/Month VPS — Here's the Stack

Este contenido describe la configuración de un sistema de agente de IA autónomo 24/7 funcionando en un VPS de $6/mes, utilizando OpenClaw, DeepSeek V4 Pro, Playwright y Docker. El sistema automatiza la publicación de contenido en redes sociales, artículos, la gestión de tiendas y promociones, demostrando un ahorro de costes significativo en comparación con otros modelos.

27
RESEARCHDEV.to AI·hace 13d

Kuwait AI Data Center Market: The Cloud Race Moves Into Smart Infrastructure | Ken Research

El mercado de centros de datos de Kuwait está pasando a infraestructuras listas para IA y habilitadas para la nube, con un valor de 180 millones de USD, impulsado por cargas de trabajo de IA e iniciativas de ciudades inteligentes. Esta evolución representa una oportunidad para varios sectores de construir infraestructuras inteligentes que soporten el procesamiento de IA y servicios digitales de baja latencia.

27
DOCDEV.to AI·28/4/2026

How to Deploy Phi-3.5 Mini with vLLM on a $5/Month DigitalOcean Droplet: Lightweight Production Inference Under $60/Year

Este artículo guía a los usuarios en el despliegue del LLM Phi-3.5 Mini de Microsoft con vLLM en un Droplet de DigitalOcean de $5/mes. La configuración ofrece inferencia de producción ligera por menos de $60 anuales, buscando reducir drásticamente los costos en comparación con las costosas APIs de LLM comerciales.

27
NEWSOpenAI Blog·hace 8d

OpenAI frontier models and Codex are now available on AWS

Los modelos frontera y Codex de OpenAI ya están generalmente disponibles en AWS, ofreciendo a las empresas una nueva vía para construir con OpenAI a través de los entornos, controles y flujos de trabajo de adquisición de AWS que ya utilizan. Los clientes pueden empezar con OpenAI en AWS y pasar más rápido de la evaluación a la producción.

27
NEWSAWS Machine Learning Blog·5/5/2026

Introducing OS Level Actions in Amazon Bedrock AgentCore Browser

Amazon Bedrock AgentCore Browser presenta ahora "OS Level Actions", que permite a los agentes interactuar directamente con el sistema operativo y el contenido visible en pantalla, no solo a través de la capa web. Esta nueva capacidad mejora la observación, el razonamiento y la acción de los agentes combinando capturas de pantalla de escritorio completo con control de ratón y teclado a nivel del SO.

27