hardware

55 items

NEWS↑ trendingReddit r/LocalLLaMA·hace 26d

NVIDIA Reportedly Prepares RTX 5090 Price Hike Amid Rising GDDR7 Costs (maybe RTX 50 and PRO series as well)

NVIDIA estaría preparando un aumento de precio para la RTX 5090 y posiblemente para otras series RTX 50 y PRO, debido al aumento de los costes de la memoria GDDR7. Esta noticia sugiere un potencial incremento en el precio de las próximas tarjetas gráficas de la compañía.

RTX 5090 GPUs hardware NVIDIA

NVIDIA Reportedly Prepares RTX 5090 Price Hike Amid Rising GDDR7 Costs (maybe RTX 50 and PRO series as well)

ARTICLEDEV.to AI·hace 19d

Designing with Nvidia's Ising Quantum AI: A Calibration Playbook for ML Engineers

Los modelos de IA cuántica de Ising de Nvidia son optimizadores combinatorios que asignan estados de hardware de alta dimensión a configuraciones de baja energía para una operación óptima. La producción de esta tecnología como servicio requiere una calibración cuidadosa para asegurar una convergencia fiable y evitar que los operadores la omitan.

Optimization ML Engineering hardware NVIDIA

ARTICLEDEV.to AI·hace 22d

i ran frontier ai entirely on my own hardware for months, and i can't go back

El autor ejecutó con éxito IA de vanguardia completamente en su propio hardware durante meses, motivado por frustraciones con la dependencia de la infraestructura de nube centralizada, la latencia, los costos y las preocupaciones de privacidad. Creen que la IA local representa el verdadero futuro de la tecnología.

privacy Gemma 4 security Local AI

ARTICLEDEV.to AI·23/4/2026

Agentic AI Needs Different Silicon

El contenido destaca que los nuevos chips TPU 8T y 8I de Google están diseñados específicamente para IA agentic, que opera en bucles de múltiples pasos con estado, a diferencia de la inferencia tradicional de LLM sin estado. Esto representa un cambio fundamental en la arquitectura de hardware, donde el caché KV actúa como memoria persistente crucial para los agentes que razonan y actúan a lo largo del tiempo.

AI compute Google Agentic AI hardware

ARTICLEDEV.to AI·17/4/2026

I Run 14 AI Agents 24/7 on a 16GB MacBook — Here's What Broke First

El autor ejecuta 14 agentes de IA 24/7 en un MacBook de 16GB, desafiando el consenso de que se necesita hardware potente para cargas de trabajo serias. Estos agentes, que orquestan un negocio real, se gestionan en oleadas con solo 1-3 ejecutándose simultáneamente para mantener un estado persistente.

AI orchestration LLMs Local AI hardware

ARTICLEDEV.to AI·3/5/2026

I wrote a custom CUDA inference engine to run Qwen3.5-27B on $130 mining cards

Un desarrollador creó un motor de inferencia CUDA personalizado para ejecutar con éxito el gran modelo de lenguaje Qwen3.5-27B en tarjetas gráficas de minería de bajo costo. Este enfoque innovador demuestra una optimización de hardware significativa, haciendo que los modelos de IA potentes sean más accesibles en hardware de consumo asequible.

CUDA Optimization inference hardware

ARTICLEDEV.to AI·16/4/2026

Inside NVIDIA’s $2B Marvell Deal: What NVLink Fusion Means for AI Ethernet Fabrics

El acuerdo de $2 mil millones de NVIDIA con Marvell, centrado en NVLink Fusion, es un movimiento de control de la interconexión para las redes Ethernet de IA, no solo un acuerdo de chips. Indica que los interconectores ópticos y la integración a escala de rack son el nuevo campo de batalla para la infraestructura de IA, alterando el diseño de las redes.

Networking AI infrastructure hardware

ARTICLEDEV.to AI·12/4/2026

How I Run an AI Agent 24/7 on a Mac Mini — The Full Setup

Este artículo detalla la configuración para ejecutar un agente de IA 24/7 en un Mac Mini, llamado Joey. Cubre hardware, software y costos, destacando la eficiencia energética y la rentabilidad del Mac Mini en comparación con las soluciones en la nube.

Custo-benefício AI agent Automação Mac Mini

ARTICLEDEV.to AI·hace 15d

Most people starting with local LLMs jump straight to 4-bit quantization because it's fast and uses

Este artículo compara la cuantificación de LLMs de 16, 8 y 4 bits, revelando que la de 4 bits, aunque más rápida, compromete significativamente la calidad en tareas de razonamiento y matemáticas. La verdadera compensación es entre la tarea y la precisión requerida, siendo 8 bits óptimo para tareas que exigen precisión, minimizando la pérdida de calidad con solo una ligera reducción de velocidad. La elección de la cuantificación debe basarse en la tarea y las consideraciones de hardware, no solo en el hardware.

inference speed model performance quantization hardware

ARTICLEDEV.to AI·hace 24d

Built an open-source picker that recommends the right self-hosted LLM for your hardware

Se ha desarrollado una herramienta de código abierto para recomendar modelos de lenguaje grandes (LLM) autoalojados según el hardware del usuario, como la plataforma y la VRAM disponible. El proyecto también ofrece un directorio de modelos curado, guías de instalación para Ollama, llama.cpp y LM Studio, y un glosario para principiantes.

Open Source self-hosting hardware guides

ARTICLEDEV.to AI·25/4/2026

The Rise of Local AI: Running LLMs on Your Own Hardware in 2026

Para 2026, ejecutar potentes modelos de IA localmente en hardware personal será una capacidad generalizada, ofreciendo importantes beneficios de privacidad y costo marginal cero en comparación con los servicios en la nube. Este cambio aborda las preocupaciones sobre el envío de datos sensibles a terceros y elimina las tarifas de suscripción.

privacy security Local AI hardware

ARTICLEDEV.to AI·hace 19d

The Pillars of Progress: Navigating AI Infrastructure and GPU Scaling

La Inteligencia Artificial es una fuerza transformadora, siendo las GPU cruciales para su poder computacional. Comprender la infraestructura de IA y la escalabilidad de GPU es fundamental para las organizaciones que buscan aprovechar el potencial de esta tecnología.

GPU scaling AI infrastructure hardware Computational power

NEWSDEV.to AI·7/5/2026

Nvidia Ships AI Factory Blueprints: 4-Node to 128-Cluster Specs

Nvidia lanzó tres planos validados para centros de datos de IA, desde clusters RTX PRO de 4 nodos hasta NVL72 de 128 nodos, enfocados en IA agentiva y modelos de trillones de parámetros. Estas Arquitecturas de Referencia Empresariales proporcionan diseños de infraestructura replicables para desplegar fábricas de IA.

AI models data centers AI infrastructure hardware

ARTICLEDEV.to AI·hace 9d

Best Local AI Models for Apple Silicon in 2026

El artículo aborda el cambio significativo en la ejecución local de modelos de IA en Macs con Apple Silicon, una tarea que antes requería GPUs NVIDIA dedicadas. Esta transformación es impulsada por la arquitectura de memoria unificada de Apple Silicon, que utiliza eficientemente la RAM compartida entre componentes.

mac apple-silicon Local AI hardware

DOCDEV.to AI·hace 16d

로컬 LLM 셋업 가이드 (v12)

Esta es una guía práctica para implementar LLMs locales, detallando los requisitos de hardware, sistema operativo e instalación de prerrequisitos. Compara frameworks como llama.cpp, Ollama y vLLM para diferentes necesidades de desarrollo y rendimiento.

learning guide hardware local deployment

DOCDEV.to AI·hace 18d

在老旧 AMD RX 580 (8GB) 上通过原生 Vulkan 运行 Flux Schnell (12B) + LLM — 完整架构指南 [2026]

Esta guía técnica demuestra cómo ejecutar LLMs y modelos de Stable Diffusion en una antigua GPU AMD RX 580 en 2026, sorteando las limitaciones del software de IA. Detalla el uso de Vulkan nativo con el motor ggml para una inferencia eficiente, probando la viabilidad de hardware más antiguo.

Vulkan hardware ggml AI inference

ARTICLEDEV.to AI·hace 29d

When I started running models locally, I thought quantization meant squeezing more into RAM. Turns o

El artículo desaconseja el uso predeterminado de Q4_K_M para la inferencia local de LLM, enfatizando que el rendimiento óptimo proviene de probar niveles de cuantificación adaptados a flujos de trabajo específicos. Sugiere que la cuantificación agresiva como Q3_K_S puede reducir significativamente la latencia con una pérdida de calidad imperceptible para muchas tareas, aunque la longitud del contexto presenta una compensación.

Optimization LLMs quantization hardware

NEWSThe Verge AI·hace 7d

Microsoft Build 2026: All the news about Windows, AI, RTX Spark, and more

La conferencia anual de desarrolladores Microsoft Build 2026 está a punto de comenzar, con anuncios esperados sobre nuevos modelos de IA, una "super app" de Copilot y cambios importantes en Windows 11. El evento también presentará novedades de hardware como el Surface Laptop Ultra con Nvidia RTX Spark y Project Solara, el sistema operativo de agente de IA de Microsoft.

Windows Developer Conference Microsoft AI

NEWSThe Verge AI·5/5/2026

OpenAI is reportedly launching a phone for ChatGPT

OpenAI, según informes, está acelerando el desarrollo de un teléfono para ChatGPT, su primer producto de hardware, con producción en masa prevista para principios de 2027. Se rumorea que el dispositivo utilizará un chip MediaTek Dimensity 9600 personalizado, destacando su procesador de señal de imagen.

smartphone tech news OpenAI ChatGPT

NEWSMIT Tech Review AI·21/4/2026

Analog computing from waste heat

Un equipo del MIT dirigido por Giuseppe Romano ha desarrollado un método de computación analógica que utiliza el calor residual de los dispositivos electrónicos para el procesamiento de datos, eliminando la necesidad de electricidad. Este enfoque novedoso codifica los datos de entrada sin depender de los 1 y 0 binarios.

analog computing sustainable computing Energy Efficiency hardware