← heapsort-ai

hardware

55 items

ARTICLEDEV.to AI·hace 19d

Designing with Nvidia's Ising Quantum AI: A Calibration Playbook for ML Engineers

Los modelos de IA cuántica de Ising de Nvidia son optimizadores combinatorios que asignan estados de hardware de alta dimensión a configuraciones de baja energía para una operación óptima. La producción de esta tecnología como servicio requiere una calibración cuidadosa para asegurar una convergencia fiable y evitar que los operadores la omitan.

31
ARTICLEDEV.to AI·23/4/2026

Agentic AI Needs Different Silicon

El contenido destaca que los nuevos chips TPU 8T y 8I de Google están diseñados específicamente para IA agentic, que opera en bucles de múltiples pasos con estado, a diferencia de la inferencia tradicional de LLM sin estado. Esto representa un cambio fundamental en la arquitectura de hardware, donde el caché KV actúa como memoria persistente crucial para los agentes que razonan y actúan a lo largo del tiempo.

28
ARTICLEDEV.to AI·16/4/2026

Inside NVIDIA’s $2B Marvell Deal: What NVLink Fusion Means for AI Ethernet Fabrics

El acuerdo de $2 mil millones de NVIDIA con Marvell, centrado en NVLink Fusion, es un movimiento de control de la interconexión para las redes Ethernet de IA, no solo un acuerdo de chips. Indica que los interconectores ópticos y la integración a escala de rack son el nuevo campo de batalla para la infraestructura de IA, alterando el diseño de las redes.

27
ARTICLEDEV.to AI·hace 15d

Most people starting with local LLMs jump straight to 4-bit quantization because it's fast and uses

Este artículo compara la cuantificación de LLMs de 16, 8 y 4 bits, revelando que la de 4 bits, aunque más rápida, compromete significativamente la calidad en tareas de razonamiento y matemáticas. La verdadera compensación es entre la tarea y la precisión requerida, siendo 8 bits óptimo para tareas que exigen precisión, minimizando la pérdida de calidad con solo una ligera reducción de velocidad. La elección de la cuantificación debe basarse en la tarea y las consideraciones de hardware, no solo en el hardware.

27
ARTICLEDEV.to AI·25/4/2026

The Rise of Local AI: Running LLMs on Your Own Hardware in 2026

Para 2026, ejecutar potentes modelos de IA localmente en hardware personal será una capacidad generalizada, ofreciendo importantes beneficios de privacidad y costo marginal cero en comparación con los servicios en la nube. Este cambio aborda las preocupaciones sobre el envío de datos sensibles a terceros y elimina las tarifas de suscripción.

27
ARTICLEDEV.to AI·hace 9d

Best Local AI Models for Apple Silicon in 2026

El artículo aborda el cambio significativo en la ejecución local de modelos de IA en Macs con Apple Silicon, una tarea que antes requería GPUs NVIDIA dedicadas. Esta transformación es impulsada por la arquitectura de memoria unificada de Apple Silicon, que utiliza eficientemente la RAM compartida entre componentes.

27
ARTICLEDEV.to AI·hace 29d

When I started running models locally, I thought quantization meant squeezing more into RAM. Turns o

El artículo desaconseja el uso predeterminado de Q4_K_M para la inferencia local de LLM, enfatizando que el rendimiento óptimo proviene de probar niveles de cuantificación adaptados a flujos de trabajo específicos. Sugiere que la cuantificación agresiva como Q3_K_S puede reducir significativamente la latencia con una pérdida de calidad imperceptible para muchas tareas, aunque la longitud del contexto presenta una compensación.

27
NEWSThe Verge AI·hace 7d

Microsoft Build 2026: All the news about Windows, AI, RTX Spark, and more

La conferencia anual de desarrolladores Microsoft Build 2026 está a punto de comenzar, con anuncios esperados sobre nuevos modelos de IA, una "super app" de Copilot y cambios importantes en Windows 11. El evento también presentará novedades de hardware como el Surface Laptop Ultra con Nvidia RTX Spark y Project Solara, el sistema operativo de agente de IA de Microsoft.

27
NEWSThe Verge AI·5/5/2026

OpenAI is reportedly launching a phone for ChatGPT

OpenAI, según informes, está acelerando el desarrollo de un teléfono para ChatGPT, su primer producto de hardware, con producción en masa prevista para principios de 2027. Se rumorea que el dispositivo utilizará un chip MediaTek Dimensity 9600 personalizado, destacando su procesador de señal de imagen.

27