hardware

55 items

DOC↑ trendingReddit r/LocalLLaMA·27/4/2026

To 16GB VRAM users, plug in your old GPU

Este contenido sugiere que los usuarios con 16GB de VRAM añadan una GPU antigua (6GB+ VRAM) para aumentar el VRAM total, permitiendo ejecutar modelos LLM más grandes (~30b) incluso con una tarjeta secundaria más débil. Incluye un ejemplo de configuración práctica para `llama-server`.

deep learning GPU optimization LLM inference VRAM management

ARTICLE↑ trendingReddit r/LocalLLaMA·hace 25d

I have (even faster) DeepSeek V4 Pro at home

El autor logró ejecutar el modelo DeepSeek V4 Pro aún más rápido en su hardware doméstico utilizando ktransformers. Detalla los ajustes de hardware y presenta resultados de referencia de rendimiento con una profundidad de contexto creciente.

DeepSeek Benchmarking hardware performance

NEWS↑ trendingHacker News (AI)·hace 8d

Nvidia and Microsoft Reinvent Windows PCs for the Age of Personal AI

Nvidia y Microsoft están colaborando para impulsar una nueva generación de PCs con IA de Windows, utilizando GPUs GeForce RTX para ofrecer capacidades avanzadas de IA personal a los usuarios. Esta iniciativa, con Project G-Assist y Nvidia ACE, busca integrar agentes de IA generativa y acelerar aplicaciones como Microsoft Copilot directamente en el dispositivo.

Microsoft Copilot Windows AI hardware

ARTICLE↑ trendingReddit r/LocalLLaMA·30/4/2026

Follow-up: Qwen3.6-27B on 1× RTX 3090 — pushing to ~218K context + ~50–66 TPS, tool calls now stable (PN12 fix)

Esta actualización detalla la ejecución de Qwen3.6-27B en una sola RTX 3090, logrando un contexto de ~218K y llamadas de herramientas estables a 50-66 TPS. Se resolvió un problema crítico de memoria con salidas de herramientas largas al corregir una desviación de anclaje en un parche Genesis (PN12) para vLLM.

Optimization hardware performance vLLM

ARTICLE↑ trendingReddit r/LocalLLaMA·22/4/2026

Is a high-end private local LLM setup worth it?

El usuario se pregunta si vale la pena una configuración local de LLM de gama alta, mencionando los altos costos, las dificultades de configuración y las diferencias de rendimiento con servicios en la nube como Claude y GPT. Está dispuesto a invertir en hardware potente, pero quiere saber si realmente puede igualar la velocidad y la inteligencia de los principales modelos comerciales.

local LLM private-ai cost hardware

ARTICLE↑ trendingReddit r/LocalLLaMA·7/5/2026

Need advice on hardware purchasing decision: RTX 5090 vs. M5 Max 128GB for agentic software development

El usuario busca consejo sobre la elección entre una RTX 5090 y un M5 Max 128GB para el desarrollo de software agéntico con Qwen3.6 27B localmente. La RTX 5090 ofrece el triple de velocidad, mientras que el M5 Max proporciona el cuádruple de memoria, lo que plantea una disyuntiva entre la velocidad de generación de código y una mayor capacidad de contexto.

LLMs GPU hardware performance

ARTICLE↑ trendingReddit r/LocalLLaMA·9/4/2026

16 GB VRAM users, what model do we like best now?

Um usuário com 16 GB de VRAM compartilha sua experiência positiva com o modelo Qwen 3.5 27b em quants IQ3 em uma RTX 4080, alcançando boa velocidade e contexto. Ele discute os desafios de otimizar modelos de IA localmente com essa quantidade de VRAM, ponderando entre qualidade e velocidade ao lidar com diferentes níveis de quantização.

LLMs VRAM modelos de linguagem hardware

ARTICLE↑ trendingReddit r/LocalLLaMA·27/4/2026

Guys this is so fun!

Un usuario expresa su entusiasmo por ejecutar varios modelos de IA como Qwen y Llama localmente en su MacBook Air y una estación de trabajo de IA con una RTX Pro 6000 Blackwell, utilizando herramientas como LM Studio y LM Link.

open source models LLMs Local AI hardware

ARTICLE↑ trendingReddit r/LocalLLaMA·21/4/2026

2x 512gb ram M3 Ultra mac studios

Un usuario con dos Mac Studios M3 Ultra de gama alta (512 GB de RAM cada uno, $25k en hardware) está probando modelos LLM como Deepseek y GLM, y pide a la comunidad sugerencias sobre qué más cargar. Está solucionando problemas de backend y esperando optimizaciones para Kimi 2.6.

Apple AI models LLMs Mac Studio

NEWS↑ trendingReddit r/LocalLLaMA·12/4/2026

Weekend project with Intel B70s

Un usuario está construyendo un sistema de alta gama con GPUs Intel Arc B70 y una placa base Gigabyte B850 AI Top. El objetivo es probar el modelo Gemma 4 en aplicaciones de RAG legal, utilizando un agente Hermes.

Legal AI GPU RAG AI model

NEWS↑ trendingReddit r/LocalLLaMA·6/5/2026

ZAYA1-8B: Frontier intelligence density, trained on AMD

Se ha anunciado ZAYA1-8B, un nuevo modelo de IA que exhibe una densidad de inteligencia de vanguardia. Fue notablemente entrenado utilizando hardware de AMD.

AI training AMD AI model hardware

ZAYA1-8B: Frontier intelligence density, trained on AMD

RESEARCH↑ trendingReddit r/LocalLLaMA·19/4/2026

QWEN3.6 + ik_llama is fast af

Un usuario informó haber ejecutado el modelo Qwen3.6 + ik_llama a más de 50 tokens/segundo con una ventana de contexto de 200k en 16GB de VRAM y 32GB de RAM. Esto representa un hito de rendimiento significativo para los grandes modelos de lenguaje.

Benchmarking hardware performance LLM

NEWS↑ trendingReddit r/LocalLLaMA·4/5/2026

Ryzen AI Max+ 495 (Gorgon Halo) with 192GB VRAM!

Las filtraciones sugieren que el AMD Ryzen AI Max+ PRO 495 (Gorgon Halo) podría incorporar una APU con 192 GB de VRAM, augurando un futuro brillante para la IA local. A pesar de los posibles altos costes debido a la crisis de almacenamiento, se especula que versiones futuras como el Medusa Halo en 2027 podrían alcanzar los 256 GB.

Ryzen AI VRAM AMD Local AI

ARTICLEDEV.to AI·14/4/2026

OpenClaw on Raspberry Pi 5: Full Setup Guide

El artículo explica cómo la Raspberry Pi 5 tiene la potencia suficiente para ejecutar cómodamente cargas de trabajo de agentes de IA de OpenClaw, ofreciendo una alternativa económica y privada al alojamiento en la nube. Detalla las especificaciones de la Pi 5 que la hacen práctica para este fin.

OpenClaw Raspberry Pi 5 AI hardware

ARTICLE↑ trendingHacker News (AI)·hace 6d

32GB of DDR5 now costs $375 – AI shortage continues to squeeze PC building

El precio de la memoria DDR5 de 32GB ha aumentado a $375, impulsado por la escasez actual de IA. Esta tendencia sigue afectando el mercado de ensamblaje de PC, encareciendo los componentes para los consumidores.

PC building AI shortage DDR5 hardware

ARTICLE↑ trendingReddit r/LocalLLaMA·hace 26d

The RTX 5000 PRO (48GB) arrived and it is better than I expected.

El autor, un novato en el montaje de PCs, compró una GPU RTX 5000 Pro para el procesamiento local de LLMs, gastando un total de $5600. A pesar de las dificultades iniciales con el ensamblaje y la configuración del software (Linux, vLLM), el rendimiento de la GPU superó sus expectativas.

local LLM PC Build GPU AI

ARTICLE↑ trendingReddit r/MachineLearning·17/4/2026

Which computer should I buy: Mac or custom-built 5090? [D]

El usuario busca consejo para elegir entre un Mac M5 MAX con MLX y un PC personalizado con una RTX 5090 para sus proyectos de aprendizaje automático. Su trabajo implica principalmente el ajuste fino de grandes modelos pre-entrenados y el entrenamiento desde cero, a menudo con datos de imagen/vídeo y, a veces, LLMs, lo que convierte la VRAM en un factor crítico.

deep learning GPU machine learning hardware

ARTICLE↑ trendingReddit r/LocalLLaMA·6/5/2026

Bad news: Apple drops high-memory Mac Studio configs

Apple ha descontinuado silenciosamente las configuraciones de alta memoria para el Mac Studio, dejando la versión M3 Ultra con un máximo de 96GB de RAM y el Mac mini con 48GB. Este cambio es un revés significativo para los usuarios que desean ejecutar grandes modelos de IA localmente, ya que las opciones de alta memoria eran cruciales para dichas tareas.

Apple Mac Studio Local AI hardware

Bad news: Apple drops high-memory Mac Studio configs

NEWS↑ trendingReddit r/LocalLLaMA·26/4/2026

Comparison of upcoming x86 unified memory systems

Este contenido compara los próximos sistemas de memoria unificada x86 de AMD e Intel, incluyendo Gorgon Halo, Strix Halo, Medusa Halo y Nova Lake AX. Detalla los plazos de lanzamiento y las mejoras de ancho de banda, con AMD Medusa Halo prometiendo un salto de rendimiento significativo para 2027.

AI accelerators processors memory hardware

ARTICLE↑ trendingReddit r/LocalLLaMA·hace 19d

In theory, if I have $20k-ish to spend on hardware what would actually get me closest to local coding agent that would allow me to go totally off the social grid?

El usuario pregunta qué hardware (alrededor de $20k, por ejemplo, GPUs RTX 6000) necesitaría para crear un agente de codificación local y desconectarse completamente de las redes sociales. La pregunta también aborda la importancia del modelo de IA en esta configuración.

Coding Agent privacy Local AI hardware