← heapsort-ai

hardware

55 items

NEWS↑ trendingHacker News (AI)·hace 8d

Nvidia and Microsoft Reinvent Windows PCs for the Age of Personal AI

Nvidia y Microsoft están colaborando para impulsar una nueva generación de PCs con IA de Windows, utilizando GPUs GeForce RTX para ofrecer capacidades avanzadas de IA personal a los usuarios. Esta iniciativa, con Project G-Assist y Nvidia ACE, busca integrar agentes de IA generativa y acelerar aplicaciones como Microsoft Copilot directamente en el dispositivo.

42
ARTICLE↑ trendingReddit r/LocalLLaMA·30/4/2026

Follow-up: Qwen3.6-27B on 1× RTX 3090 — pushing to ~218K context + ~50–66 TPS, tool calls now stable (PN12 fix)

Esta actualización detalla la ejecución de Qwen3.6-27B en una sola RTX 3090, logrando un contexto de ~218K y llamadas de herramientas estables a 50-66 TPS. Se resolvió un problema crítico de memoria con salidas de herramientas largas al corregir una desviación de anclaje en un parche Genesis (PN12) para vLLM.

42
ARTICLE↑ trendingReddit r/LocalLLaMA·22/4/2026

Is a high-end private local LLM setup worth it?

El usuario se pregunta si vale la pena una configuración local de LLM de gama alta, mencionando los altos costos, las dificultades de configuración y las diferencias de rendimiento con servicios en la nube como Claude y GPT. Está dispuesto a invertir en hardware potente, pero quiere saber si realmente puede igualar la velocidad y la inteligencia de los principales modelos comerciales.

41
ARTICLE↑ trendingReddit r/LocalLLaMA·7/5/2026

Need advice on hardware purchasing decision: RTX 5090 vs. M5 Max 128GB for agentic software development

El usuario busca consejo sobre la elección entre una RTX 5090 y un M5 Max 128GB para el desarrollo de software agéntico con Qwen3.6 27B localmente. La RTX 5090 ofrece el triple de velocidad, mientras que el M5 Max proporciona el cuádruple de memoria, lo que plantea una disyuntiva entre la velocidad de generación de código y una mayor capacidad de contexto.

41
ARTICLE↑ trendingReddit r/LocalLLaMA·9/4/2026

16 GB VRAM users, what model do we like best now?

Um usuário com 16 GB de VRAM compartilha sua experiência positiva com o modelo Qwen 3.5 27b em quants IQ3 em uma RTX 4080, alcançando boa velocidade e contexto. Ele discute os desafios de otimizar modelos de IA localmente com essa quantidade de VRAM, ponderando entre qualidade e velocidade ao lidar com diferentes níveis de quantização.

41
ARTICLE↑ trendingReddit r/LocalLLaMA·27/4/2026

Guys this is so fun!

Un usuario expresa su entusiasmo por ejecutar varios modelos de IA como Qwen y Llama localmente en su MacBook Air y una estación de trabajo de IA con una RTX Pro 6000 Blackwell, utilizando herramientas como LM Studio y LM Link.

41
ARTICLE↑ trendingReddit r/LocalLLaMA·21/4/2026

2x 512gb ram M3 Ultra mac studios

Un usuario con dos Mac Studios M3 Ultra de gama alta (512 GB de RAM cada uno, $25k en hardware) está probando modelos LLM como Deepseek y GLM, y pide a la comunidad sugerencias sobre qué más cargar. Está solucionando problemas de backend y esperando optimizaciones para Kimi 2.6.

2x 512gb ram M3 Ultra mac studios
41
NEWS↑ trendingReddit r/LocalLLaMA·12/4/2026

Weekend project with Intel B70s

Un usuario está construyendo un sistema de alta gama con GPUs Intel Arc B70 y una placa base Gigabyte B850 AI Top. El objetivo es probar el modelo Gemma 4 en aplicaciones de RAG legal, utilizando un agente Hermes.

38
RESEARCH↑ trendingReddit r/LocalLLaMA·19/4/2026

QWEN3.6 + ik_llama is fast af

Un usuario informó haber ejecutado el modelo Qwen3.6 + ik_llama a más de 50 tokens/segundo con una ventana de contexto de 200k en 16GB de VRAM y 32GB de RAM. Esto representa un hito de rendimiento significativo para los grandes modelos de lenguaje.

QWEN3.6 + ik_llama is fast af
38
NEWS↑ trendingReddit r/LocalLLaMA·4/5/2026

Ryzen AI Max+ 495 (Gorgon Halo) with 192GB VRAM!

Las filtraciones sugieren que el AMD Ryzen AI Max+ PRO 495 (Gorgon Halo) podría incorporar una APU con 192 GB de VRAM, augurando un futuro brillante para la IA local. A pesar de los posibles altos costes debido a la crisis de almacenamiento, se especula que versiones futuras como el Medusa Halo en 2027 podrían alcanzar los 256 GB.

38
ARTICLEDEV.to AI·14/4/2026

OpenClaw on Raspberry Pi 5: Full Setup Guide

El artículo explica cómo la Raspberry Pi 5 tiene la potencia suficiente para ejecutar cómodamente cargas de trabajo de agentes de IA de OpenClaw, ofreciendo una alternativa económica y privada al alojamiento en la nube. Detalla las especificaciones de la Pi 5 que la hacen práctica para este fin.

37
ARTICLE↑ trendingReddit r/MachineLearning·17/4/2026

Which computer should I buy: Mac or custom-built 5090? [D]

El usuario busca consejo para elegir entre un Mac M5 MAX con MLX y un PC personalizado con una RTX 5090 para sus proyectos de aprendizaje automático. Su trabajo implica principalmente el ajuste fino de grandes modelos pre-entrenados y el entrenamiento desde cero, a menudo con datos de imagen/vídeo y, a veces, LLMs, lo que convierte la VRAM en un factor crítico.

36
ARTICLE↑ trendingReddit r/LocalLLaMA·6/5/2026

Bad news: Apple drops high-memory Mac Studio configs

Apple ha descontinuado silenciosamente las configuraciones de alta memoria para el Mac Studio, dejando la versión M3 Ultra con un máximo de 96GB de RAM y el Mac mini con 48GB. Este cambio es un revés significativo para los usuarios que desean ejecutar grandes modelos de IA localmente, ya que las opciones de alta memoria eran cruciales para dichas tareas.

Bad news: Apple drops high-memory Mac Studio configs
36
ARTICLE↑ trendingReddit r/LocalLLaMA·hace 19d

In theory, if I have $20k-ish to spend on hardware what would actually get me closest to local coding agent that would allow me to go totally off the social grid?

El usuario pregunta qué hardware (alrededor de $20k, por ejemplo, GPUs RTX 6000) necesitaría para crear un agente de codificación local y desconectarse completamente de las redes sociales. La pregunta también aborda la importancia del modelo de IA en esta configuración.

34