← heapsort-ai

hardware

55 items

NEWS↑ trendingHacker News (AI)·il y a 8j

Nvidia and Microsoft Reinvent Windows PCs for the Age of Personal AI

Nvidia et Microsoft collaborent pour propulser une nouvelle génération de PC Windows AI, en utilisant des GPU GeForce RTX pour offrir des capacités d'IA personnelle avancées aux utilisateurs. Cette initiative, comprenant le Project G-Assist et Nvidia ACE, vise à intégrer des agents d'IA générative et à accélérer des applications comme Microsoft Copilot directement sur l'appareil.

42
ARTICLE↑ trendingReddit r/LocalLLaMA·30/04/2026

Follow-up: Qwen3.6-27B on 1× RTX 3090 — pushing to ~218K context + ~50–66 TPS, tool calls now stable (PN12 fix)

Cette mise à jour détaille l'exécution de Qwen3.6-27B sur une seule RTX 3090, atteignant un contexte de ~218K et des appels d'outils stables à 50-66 TPS. Un problème de mémoire critique avec de longues sorties d'outils a été résolu en corrigeant une dérive d'ancre dans un patch Genesis (PN12) pour vLLM.

42
ARTICLE↑ trendingReddit r/LocalLLaMA·22/04/2026

Is a high-end private local LLM setup worth it?

L'utilisateur s'interroge sur la pertinence d'une configuration LLM locale haut de gamme, citant les coûts élevés, les difficultés de configuration et les écarts de performance par rapport aux services cloud comme Claude et GPT. Il est prêt à investir dans du matériel puissant, mais veut savoir si cela peut réellement égaler la vitesse et l'intelligence des meilleurs modèles commerciaux.

41
ARTICLE↑ trendingReddit r/LocalLLaMA·07/05/2026

Need advice on hardware purchasing decision: RTX 5090 vs. M5 Max 128GB for agentic software development

L'utilisateur demande conseil pour choisir entre une RTX 5090 et un M5 Max 128GB pour le développement de logiciels agentiques avec Qwen3.6 27B en local. La RTX 5090 offre une vitesse 3 fois supérieure, tandis que le M5 Max offre 4 fois plus de mémoire, posant un compromis entre la génération rapide de code et une plus grande capacité de contexte.

41
ARTICLE↑ trendingReddit r/LocalLLaMA·09/04/2026

16 GB VRAM users, what model do we like best now?

Um usuário com 16 GB de VRAM compartilha sua experiência positiva com o modelo Qwen 3.5 27b em quants IQ3 em uma RTX 4080, alcançando boa velocidade e contexto. Ele discute os desafios de otimizar modelos de IA localmente com essa quantidade de VRAM, ponderando entre qualidade e velocidade ao lidar com diferentes níveis de quantização.

41
ARTICLE↑ trendingReddit r/LocalLLaMA·27/04/2026

Guys this is so fun!

Un utilisateur exprime son enthousiasme à faire fonctionner divers modèles d'IA comme Qwen et Llama localement sur son MacBook Air et une station de travail IA équipée d'une RTX Pro 6000 Blackwell, en utilisant des outils comme LM Studio et LM Link.

41
ARTICLE↑ trendingReddit r/LocalLLaMA·21/04/2026

2x 512gb ram M3 Ultra mac studios

Un utilisateur possédant deux Mac Studios M3 Ultra haut de gamme (512 Go de RAM chacun, 25 000 $ de matériel) teste des modèles LLM comme Deepseek et GLM, et sollicite des suggestions de la communauté sur les modèles à charger. Il dépanne également des problèmes de backend et attend des optimisations pour Kimi 2.6.

2x 512gb ram M3 Ultra mac studios
41
NEWS↑ trendingReddit r/LocalLLaMA·12/04/2026

Weekend project with Intel B70s

Un utilisateur assemble un système haut de gamme avec des GPU Intel Arc B70 et une carte mère Gigabyte B850 AI Top. L'objectif est de tester le modèle Gemma 4 dans des applications RAG juridiques, en utilisant un agent Hermes.

38
RESEARCH↑ trendingReddit r/LocalLLaMA·19/04/2026

QWEN3.6 + ik_llama is fast af

Un utilisateur a rapporté l'exécution du modèle Qwen3.6 + ik_llama à plus de 50 tokens/seconde avec une fenêtre de contexte de 200k sur 16 Go de VRAM et 32 Go de RAM. Cela constitue une référence de performance significative pour les grands modèles linguistiques.

QWEN3.6 + ik_llama is fast af
38
NEWS↑ trendingReddit r/LocalLLaMA·04/05/2026

Ryzen AI Max+ 495 (Gorgon Halo) with 192GB VRAM!

Des fuites indiquent que l'AMD Ryzen AI Max+ PRO 495 (Gorgon Halo) pourrait intégrer un APU avec 192 Go de VRAM, signalant un avenir prometteur pour l'IA locale. Malgré les coûts potentiellement élevés dus à la crise du stockage, des versions futures comme le Medusa Halo en 2027 pourraient atteindre 256 Go.

38
ARTICLEDEV.to AI·14/04/2026

OpenClaw on Raspberry Pi 5: Full Setup Guide

L'article explique comment le Raspberry Pi 5 est désormais suffisamment puissant pour exécuter confortablement les charges de travail des agents IA OpenClaw, offrant une alternative économique et privée à l'hébergement cloud. Il détaille les spécifications du Pi 5 qui le rendent pratique à cette fin.

37
ARTICLE↑ trendingReddit r/LocalLLaMA·il y a 26j

The RTX 5000 PRO (48GB) arrived and it is better than I expected.

L'auteur, un novice en assemblage de PC, a acheté une carte graphique RTX 5000 Pro pour le traitement de LLMs locaux, dépensant un total de 5600 $. Malgré des difficultés initiales avec l'assemblage et la configuration logicielle (Linux, vLLM), les performances du GPU ont dépassé ses attentes.

37
ARTICLE↑ trendingReddit r/MachineLearning·17/04/2026

Which computer should I buy: Mac or custom-built 5090? [D]

L'utilisateur demande conseil pour choisir entre un Mac M5 MAX avec MLX et un PC personnalisé avec une RTX 5090 pour ses projets d'apprentissage automatique. Son travail implique principalement le réglage fin de grands modèles pré-entraînés et l'entraînement à partir de zéro, souvent avec des données image/vidéo et, parfois, des LLM, faisant de la VRAM un facteur critique.

36
ARTICLE↑ trendingReddit r/LocalLLaMA·06/05/2026

Bad news: Apple drops high-memory Mac Studio configs

Apple a discrètement interrompu les configurations de Mac Studio à haute mémoire, laissant la version M3 Ultra avec un maximum de 96 Go de RAM et le Mac mini à 48 Go. Ce changement est un revers majeur pour les utilisateurs souhaitant exécuter de grands modèles d'IA localement, car les options de haute mémoire étaient cruciales pour de telles tâches.

Bad news: Apple drops high-memory Mac Studio configs
36
NEWS↑ trendingReddit r/LocalLLaMA·26/04/2026

Comparison of upcoming x86 unified memory systems

Ce contenu compare les futurs systèmes de mémoire unifiée x86 d'AMD et d'Intel, incluant Gorgon Halo, Strix Halo, Medusa Halo et Nova Lake AX. Il détaille les calendriers de sortie et les améliorations de bande passante, avec AMD Medusa Halo promettant un gain de performance significatif d'ici 2027.

35
ARTICLE↑ trendingReddit r/LocalLLaMA·il y a 19j

In theory, if I have $20k-ish to spend on hardware what would actually get me closest to local coding agent that would allow me to go totally off the social grid?

L'utilisateur demande quel matériel (environ 20 000 $, par exemple des GPU RTX 6000) serait nécessaire pour configurer un agent de codage local et se déconnecter totalement des réseaux sociaux. La question aborde également le rôle du modèle d'IA dans cette configuration.

34