← heapsort-ai

GPUs

9 items

ARTICLE↑ trendingReddit r/LocalLLaMA·01/05/2026

What in tarnation is going on with the cost of compute

L'auteur exprime sa surprise et sa frustration face à l'augmentation drastique et soutenue des prix des GPU serveur (H100/H200/B200) sur des plateformes comme Vast et Mithril, atteignant plus de 1 000 $ l'heure. Il estime que cela est insoutenable pour les universitaires et les startups, et entrave la finalisation de ses projets, tel un pipeline BitNet pour la communauté localLlama.

43
ARTICLE↑ trendingHacker News (AI)·il y a 13j

AI Infra Is Nothing Like the "Classic Cloud Infra"

L'infrastructure d'IA diffère fondamentalement de l'infrastructure cloud classique en raison de sa dépendance à un matériel spécialisé comme les GPU et des besoins uniques en gestion de données et des défis complexes du calcul distribué. Cela nécessite une approche distincte pour la conception, le déploiement et l'opération, allant au-delà des paradigmes du cloud à usage général.

42
NEWSDEV.to AI·il y a 17j

Nvidia Networking Revenue Hits $14.8B, Up 199% as AI Spending Shifts Beyond GPUs

Les revenus des réseaux de Nvidia au premier trimestre de l'exercice 2027 ont bondi de 199 % pour atteindre 14,8 milliards de dollars, signalant un déplacement des dépenses d'infrastructure IA au-delà des GPU vers les réseaux et l'optique de système complet. La société a enregistré un chiffre d'affaires total record de 81,6 milliards de dollars et a introduit de nouveaux segments de reporting pour les clients Hyperscale et ACIE.

27
ARTICLEDEV.to AI·02/05/2026

Optimized Rocky Linux for AI/HPC vs. Generic Enterprise Stacks

Le partenariat entre AMD et CIQ propose une base Rocky Linux optimisée pour AMD, avec des pilotes validés et un support ROCm, destinée aux déploiements d'IA et de HPC en entreprise. Cette solution intégrée assure un déploiement plus rapide, des performances accrues et une gestion simplifiée du cycle de vie par rapport aux piles Linux génériques.

27