← heapsort-ai

NVIDIA

42 items

NEWS↑ trendingHacker News (AI)·4d atrás

Nvidia announces new AI chip for personal computers

A Nvidia anunciou um novo chip de IA projetado para computadores pessoais, marcando um avanço significativo na integração de recursos de inteligência artificial diretamente em dispositivos de consumo. Este desenvolvimento deve melhorar o desempenho para aplicações impulsionadas por IA em PCs, tornando a IA avançada mais acessível aos utilizadores.

44
RESEARCH↑ trendingReddit r/MachineLearning·10/04/2026

[D] 60% MatMul Performance Bug in cuBLAS on RTX 5090 [D]

Um bug de desempenho foi identificado no cuBLAS para operações de multiplicação de matrizes em GPUs NVIDIA RTX, como a 5090, utilizando apenas 40% da capacidade. O autor demonstrou um kernel customizado que supera o cuBLAS em até 70%, sugerindo otimização deficiente para essas GPUs em comparação com modelos Pro e H-series.

44
ARTICLE↑ trendingHacker News (AI)·8d atrás

Nvidia bets $150B on Taiwan as Trump's plan to make US an AI hub backfires

Jensen Huang, CEO da Nvidia, planeja investir US$ 150 bilhões em Taiwan para consolidá-la como um centro global de IA, desafiando os planos dos EUA de se tornarem um polo de fabricação de semicondutores. Esta estratégia sublinha a importância crítica de Taiwan na cadeia de fornecimento de IA, apesar dos esforços americanos para relocalizar a produção.

42
CASE↑ trendingReddit r/LocalLLaMA·01/05/2026

16x Spark Cluster (Build Update)

Esta atualização detalha a construção bem-sucedida de um cluster Nvidia DGX Spark de 16 nós, configurado para alta velocidade de rede e memória unificada. A configuração envolveu provisionamento de nós e scripts personalizados para otimização de rede, visando maximizar a capacidade de memória unificada para servir grandes modelos de linguagem como GLM-5.1-NVFP4, DeepSeek e Kimi.

16x Spark Cluster (Build Update)
42
RESEARCH↑ trendingReddit r/LocalLLaMA·01/05/2026

nvidia/Gemma-4-26B-A4B-NVFP4

O conteúdo confirma o desempenho do modelo Gemma-4-26B-A4B-NVFP4 numa GPU NVIDIA 5090, detalhando o uso de 18.8GB de VRAM e capacidade para 50k de contexto. Apresenta também pontuações de benchmark para o NVFP4 em comparação com a precisão total em diversas métricas como GPQA, AIME e MMLU Pro.

nvidia/Gemma-4-26B-A4B-NVFP4
42
NEWSThe Verge AI·3d atrás

Microsoft created the mini Surface dev box that Qualcomm couldn’t

A Microsoft anunciou o Surface RTX Spark Dev Box, um mini PC otimizado para tarefas locais de IA e cargas de trabalho sustentadas, utilizando os novos chips RTX Spark baseados em Arm da Nvidia. Este dispositivo compacto, que se assemelha à parte superior de um Xbox Series X, é projetado especificamente para desenvolvedores e possui um envelope térmico de 100 watts.

40
ARTICLEDEV.to AI·22/04/2026

Google TPU 8 vs Nvidia: 8t and 8i Specs Explained

O TPU 8 do Google rompe com as gerações anteriores e o modelo de GPU universal da Nvidia ao apresentar dois chips distintos: o 8t para treinamento e o 8i para inferência. Essa divisão estratégica, com designs especializados para cada tarefa, sinaliza uma mudança das GPUs universais e representa um desafio para o domínio da Nvidia na computação de IA.

36
ARTICLEDEV.to AI·15d atrás

Designing with Nvidia's Ising Quantum AI: A Calibration Playbook for ML Engineers

Os modelos de IA quântica de Ising da Nvidia são otimizadores combinatórios que mapeiam estados de hardware de alta dimensão para configurações de baixa energia, garantindo pontos operacionais ideais. A produção dessa tecnologia como serviço exige calibração cuidadosa para assegurar uma convergência confiável e evitar que seja preterida.

31
DOCDEV.to AI·17d atrás

Nvidia Ising Quantum AI: Calibration Models Guide 2026

Este guia aborda os modelos de IA quântica Ising de código aberto da Nvidia como serviços de produção, focando em sua implantação, orquestração, salvaguardas e governança dentro das estruturas de segurança de IA existentes. Ele ressalta a importância crítica da calibração para o desempenho real de solvers Ising de inspiração quântica, pois sistemas mal ajustados podem levar a falhas significativas na produção.

28