NVIDIA

42 items

ARTICLEDEV.to AI·4h atrás

Microsoft RTX Spark Dev Box: The $3,000 AI Machine That Changes Local Development

A Microsoft e a NVIDIA lançaram a RTX Spark Dev Box, uma máquina de desenvolvimento de IA de $3.000 projetada para a execução local de modelos. Equipada com GPU Blackwell e 128 GB de memória unificada, ela compete diretamente com o Mac Studio da Apple para desenvolvedores de IA.

RTX Spark Microsoft Local AI NVIDIA

NEWSAWS Machine Learning Blog·1d atrás

NVIDIA Nemotron 3 Ultra now available on Amazon SageMaker JumpStart

O NVIDIA Nemotron 3 Ultra já está disponível no Amazon SageMaker JumpStart. Esta implantação oferece inferência 5x mais rápida e 30% menos custo para cargas de trabalho de IA.

Nemotron 3 Ultra Machine Learning NVIDIA AI inference

NEWS↑ trendingHacker News (AI)·4d atrás

Nvidia announces new AI chip for personal computers

A Nvidia anunciou um novo chip de IA projetado para computadores pessoais, marcando um avanço significativo na integração de recursos de inteligência artificial diretamente em dispositivos de consumo. Este desenvolvimento deve melhorar o desempenho para aplicações impulsionadas por IA em PCs, tornando a IA avançada mais acessível aos utilizadores.

chips AI hardware technology NVIDIA

RESEARCH↑ trendingReddit r/MachineLearning·10/04/2026

[D] 60% MatMul Performance Bug in cuBLAS on RTX 5090 [D]

Um bug de desempenho foi identificado no cuBLAS para operações de multiplicação de matrizes em GPUs NVIDIA RTX, como a 5090, utilizando apenas 40% da capacidade. O autor demonstrou um kernel customizado que supera o cuBLAS em até 70%, sugerindo otimização deficiente para essas GPUs em comparação com modelos Pro e H-series.

Matrix Multiplication RTX GPUs performance optimization NVIDIA

ARTICLE↑ trendingHacker News (AI)·8d atrás

Nvidia bets $150B on Taiwan as Trump's plan to make US an AI hub backfires

Jensen Huang, CEO da Nvidia, planeja investir US$ 150 bilhões em Taiwan para consolidá-la como um centro global de IA, desafiando os planos dos EUA de se tornarem um polo de fabricação de semicondutores. Esta estratégia sublinha a importância crítica de Taiwan na cadeia de fornecimento de IA, apesar dos esforços americanos para relocalizar a produção.

AI manufacturing semiconductors Taiwan geopolitics

CASE↑ trendingReddit r/LocalLLaMA·01/05/2026

16x Spark Cluster (Build Update)

Esta atualização detalha a construção bem-sucedida de um cluster Nvidia DGX Spark de 16 nós, configurado para alta velocidade de rede e memória unificada. A configuração envolveu provisionamento de nós e scripts personalizados para otimização de rede, visando maximizar a capacidade de memória unificada para servir grandes modelos de linguagem como GLM-5.1-NVFP4, DeepSeek e Kimi.

AI hardware unified memory cluster computing Large language models

RESEARCH↑ trendingReddit r/LocalLLaMA·01/05/2026

nvidia/Gemma-4-26B-A4B-NVFP4

O conteúdo confirma o desempenho do modelo Gemma-4-26B-A4B-NVFP4 numa GPU NVIDIA 5090, detalhando o uso de 18.8GB de VRAM e capacidade para 50k de contexto. Apresenta também pontuações de benchmark para o NVFP4 em comparação com a precisão total em diversas métricas como GPQA, AIME e MMLU Pro.

AI models GPU benchmarking NVIDIA

NEWS↑ trendingReddit r/LocalLLaMA·20/04/2026

SK hynix starts mass production of 192GB SOCAMM2 for NVIDIA AI servers

A SK hynix iniciou a produção em massa do módulo de memória 192GB SOCAMM2, baseado em LPDDR5X, para a futura plataforma de IA Vera Rubin da NVIDIA. Este novo módulo visa resolver gargalos em sistemas de IA, oferecendo mais que o dobro da largura de banda e reduzindo o consumo de energia em mais de 75%.

AI servers AI hardware Memory technology NVIDIA

NEWSDEV.to AI·1d atrás

Nvidia Unveils Physical AI Agent Skills, 32B VLA Model at CVPR

A Nvidia revelou habilidades de agente de IA físico e um modelo VLA de 32B de parâmetros, Alpamayo 2 Super, na CVPR para otimizar a pesquisa em veículos autônomos e robótica. Essas inovações abordam o gargalo de ferramentas fragmentadas, automatizando tarefas como reconstrução de cena e geração de dados sintéticos.

Autonomous Vehicles Robotics NVIDIA CVPR

NEWSThe Verge AI·3d atrás

Microsoft created the mini Surface dev box that Qualcomm couldn’t

A Microsoft anunciou o Surface RTX Spark Dev Box, um mini PC otimizado para tarefas locais de IA e cargas de trabalho sustentadas, utilizando os novos chips RTX Spark baseados em Arm da Nvidia. Este dispositivo compacto, que se assemelha à parte superior de um Xbox Series X, é projetado especificamente para desenvolvedores e possui um envelope térmico de 100 watts.

Development AI hardware Microsoft Surface

NEWSDEV.to AI·2d atrás

Ayar Labs Joins NVIDIA NVLink Fusion Ecosystem for Co-Packaged Optics

A Ayar Labs juntou-se ao ecossistema NVLink Fusion da NVIDIA para integrar óticas co-empacotadas em fábricas de IA. Esta iniciativa visa resolver gargalos de largura de banda em arquiteturas de GPU em larga escala.

Co-Packaged Optics Silicon Photonics AI Factories Interconnects

ARTICLEDEV.to AI·22/04/2026

Google TPU 8 vs Nvidia: 8t and 8i Specs Explained

O TPU 8 do Google rompe com as gerações anteriores e o modelo de GPU universal da Nvidia ao apresentar dois chips distintos: o 8t para treinamento e o 8i para inferência. Essa divisão estratégica, com designs especializados para cada tarefa, sinaliza uma mudança das GPUs universais e representa um desafio para o domínio da Nvidia na computação de IA.

AI hardware chip architecture NVIDIA TPU

NEWS↑ trendingReddit r/LocalLLaMA·22d atrás

NVIDIA Reportedly Prepares RTX 5090 Price Hike Amid Rising GDDR7 Costs (maybe RTX 50 and PRO series as well)

A NVIDIA estaria preparando um aumento de preço para a RTX 5090 e possivelmente para outras séries RTX 50 e PRO, devido ao aumento dos custos da memória GDDR7. Esta notícia sugere uma potencial elevação nos preços das próximas placas gráficas da empresa.

RTX 5090 GPUs hardware NVIDIA

NVIDIA Reportedly Prepares RTX 5090 Price Hike Amid Rising GDDR7 Costs (maybe RTX 50 and PRO series as well)

NEWSMicrosoft Research (YouTube)·2d atrás

Conversation with NVIDIA Founder and CEO Jensen Huang: Satya Nadella at Microsoft Build 2026

O título anuncia uma conversa futura entre Jensen Huang, CEO da NVIDIA, e Satya Nadella, CEO da Microsoft, no Microsoft Build 2026. Este evento promete ser um destaque na indústria de tecnologia e inteligência artificial.

Satya Nadella Microsoft Jensen Huang AI Industry

Conversation with NVIDIA Founder and CEO Jensen Huang: Satya Nadella at Microsoft Build 2026

ARTICLEDEV.to AI·15d atrás

Designing with Nvidia's Ising Quantum AI: A Calibration Playbook for ML Engineers

Os modelos de IA quântica de Ising da Nvidia são otimizadores combinatórios que mapeiam estados de hardware de alta dimensão para configurações de baixa energia, garantindo pontos operacionais ideais. A produção dessa tecnologia como serviço exige calibração cuidadosa para assegurar uma convergência confiável e evitar que seja preterida.

optimization ML Engineering hardware NVIDIA

NEWSHugging Face Blog·4d atrás

Welcome NVIDIA Cosmos 3: The First Open Omni-model for Physical AI Reasoning and Action

A NVIDIA apresenta o Cosmos 3, o primeiro modelo omni-modelo aberto para raciocínio e ação em IA física. Este lançamento marca um avanço significativo na fusão de IA e robótica, permitindo que a IA interaja de forma mais inteligente com o mundo físico.

open-source AI model Robotics NVIDIA

NEWSDEV.to AI·22/04/2026

Google Launches AI Chips for Training and Inference

O Google lançou uma nova linha de chips de IA, codinome "Triton X", para desafiar a dominância da Nvidia, prometendo uma redução de 40% nos custos de treinamento e 25% na latência de inferência. Este movimento representa uma mudança sísmica no mercado de hardware de IA, intensificando a competição.

inference AI hardware Training Google

ARTICLEDEV.to AI·23d atrás

VLAs are dead, long live World Action Models - a summary of Jim Fan's Robotics End Game talk

Jim Fan, da equipe de robótica da Nvidia, sugere que a robótica está entrando em sua "fase final" e seguirá a mesma trajetória de quatro estágios dos grandes modelos de linguagem. Ele afirma que "a robótica está entrando em seu jogo final, e o roteiro já está escrito" pelos LLMs.

future-of-AI AI Large language models Robotics

DOCDEV.to AI·17d atrás

Nvidia Ising Quantum AI: Calibration Models Guide 2026

Este guia aborda os modelos de IA quântica Ising de código aberto da Nvidia como serviços de produção, focando em sua implantação, orquestração, salvaguardas e governança dentro das estruturas de segurança de IA existentes. Ele ressalta a importância crítica da calibração para o desempenho real de solvers Ising de inspiração quântica, pois sistemas mal ajustados podem levar a falhas significativas na produção.

Quantum Computing Calibration security AI deployment

NEWSDEV.to AI·20d atrás

NVIDIA libera SANA-WM: world model eficiente a escala de minuto

A NVIDIA Research apresentou o SANA-WM, uma extensão do modelo SANA focada em modelagem de mundo em escala de minuto. Este modelo permite simular ambientes visuais coerentes por longas sequências com custo computacional reduzido, reforçando a aposta da NVIDIA em tornar a geração de vídeo e ambientes acessível.

World Models AI simulation SANA-WM