ZAYA1-8B: Frontier intelligence density, trained on AMD
ZAYA1-8B, un nouveau modèle d'IA présentant une densité d'intelligence de pointe, a été annoncé. Il a été notamment entraîné sur du matériel AMD.

ZAYA1-8B, un nouveau modèle d'IA présentant une densité d'intelligence de pointe, a été annoncé. Il a été notamment entraîné sur du matériel AMD.

Le contenu présente Hipfire, un nouveau moteur d'inférence optimisé pour toutes les GPU AMD, utilisant une méthode de quantification mq4 spéciale. Les benchmarks initiaux de Localmaxxing montrent des accélérations spectaculaires, bien que le créateur précise qu'il n'est pas officiellement lié à AMD.
Des fuites indiquent que l'AMD Ryzen AI Max+ PRO 495 (Gorgon Halo) pourrait intégrer un APU avec 192 Go de VRAM, signalant un avenir prometteur pour l'IA locale. Malgré les coûts potentiellement élevés dus à la crise du stockage, des versions futures comme le Medusa Halo en 2027 pourraient atteindre 256 Go.
Il a été annoncé lors de l'AMD AI Dev Day que le boîtier AMD Ryzen 395 (128 Go) sera lancé en juin. Il a été confirmé qu'il s'agit d'une unité standard sans modifications.

Ce guide explique comment exécuter Flux Schnell (12B) et des LLM sur une carte GPU AMD RX 580 (8 Go) via Vulkan natif, contredisant l'idée que cette carte était obsolète pour l'IA en 2026. La solution implique la compilation native de stable-diffusion.cpp avec GGML_VULKAN=ON, permettant une utilisation directe du GPU sans ROCm ni CUDA.
Ce contenu détaille un pipeline open-source pour créer un "reel" cinématographique de 30 secondes à partir de texte, développé pour un hackathon AMD et fonctionnant sur une seule AMD Instinct MI300X. Il met en évidence les techniques d'optimisation de la mémoire et un rôle double de Directeur/Critique de Vision, permettant à diverses architectures d'IA de partager 192 Go de HBM3.