← heapsort-ai

Edge AI

34 items

ARTICLEDEV.to AI·il y a 19h

If You Time-Traveled Ten Years Back, Would Your AI Still Work?

Cet article explore le "test du voyage dans le temps" pour l'IA, illustrant que la plupart des applications d'IA modernes échoueraient si elles étaient transportées dans le passé en raison de leur dépendance envers l'infrastructure cloud et des serveurs distants inexistants. Il souligne que bien que l'IA en nuage soit puissante, elle n'est pas autonome sur l'appareil et dépend critiquement de systèmes externes.

55
ARTICLE↑ trendingReddit r/LocalLLaMA·il y a 28j

I got a real transformer language model running locally on a stock Game Boy Color!

Un modèle de langage transformateur (TinyStories-260K) a été exécuté localement sur une Game Boy Color standard, utilisant des poids INT8 et des calculs en virgule fixe. Cette prouesse technique remarquable a impliqué une ROM personnalisée et une tokenisation sur l'appareil, malgré une performance extrêmement lente et une sortie illisible.

I got a real transformer language model running locally on a stock Game Boy Color!
42
RESEARCHarXiv CS.AI·il y a 6j

Toward a Modular Architecture for Embedded AI Agent Systems at the Edge

Cet article propose une architecture de référence modulaire pour les Systèmes d'Agents Embarqués, répondant aux défis du déploiement de l'IA agencée dans des environnements informatiques omniprésents avec des contraintes strictes de mémoire et d'énergie. Il introduit une conception à niveaux qui découple les agents sur appareil (réseaux neuronaux compressés) des agents augmentés par le cloud (SLMs) pour différents niveaux de raisonnement.

29
NEWSDEV.to AI·22/04/2026

DEEPX and Hyundai Are Building Generative AI Robots

DEEPX et Hyundai s'associent pour construire des robots d'IA générative utilisant la nouvelle puce d'IA périphérique DX-M2 de DEEPX, déplaçant les charges de travail d'IA générative du cloud vers l'appareil. Ce mouvement promet une latence plus faible, une consommation d'énergie réduite et une prise de décision en temps réel, confirmant une tendance majeure de l'IA générative vers l'edge.

29
ARTICLEDEV.to AI·il y a 8j

Building the Future of Local AI Intelligence

Gemma 4 est une nouvelle famille de modèles d'IA conçue pour apporter une intelligence locale et contrôlée par les développeurs, déplaçant l'IA des systèmes uniquement basés sur le cloud vers des solutions locales. Elle offre un raisonnement puissant, de grandes fenêtres de contexte pour des bases de code entières et un déploiement local efficace, réduisant la dépendance aux API cloud.

29
RESEARCHarXiv CS.LG·23/04/2026

DR-Venus: Towards Frontier Edge-Scale Deep Research Agents with Only 10K Open Data

DR-Venus présente un agent de recherche approfondie 4B pour le déploiement à l'échelle de la périphérie, entraîné efficacement avec seulement 10K données ouvertes. Sa méthode d'entraînement en deux étapes combine le réglage fin supervisé pour les capacités de base et l'apprentissage par renforcement pour améliorer la fiabilité d'exécution sur des tâches de recherche à long terme.

28
ARTICLEDEV.to AI·13/04/2026

Gemma 4 and the Architecture of On-Device AI

L'annonce de Gemma 4 par Google signale un changement architectural fondamental vers l'IA embarquée, priorisant le calcul distribué et local plutôt que l'inférence centralisée dans le cloud. Cela inverse l'approche traditionnelle de mise à l'échelle des modèles, en se concentrant désormais sur les contraintes d'efficacité des appareils grand public comme les smartphones.

27
RESEARCHDEV.to AI·08/05/2026

Physics‑based adaptation slashes edge LLM energy

QEIL v2 révolutionne l'efficacité énergétique des LLM de périphérie en remplaçant les heuristiques statiques par un modèle énergétique dérivé de la physique et un recuit simulé. Ce système réduit considérablement l'énergie d'inférence en adaptant l'allocation des ressources basée sur la physique des semi-conducteurs, obtenant des améliorations de performance significatives.

27
ARTICLEDEV.to AI·il y a 22j

5 Edge AI Architecture Patterns for Disconnected Environments

L'article souligne la nécessité d'architectures d'IA natives de la périphérie et "offline-first" pour les environnements opérationnels déconnectés, où le fonctionnement continu est essentiel malgré les pannes de réseau. Les tendances du marché, y compris les dépenses importantes projetées pour les serveurs périphériques, soulignent la demande pour de tels systèmes autonomes.

27
NEWSDEV.to AI·il y a 9j

Bonsai Image 4B: difusión de 1 bit que corre en un iPhone

PrismML a lancé Bonsai Image 4B, une famille de modèles de génération d'images utilisant des poids 1 bit ou ternaires pour exécuter la diffusion de haute qualité sur des appareils locaux comme les iPhones. Cette innovation permet une compression du modèle de 8,3 fois, le réduisant de 7,75 Go à 0,93 Go, tout en conservant jusqu'à 95 % de la qualité d'origine.

27
ARTICLEDEV.to AI·08/05/2026

AI Is Escaping The Browser | The Gemma 4 Edition

L'article explore la transition de l'IA, qui résidait principalement dans les navigateurs et le cloud, vers un déploiement sur du matériel ordinaire. Ce changement, illustré par des modèles comme Gemma 4, est présenté comme un développement plus significatif que la simple course aux performances.

27
RESEARCHDEV.to AI·08/05/2026

Micro LM delivers large‑model quality on device

Une nouvelle étude présente les Micro Language Models (μLMs), des modèles ultra-compacts (8M–30M paramètres) qui offrent la qualité des grands modèles sur les appareils. Cette approche résout le dilemme entre des premiers mots réactifs et des réponses complètes pour les assistants de périphérie, en amorçant les réponses localement et en réduisant la latence des modèles cloud.

27