Edge AI

34 items

ARTICLEDEV.to AI·il y a 19h

If You Time-Traveled Ten Years Back, Would Your AI Still Work?

Cet article explore le "test du voyage dans le temps" pour l'IA, illustrant que la plupart des applications d'IA modernes échoueraient si elles étaient transportées dans le passé en raison de leur dépendance envers l'infrastructure cloud et des serveurs distants inexistants. Il souligne que bien que l'IA en nuage soit puissante, elle n'est pas autonome sur l'appareil et dépend critiquement de systèmes externes.

Portability Edge AI Cloud AI AI dependency

ARTICLE↑ trendingReddit r/LocalLLaMA·il y a 28j

I got a real transformer language model running locally on a stock Game Boy Color!

Un modèle de langage transformateur (TinyStories-260K) a été exécuté localement sur une Game Boy Color standard, utilisant des poids INT8 et des calculs en virgule fixe. Cette prouesse technique remarquable a impliqué une ROM personnalisée et une tokenisation sur l'appareil, malgré une performance extrêmement lente et une sortie illisible.

Hardware Acceleration Edge AI quantization AI inference

I got a real transformer language model running locally on a stock Game Boy Color!

RESEARCHHugging Face Blog·22/04/2026

Gemma 4 VLA Demo on Jetson Orin Nano Super

Démonstration du modèle Gemma 4 VLA fonctionnant sur le périphérique Jetson Orin Nano Super.

Hardware Acceleration NVIDIA Jetson Edge AI vision-language model

DOCDEV.to AI·19/04/2026

Building a Systemic Autonomy Agent: OpenClaw + Gemma 4 & TurboQuant on Raspberry Pi 4B

Ce contenu présente un guide étape par étape pour construire un agent IA autonome, OpenClaw, fonctionnant sur un Raspberry Pi 4B. Il optimise Gemma 4 avec TurboQuant pour une opération locale et en périphérie, suivant le Protocole KheAi.

Edge AI tutorials AI hardware Gemma

RESEARCHarXiv CS.AI·il y a 6j

Toward a Modular Architecture for Embedded AI Agent Systems at the Edge

Cet article propose une architecture de référence modulaire pour les Systèmes d'Agents Embarqués, répondant aux défis du déploiement de l'IA agencée dans des environnements informatiques omniprésents avec des contraintes strictes de mémoire et d'énergie. Il introduit une conception à niveaux qui découple les agents sur appareil (réseaux neuronaux compressés) des agents augmentés par le cloud (SLMs) pour différents niveaux de raisonnement.

LLMs Edge AI Embedded AI Agent systems

NEWSDEV.to AI·22/04/2026

DEEPX and Hyundai Are Building Generative AI Robots

DEEPX et Hyundai s'associent pour construire des robots d'IA générative utilisant la nouvelle puce d'IA périphérique DX-M2 de DEEPX, déplaçant les charges de travail d'IA générative du cloud vers l'appareil. Ce mouvement promet une latence plus faible, une consommation d'énergie réduite et une prise de décision en temps réel, confirmant une tendance majeure de l'IA générative vers l'edge.

Edge AI AI chips robotics Generative AI

ARTICLEDEV.to AI·il y a 8j

Building the Future of Local AI Intelligence

Gemma 4 est une nouvelle famille de modèles d'IA conçue pour apporter une intelligence locale et contrôlée par les développeurs, déplaçant l'IA des systèmes uniquement basés sur le cloud vers des solutions locales. Elle offre un raisonnement puissant, de grandes fenêtres de contexte pour des bases de code entières et un déploiement local efficace, réduisant la dépendance aux API cloud.

Edge AI Gemma 4 Local AI model deployment

RESEARCHarXiv CS.LG·23/04/2026

DR-Venus: Towards Frontier Edge-Scale Deep Research Agents with Only 10K Open Data

DR-Venus présente un agent de recherche approfondie 4B pour le déploiement à l'échelle de la périphérie, entraîné efficacement avec seulement 10K données ouvertes. Sa méthode d'entraînement en deux étapes combine le réglage fin supervisé pour les capacités de base et l'apprentissage par renforcement pour améliorer la fiabilité d'exécution sur des tâches de recherche à long terme.

Edge AI reinforcement learning machine learning training SLMs

ARTICLEDEV.to AI·18/04/2026

Edge AI fails not at detection but at capturing the full story

Ce contenu souligne une limitation critique des appareils Edge AI : la capture de preuves d'événements est limitée au moment de la détection. Cela entraîne un manque de contexte avant et après l'événement, conduisant à des jugements erronés et à des résultats incertains.

Edge AI AI limitations contextual AI Data Quality

ARTICLEDEV.to AI·17/04/2026

Building an AI Tutor for Ethiopia: What I Learned Competing in AWS AIdeas 2025

Un développeur raconte la création d'un tuteur IA pour des étudiants éthiopiens, confronté à de sévères contraintes d'infrastructure comme un accès internet peu fiable. Cela l'a amené à explorer l'IA en périphérie et des systèmes hybrides pour assurer une fonctionnalité hors ligne.

education Edge AI developing regions resilient AI systems

ARTICLEDEV.to AI·13/04/2026

Gemma 4 and the Architecture of On-Device AI

L'annonce de Gemma 4 par Google signale un changement architectural fondamental vers l'IA embarquée, priorisant le calcul distribué et local plutôt que l'inférence centralisée dans le cloud. Cela inverse l'approche traditionnelle de mise à l'échelle des modèles, en se concentrant désormais sur les contraintes d'efficacité des appareils grand public comme les smartphones.

AI architecture Edge AI Gemma 4 on-device AI

RESEARCHDEV.to AI·08/05/2026

Physics‑based adaptation slashes edge LLM energy

QEIL v2 révolutionne l'efficacité énergétique des LLM de périphérie en remplaçant les heuristiques statiques par un modèle énergétique dérivé de la physique et un recuit simulé. Ce système réduit considérablement l'énergie d'inférence en adaptant l'allocation des ressources basée sur la physique des semi-conducteurs, obtenant des améliorations de performance significatives.

Optimization Edge AI Energy Efficiency resource management

ARTICLEDEV.to AI·il y a 21j

Google AI Edge Gallery Just Added MCP. Here's What On-Device Agents Can Actually Do Now

Google AI Edge Gallery a introduit le Protocole de Contexte de Modèle (MCP), permettant à l'IA embarquée d'interagir avec des systèmes externes sans routage via un serveur. Cela résout la tension fondamentale de l'IA de périphérie, améliorant l'utilité, la confidentialité et la latence.

Google AI Edge AI privacy MCP

ARTICLEDEV.to AI·il y a 22j

5 Edge AI Architecture Patterns for Disconnected Environments

L'article souligne la nécessité d'architectures d'IA natives de la périphérie et "offline-first" pour les environnements opérationnels déconnectés, où le fonctionnement continu est essentiel malgré les pannes de réseau. Les tendances du marché, y compris les dépenses importantes projetées pour les serveurs périphériques, soulignent la demande pour de tels systèmes autonomes.

operational autonomy disconnected environments Edge AI IoT

NEWSDEV.to AI·il y a 9j

Bonsai Image 4B: difusión de 1 bit que corre en un iPhone

PrismML a lancé Bonsai Image 4B, une famille de modèles de génération d'images utilisant des poids 1 bit ou ternaires pour exécuter la diffusion de haute qualité sur des appareils locaux comme les iPhones. Cette innovation permet une compression du modèle de 8,3 fois, le réduisant de 7,75 Go à 0,93 Go, tout en conservant jusqu'à 95 % de la qualité d'origine.

Diffusion Models Edge AI image generation PrismML

NEWSGoogle for Developers (YouTube)·il y a 18j

Bring the power of on-device AI to life with Google AI Edge and Gemma

Ce contenu explore comment Google fait progresser l'intelligence artificielle sur les appareils avec ses technologies AI Edge et Gemma. Il met en évidence la puissance d'apporter l'IA directement au matériel de l'utilisateur.

AI models Edge AI on-device AI Gemma

Bring the power of on-device AI to life with Google AI Edge and Gemma

ARTICLEDEV.to AI·08/05/2026

AI Is Escaping The Browser | The Gemma 4 Edition

L'article explore la transition de l'IA, qui résidait principalement dans les navigateurs et le cloud, vers un déploiement sur du matériel ordinaire. Ce changement, illustré par des modèles comme Gemma 4, est présenté comme un développement plus significatif que la simple course aux performances.

AI models Edge AI Gemma 4 on-device AI

NEWSDEV.to AI·05/05/2026

TSU Protocol: Seeking Open-Source RISC-V NPU Tape-Out Partners (1778004809)

Le protocole TSU recherche activement des partenaires de parrainage pour le premier tape-out MPW de sa norme NPU RISC-V open source et libre de droits pour l'inférence d'IA en périphérie. Ils ont besoin de 50K$-200K$ pour couvrir les coûts de la navette, offrant aux partenaires une reconnaissance et un accès anticipé au RTL.

Open Source NPU Edge AI semiconductor

ARTICLEDEV.to AI·il y a 23j

2026年AI行业趋势：从工具到智能体

En 2026, l'industrie de l'IA passera des outils aux agents intelligents, avec les agents IA et la compréhension multimodale devenant courants. Les autres tendances incluent l'IA de périphérie, les assistants de programmation IA omniprésents et l'importance croissante de la réglementation.

AI regulation multimodal AI Edge AI AI agent

RESEARCHDEV.to AI·08/05/2026

Micro LM delivers large‑model quality on device

Une nouvelle étude présente les Micro Language Models (μLMs), des modèles ultra-compacts (8M–30M paramètres) qui offrent la qualité des grands modèles sur les appareils. Cette approche résout le dilemme entre des premiers mots réactifs et des réponses complètes pour les assistants de périphérie, en amorçant les réponses localement et en réduisant la latence des modèles cloud.

language models micro LMs Edge AI on-device AI