Edge AI

34 items

ARTICLEDEV.to AI·hace 19h

If You Time-Traveled Ten Years Back, Would Your AI Still Work?

El artículo presenta la "prueba del viaje en el tiempo" para la IA, mostrando que la mayoría de las aplicaciones modernas de IA fallarían si se transportaran al pasado debido a su dependencia de la infraestructura en la nube y servidores remotos inexistentes. Destaca que, aunque la IA en la nube es potente, no es autosuficiente en el dispositivo y depende críticamente de sistemas externos.

Portability Edge AI Cloud AI AI dependency

ARTICLE↑ trendingReddit r/LocalLLaMA·hace 28d

I got a real transformer language model running locally on a stock Game Boy Color!

Se ejecutó localmente un modelo de lenguaje transformador (TinyStories-260K) en una Game Boy Color estándar, utilizando pesos INT8 y aritmética de punto fijo. Esta impresionante hazaña técnica implicó una ROM personalizada y tokenización en el dispositivo, aunque el rendimiento es extremadamente lento y la salida es incomprensible.

Hardware Acceleration Edge AI quantization AI inference

I got a real transformer language model running locally on a stock Game Boy Color!

RESEARCHHugging Face Blog·22/4/2026

Gemma 4 VLA Demo on Jetson Orin Nano Super

Demostración del modelo Gemma 4 VLA ejecutándose en el dispositivo Jetson Orin Nano Super.

Hardware Acceleration NVIDIA Jetson Edge AI vision-language model

DOCDEV.to AI·19/4/2026

Building a Systemic Autonomy Agent: OpenClaw + Gemma 4 & TurboQuant on Raspberry Pi 4B

Este contenido detalla una guía paso a paso para construir un agente de IA autónomo, OpenClaw, que se ejecuta en un Raspberry Pi 4B. Optimiza Gemma 4 con TurboQuant para una operación local y de borde, siguiendo el Protocolo KheAi.

Edge AI tutorials AI hardware Gemma

RESEARCHarXiv CS.AI·hace 6d

Toward a Modular Architecture for Embedded AI Agent Systems at the Edge

Este artículo propone una arquitectura de referencia modular para Sistemas de Agentes Embebidos, abordando los desafíos de implementar IA agéntica en entornos de computación omnipresentes con estrictas limitaciones de memoria y energía. Introduce un diseño escalonado que desacopla los agentes en el dispositivo (redes neuronales comprimidas) de los agentes aumentados en la nube (SLMs) para diferentes niveles de razonamiento.

LLMs Edge AI Embedded AI Agent systems

NEWSDEV.to AI·22/4/2026

DEEPX and Hyundai Are Building Generative AI Robots

DEEPX y Hyundai se asocian para construir robots de IA generativa utilizando el nuevo chip de IA de borde DX-M2 de DEEPX, trasladando las cargas de trabajo de IA generativa de la nube al dispositivo. Este movimiento promete menor latencia, menor consumo de energía y toma de decisiones en tiempo real, confirmando una tendencia importante de la IA generativa hacia el borde.

Edge AI AI chips robotics Generative AI

ARTICLEDEV.to AI·hace 8d

Building the Future of Local AI Intelligence

Gemma 4 es una nueva familia de modelos de IA diseñada para llevar inteligencia local y controlada por desarrolladores, pasando la IA de sistemas solo en la nube a soluciones locales. Ofrece un razonamiento potente, ventanas de contexto amplias para bases de código completas y una implementación local eficiente, reduciendo la dependencia de las API en la nube.

Edge AI Gemma 4 Local AI model deployment

RESEARCHarXiv CS.LG·23/4/2026

DR-Venus: Towards Frontier Edge-Scale Deep Research Agents with Only 10K Open Data

DR-Venus presenta un agente de investigación profunda de 4B para despliegue a escala de borde, entrenado eficazmente con solo 10K datos abiertos. Su receta de entrenamiento de dos etapas combina ajuste fino supervisado para capacidades básicas y aprendizaje por refuerzo para mejorar la fiabilidad en tareas de investigación de largo plazo, optimizando la calidad y utilización de los datos.

Edge AI reinforcement learning machine learning training SLMs

ARTICLEDEV.to AI·18/4/2026

Edge AI fails not at detection but at capturing the full story

Este contenido aborda una limitación clave en dispositivos Edge AI: la captura de evidencia de eventos se limita solo al momento de la detección. Esto provoca una falta de contexto pre y post-evento, llevando a juicios erróneos y resultados inciertos.

Edge AI AI limitations contextual AI Data Quality

ARTICLEDEV.to AI·17/4/2026

Building an AI Tutor for Ethiopia: What I Learned Competing in AWS AIdeas 2025

Un desarrollador comparte su experiencia creando un tutor de IA para estudiantes etíopes, lidiando con graves limitaciones de infraestructura como internet poco fiable. Esto lo llevó a implementar IA de borde y sistemas híbridos para asegurar el funcionamiento sin conexión.

education Edge AI developing regions resilient AI systems

ARTICLEDEV.to AI·13/4/2026

Gemma 4 and the Architecture of On-Device AI

El anuncio de Gemma 4 de Google indica un cambio arquitectónico fundamental hacia la IA en el dispositivo, priorizando la computación distribuida y local sobre la inferencia centralizada en la nube. Esto invierte el enfoque tradicional de escalar modelos, centrándose ahora en las limitaciones de eficiencia de los dispositivos de consumo como los smartphones.

AI architecture Edge AI Gemma 4 on-device AI

RESEARCHDEV.to AI·8/5/2026

Physics‑based adaptation slashes edge LLM energy

QEIL v2 revoluciona la eficiencia energética de los LLM de borde al reemplazar las heurísticas estáticas con un modelo de energía derivado de la física y recocido simulado. Este sistema reduce drásticamente la energía de inferencia adaptando la asignación de recursos basada en la física de semiconductores, logrando mejoras significativas en el rendimiento.

Optimization Edge AI Energy Efficiency resource management

ARTICLEDEV.to AI·hace 21d

Google AI Edge Gallery Just Added MCP. Here's What On-Device Agents Can Actually Do Now

Google AI Edge Gallery ha introducido el Protocolo de Contexto de Modelo (MCP), que permite a la IA en el dispositivo interactuar con sistemas externos sin enrutamiento a través de un servidor. Esto resuelve la tensión fundamental de la IA de borde, mejorando la utilidad, la privacidad y la latencia.

Google AI Edge AI privacy MCP

ARTICLEDEV.to AI·hace 22d

5 Edge AI Architecture Patterns for Disconnected Environments

El artículo destaca la necesidad de arquitecturas de IA nativas del borde y "offline-first" para entornos operativos desconectados, donde la operación continua es crítica a pesar de las fallas de red. Las tendencias del mercado, incluido el gasto proyectado significativo en servidores de borde, enfatizan la demanda de estos sistemas autónomos.

operational autonomy disconnected environments Edge AI IoT

NEWSDEV.to AI·hace 9d

Bonsai Image 4B: difusión de 1 bit que corre en un iPhone

Bonsai Image 4B de PrismML es una familia de modelos de generación de imágenes que utiliza pesos de 1 bit o ternarios para ejecutar difusión de alta calidad directamente en dispositivos como iPhones. Este modelo logra una compresión de 8,3 veces, reduciendo su tamaño de 7,75 GB a 0,93 GB, manteniendo hasta el 95% de la calidad original.

Diffusion Models Edge AI image generation PrismML

NEWSGoogle for Developers (YouTube)·hace 18d

Bring the power of on-device AI to life with Google AI Edge and Gemma

Este contenido explora cómo Google está avanzando en la inteligencia artificial en dispositivos con sus tecnologías AI Edge y Gemma. Destaca el poder de llevar la IA directamente al hardware del usuario.

AI models Edge AI on-device AI Gemma

Bring the power of on-device AI to life with Google AI Edge and Gemma

ARTICLEDEV.to AI·8/5/2026

AI Is Escaping The Browser | The Gemma 4 Edition

El artículo explora la transición de la IA, que antes residía principalmente en navegadores y la nube, a ser desplegable en hardware común. Este cambio, ejemplificado por modelos como Gemma 4, se destaca como un desarrollo más significativo que la mera carrera por los puntos de referencia de rendimiento.

AI models Edge AI Gemma 4 on-device AI

NEWSDEV.to AI·5/5/2026

TSU Protocol: Seeking Open-Source RISC-V NPU Tape-Out Partners (1778004809)

TSU Protocol busca activamente socios patrocinadores para el primer tape-out MPW de su estándar NPU RISC-V de código abierto y libre de regalías para inferencia de IA en el borde. Necesitan entre 50.000 y 200.000 dólares para cubrir los costes de envío, ofreciendo a los socios reconocimiento y acceso anticipado al RTL.

Open Source NPU Edge AI semiconductor

ARTICLEDEV.to AI·hace 23d

2026年AI行业趋势：从工具到智能体

En 2026, la industria de la IA pasará de herramientas a agentes inteligentes, con los Agentes de IA y la comprensión multimodal volviéndose comunes. Otras tendencias incluyen la IA en el borde, asistentes de programación de IA y la creciente importancia de la regulación.

AI regulation multimodal AI Edge AI AI agent

RESEARCHDEV.to AI·8/5/2026

Micro LM delivers large‑model quality on device

Un nuevo estudio presenta los Micro Language Models (μLMs), modelos ultracompactos (8M–30M parámetros) que ofrecen la calidad de modelos grandes en dispositivos. Este enfoque resuelve el dilema entre respuestas rápidas y completas en asistentes de borde, al iniciar las respuestas localmente y reducir la latencia de los modelos en la nube.

language models micro LMs Edge AI on-device AI