← heapsort-ai

Edge AI

34 items

ARTICLEDEV.to AI·hace 19h

If You Time-Traveled Ten Years Back, Would Your AI Still Work?

El artículo presenta la "prueba del viaje en el tiempo" para la IA, mostrando que la mayoría de las aplicaciones modernas de IA fallarían si se transportaran al pasado debido a su dependencia de la infraestructura en la nube y servidores remotos inexistentes. Destaca que, aunque la IA en la nube es potente, no es autosuficiente en el dispositivo y depende críticamente de sistemas externos.

55
ARTICLE↑ trendingReddit r/LocalLLaMA·hace 28d

I got a real transformer language model running locally on a stock Game Boy Color!

Se ejecutó localmente un modelo de lenguaje transformador (TinyStories-260K) en una Game Boy Color estándar, utilizando pesos INT8 y aritmética de punto fijo. Esta impresionante hazaña técnica implicó una ROM personalizada y tokenización en el dispositivo, aunque el rendimiento es extremadamente lento y la salida es incomprensible.

I got a real transformer language model running locally on a stock Game Boy Color!
42
RESEARCHarXiv CS.AI·hace 6d

Toward a Modular Architecture for Embedded AI Agent Systems at the Edge

Este artículo propone una arquitectura de referencia modular para Sistemas de Agentes Embebidos, abordando los desafíos de implementar IA agéntica en entornos de computación omnipresentes con estrictas limitaciones de memoria y energía. Introduce un diseño escalonado que desacopla los agentes en el dispositivo (redes neuronales comprimidas) de los agentes aumentados en la nube (SLMs) para diferentes niveles de razonamiento.

29
NEWSDEV.to AI·22/4/2026

DEEPX and Hyundai Are Building Generative AI Robots

DEEPX y Hyundai se asocian para construir robots de IA generativa utilizando el nuevo chip de IA de borde DX-M2 de DEEPX, trasladando las cargas de trabajo de IA generativa de la nube al dispositivo. Este movimiento promete menor latencia, menor consumo de energía y toma de decisiones en tiempo real, confirmando una tendencia importante de la IA generativa hacia el borde.

29
ARTICLEDEV.to AI·hace 8d

Building the Future of Local AI Intelligence

Gemma 4 es una nueva familia de modelos de IA diseñada para llevar inteligencia local y controlada por desarrolladores, pasando la IA de sistemas solo en la nube a soluciones locales. Ofrece un razonamiento potente, ventanas de contexto amplias para bases de código completas y una implementación local eficiente, reduciendo la dependencia de las API en la nube.

29
RESEARCHarXiv CS.LG·23/4/2026

DR-Venus: Towards Frontier Edge-Scale Deep Research Agents with Only 10K Open Data

DR-Venus presenta un agente de investigación profunda de 4B para despliegue a escala de borde, entrenado eficazmente con solo 10K datos abiertos. Su receta de entrenamiento de dos etapas combina ajuste fino supervisado para capacidades básicas y aprendizaje por refuerzo para mejorar la fiabilidad en tareas de investigación de largo plazo, optimizando la calidad y utilización de los datos.

28
ARTICLEDEV.to AI·13/4/2026

Gemma 4 and the Architecture of On-Device AI

El anuncio de Gemma 4 de Google indica un cambio arquitectónico fundamental hacia la IA en el dispositivo, priorizando la computación distribuida y local sobre la inferencia centralizada en la nube. Esto invierte el enfoque tradicional de escalar modelos, centrándose ahora en las limitaciones de eficiencia de los dispositivos de consumo como los smartphones.

27
RESEARCHDEV.to AI·8/5/2026

Physics‑based adaptation slashes edge LLM energy

QEIL v2 revoluciona la eficiencia energética de los LLM de borde al reemplazar las heurísticas estáticas con un modelo de energía derivado de la física y recocido simulado. Este sistema reduce drásticamente la energía de inferencia adaptando la asignación de recursos basada en la física de semiconductores, logrando mejoras significativas en el rendimiento.

27
ARTICLEDEV.to AI·8/5/2026

AI Is Escaping The Browser | The Gemma 4 Edition

El artículo explora la transición de la IA, que antes residía principalmente en navegadores y la nube, a ser desplegable en hardware común. Este cambio, ejemplificado por modelos como Gemma 4, se destaca como un desarrollo más significativo que la mera carrera por los puntos de referencia de rendimiento.

27
RESEARCHDEV.to AI·8/5/2026

Micro LM delivers large‑model quality on device

Un nuevo estudio presenta los Micro Language Models (μLMs), modelos ultracompactos (8M–30M parámetros) que ofrecen la calidad de modelos grandes en dispositivos. Este enfoque resuelve el dilema entre respuestas rápidas y completas en asistentes de borde, al iniciar las respuestas localmente y reducir la latencia de los modelos en la nube.

27