← heapsort-ai

on-device AI

27 items

ARTICLEDEV.to AI·17/4/2026

Local LLM with Google Gemma: On-Device Inference Between Theory and Practice

Este artículo explora la viabilidad y los desafíos de ejecutar LLMs localmente en smartphones, utilizando Google Gemma y LiteRT-LM en una aplicación Flutter. Se centra en las compensaciones del formato del modelo, el tiempo de ejecución y el rendimiento para la inferencia en el dispositivo, destacando la evolución de la pregunta de 'si se puede hacer' a 'cómo se hace'.

27
ARTICLEDEV.to AI·13/4/2026

Open-Sourcing Mano-P Today: Pure Vision GUI Agent, OSWorld #1, Apache 2.0

Mano-P, un agente GUI de visión pura, ha sido lanzado como código abierto bajo Apache 2.0, destacándose por interactuar con pantallas de ordenador únicamente a través de capturas de pantalla. Presume de un rendimiento superior en los benchmarks de OSWorld y prioriza la privacidad al ejecutarse en el dispositivo, sirviendo como base para el desarrollo de IA personalizada.

27
RESEARCHarXiv CS.CL·17/4/2026

HUOZIIME: An On-Device LLM-enhanced Input Method for Deep Personalization

HUOZIIME es un método de entrada (IME) innovador mejorado con LLM, diseñado para dispositivos móviles, que busca una personalización profunda y en tiempo real. Utiliza un LLM base post-entrenado y un mecanismo de memoria jerárquica para capturar el historial del usuario, garantizando un funcionamiento eficiente y privado bajo las limitaciones de los dispositivos móviles.

27
ARTICLEDEV.to AI·13/4/2026

Gemma 4 and the Architecture of On-Device AI

El anuncio de Gemma 4 de Google indica un cambio arquitectónico fundamental hacia la IA en el dispositivo, priorizando la computación distribuida y local sobre la inferencia centralizada en la nube. Esto invierte el enfoque tradicional de escalar modelos, centrándose ahora en las limitaciones de eficiencia de los dispositivos de consumo como los smartphones.

27
ARTICLEDEV.to AI·hace 18d

AI MAX & Intel: Local LLMs Change Everything

La revolución de la IA personal está comenzando, permitiendo que grandes modelos de lenguaje (LLMs) se ejecuten directamente en ordenadores personales, eliminando la necesidad de la nube. Esto ofrece una privacidad sin precedentes, mayor control y capacidad sin conexión, redefiniendo fundamentalmente la interacción con la inteligencia artificial.

27
ARTICLEDEV.to AI·8/5/2026

AI Is Escaping The Browser | The Gemma 4 Edition

El artículo explora la transición de la IA, que antes residía principalmente en navegadores y la nube, a ser desplegable en hardware común. Este cambio, ejemplificado por modelos como Gemma 4, se destaca como un desarrollo más significativo que la mera carrera por los puntos de referencia de rendimiento.

27
RESEARCHDEV.to AI·8/5/2026

Micro LM delivers large‑model quality on device

Un nuevo estudio presenta los Micro Language Models (μLMs), modelos ultracompactos (8M–30M parámetros) que ofrecen la calidad de modelos grandes en dispositivos. Este enfoque resuelve el dilema entre respuestas rápidas y completas en asistentes de borde, al iniciar las respuestas localmente y reducir la latencia de los modelos en la nube.

27
RESEARCHarXiv CS.LG·28/4/2026

Parameter Efficiency Is Not Memory Efficiency: Rethinking Fine-Tuning for On-Device LLM Adaptation

Este trabajo desafía la creencia de que PEFT equivale a eficiencia de memoria para LLMs en dispositivos, mostrando que los métodos actuales pueden causar errores por falta de memoria. Introduce LARS, un nuevo marco que desvincula el consumo de memoria de la longitud de la secuencia al restringir el subespacio de activación, reduciendo la huella de memoria en un 33,54% en promedio.

27
DOCDEV.to AI·25/4/2026

Tian AI Knowledge Base: Million Entries on Your Phone

Tian AI desarrolló una base de conocimientos local de millones de entradas, almacenada en un solo archivo SQLite y buscable en milisegundos, para aumentar los LLM más pequeños en teléfonos. Este sistema utiliza un KnowledgeRetriever para responder directamente a consultas o inyectar contexto relevante en el prompt del LLM para respuestas aumentadas.

27