on-device AI

27 items

NEWS↑ trendingReddit r/LocalLLaMA·15/4/2026

1-bit Bonsai 1.7B (290MB in size) running locally in your browser on WebGPU

Este contenido anuncia la ejecución del modelo 1-bit Bonsai 1.7B (290MB) directamente en el navegador, utilizando la tecnología WebGPU. Se proporciona un enlace a la demostración en Hugging Face Spaces, destacando una innovación en el ML del lado del cliente.

Bonsai on-device AI browser AI LLM

1-bit Bonsai 1.7B (290MB in size) running locally in your browser on WebGPU

ARTICLE↑ trendingHacker News (AI)·hace 12d

Occupy Wall Street co-founder built an on-device AI for activists

Un cofundador de Occupy Wall Street ha desarrollado una aplicación de IA que funciona en el dispositivo, con el objetivo de equipar a los activistas con herramientas para 'apoderarse de los medios de computación'. Esta iniciativa busca empoderar a los movimientos sociales a través de tecnología accesible y descentralizada.

on-device AI decentralization AI activism Occupy Wall Street

NEWSDEV.to AI·hace 5d

Gemma 4 12B shows how far local multimodal AI has moved

El Gemma 4 12B de Google DeepMind es un modelo multimodal de IA importante, diseñado para ejecución local y en dispositivos, reduciendo la brecha para la IA en laptops. Soporta entrada de texto, imágenes y audio nativo, facilitando la experimentación y los flujos de trabajo en el dispositivo para desarrolladores.

AI models multimodal AI on-device AI Gemma

ARTICLEDEV.to AI·25/4/2026

Behind the Scenes of a Self-Evolving AI: The Architecture of Tian AI

Este artículo detalla la arquitectura de Tian AI, un sistema de IA auto-evolutivo de código abierto que funciona completamente en dispositivos Android sin depender de la nube. Destaca una filosofía de diseño que combina un modelo pequeño, buena arquitectura y una base de conocimiento local para un rendimiento superior.

AI architecture open-source AI on-device AI Local AI

ARTICLEDEV.to AI·hace 8d

How Local AI Models Are Quietly Changing the Future of Development

Gemma 4 representa un cambio significativo hacia la IA de alto rendimiento que puede ejecutarse localmente en diversos dispositivos, superando los modelos dependientes de la nube. Esto mejora la accesibilidad, la privacidad y el control del desarrollador al permitir la computación en el dispositivo, menor latencia y mayor personalización.

privacy Gemma 4 on-device AI Local AI

NEWSDEV.to AI·hace 16d

苹果发布M4 Ultra芯片：端侧AI算力突破新高度

Apple lanzó el chip M4 Ultra, diseñado para la computación de IA en el borde, con una NPU de 200 TOPS y tecnología de grupo de memoria inteligente. Este chip permite la ejecución local de grandes modelos de lenguaje de 70B parámetros, ofreciendo privacidad, baja latencia y ahorro de costos.

Apple privacy on-device AI AI chip

ARTICLEDEV.to AI·17/4/2026

Local LLM with Google Gemma: On-Device Inference Between Theory and Practice

Este artículo explora la viabilidad y los desafíos de ejecutar LLMs localmente en smartphones, utilizando Google Gemma y LiteRT-LM en una aplicación Flutter. Se centra en las compensaciones del formato del modelo, el tiempo de ejecución y el rendimiento para la inferencia en el dispositivo, destacando la evolución de la pregunta de 'si se puede hacer' a 'cómo se hace'.

mobile development on-device AI LLM

ARTICLEDEV.to AI·13/4/2026

Open-Sourcing Mano-P Today: Pure Vision GUI Agent, OSWorld #1, Apache 2.0

Mano-P, un agente GUI de visión pura, ha sido lanzado como código abierto bajo Apache 2.0, destacándose por interactuar con pantallas de ordenador únicamente a través de capturas de pantalla. Presume de un rendimiento superior en los benchmarks de OSWorld y prioriza la privacidad al ejecutarse en el dispositivo, sirviendo como base para el desarrollo de IA personalizada.

Open Source GUI automation AI agent on-device AI

RESEARCHarXiv CS.CL·17/4/2026

HUOZIIME: An On-Device LLM-enhanced Input Method for Deep Personalization

HUOZIIME es un método de entrada (IME) innovador mejorado con LLM, diseñado para dispositivos móviles, que busca una personalización profunda y en tiempo real. Utiliza un LLM base post-entrenado y un mecanismo de memoria jerárquica para capturar el historial del usuario, garantizando un funcionamiento eficiente y privado bajo las limitaciones de los dispositivos móviles.

personalization Mobile AI on-device AI LLM

ARTICLEDEV.to AI·13/4/2026

Gemma 4 and the Architecture of On-Device AI

El anuncio de Gemma 4 de Google indica un cambio arquitectónico fundamental hacia la IA en el dispositivo, priorizando la computación distribuida y local sobre la inferencia centralizada en la nube. Esto invierte el enfoque tradicional de escalar modelos, centrándose ahora en las limitaciones de eficiencia de los dispositivos de consumo como los smartphones.

AI architecture Edge AI Gemma 4 on-device AI

ARTICLEDEV.to AI·hace 21d

Google AI Edge Gallery Just Added MCP. Here's What On-Device Agents Can Actually Do Now

Google AI Edge Gallery ha introducido el Protocolo de Contexto de Modelo (MCP), que permite a la IA en el dispositivo interactuar con sistemas externos sin enrutamiento a través de un servidor. Esto resuelve la tensión fundamental de la IA de borde, mejorando la utilidad, la privacidad y la latencia.

Google AI Edge AI privacy MCP

ARTICLEDEV.to AI·hace 18d

AI MAX & Intel: Local LLMs Change Everything

La revolución de la IA personal está comenzando, permitiendo que grandes modelos de lenguaje (LLMs) se ejecuten directamente en ordenadores personales, eliminando la necesidad de la nube. Esto ofrece una privacidad sin precedentes, mayor control y capacidad sin conexión, redefiniendo fundamentalmente la interacción con la inteligencia artificial.

privacy security on-device AI Local LLMs

NEWSGoogle for Developers (YouTube)·hace 18d

Bring the power of on-device AI to life with Google AI Edge and Gemma

Este contenido explora cómo Google está avanzando en la inteligencia artificial en dispositivos con sus tecnologías AI Edge y Gemma. Destaca el poder de llevar la IA directamente al hardware del usuario.

AI models Edge AI on-device AI Gemma

Bring the power of on-device AI to life with Google AI Edge and Gemma

ARTICLEDEV.to AI·8/5/2026

AI Is Escaping The Browser | The Gemma 4 Edition

El artículo explora la transición de la IA, que antes residía principalmente en navegadores y la nube, a ser desplegable en hardware común. Este cambio, ejemplificado por modelos como Gemma 4, se destaca como un desarrollo más significativo que la mera carrera por los puntos de referencia de rendimiento.

AI models Edge AI Gemma 4 on-device AI

ARTICLEDEV.to AI·hace 11d

I Pointed Chrome's Prompt API at a 1.25 Million Character Memoir, and It Got Interesting Fast

El autor creó Gemini Nano Book Lab, una extensión de Chrome que utiliza la API de Prompt para interactuar con un modelo de lenguaje en el dispositivo sobre un libro extenso. El experimento explora el comportamiento del modelo, los costos de recuperación y los límites de la API al procesar grandes volúmenes de texto.

language models Chrome on-device AI Gemini Nano

RESEARCHDEV.to AI·8/5/2026

Micro LM delivers large‑model quality on device

Un nuevo estudio presenta los Micro Language Models (μLMs), modelos ultracompactos (8M–30M parámetros) que ofrecen la calidad de modelos grandes en dispositivos. Este enfoque resuelve el dilema entre respuestas rápidas y completas en asistentes de borde, al iniciar las respuestas localmente y reducir la latencia de los modelos en la nube.

language models micro LMs Edge AI on-device AI

RESEARCHarXiv CS.LG·28/4/2026

Parameter Efficiency Is Not Memory Efficiency: Rethinking Fine-Tuning for On-Device LLM Adaptation

Este trabajo desafía la creencia de que PEFT equivale a eficiencia de memoria para LLMs en dispositivos, mostrando que los métodos actuales pueden causar errores por falta de memoria. Introduce LARS, un nuevo marco que desvincula el consumo de memoria de la longitud de la secuencia al restringir el subespacio de activación, reduciendo la huella de memoria en un 33,54% en promedio.

Memory Optimization on-device AI Fine-tuning PEFT

DOCDEV.to AI·hace 29d

Building a Zero-Cost AI Feature in Flutter with Gemma 4 + Firebase

El artículo describe cómo construir una característica de IA de costo cero en aplicaciones Flutter combinando inferencia en el dispositivo con Gemma 4 y sincronización en la nube con Firebase. Este enfoque elimina las tarifas de API y los costos de servidor, permitiendo que las aplicaciones con IA escalen sin agotar recursos.

Firebase on-device AI Gemma Flutter

ARTICLEDEV.to AI·18/4/2026

How I built a Zero-Upload AI Workspace in the browser using WebGPU

PrivaKit es un espacio de trabajo de IA en el navegador que procesa datos sensibles localmente, sin subirlos a la nube, utilizando WebGPU/WASM. Permite OCR, transcripción y procesamiento de imágenes directamente en el dispositivo, garantizando la privacidad para profesionales de RRHH, legal y finanzas.

privacy machine learning on-device AI WebGPU

DOCDEV.to AI·25/4/2026

Tian AI Knowledge Base: Million Entries on Your Phone

Tian AI desarrolló una base de conocimientos local de millones de entradas, almacenada en un solo archivo SQLite y buscable en milisegundos, para aumentar los LLM más pequeños en teléfonos. Este sistema utiliza un KnowledgeRetriever para responder directamente a consultas o inyectar contexto relevante en el prompt del LLM para respuestas aumentadas.

SQLite RAG on-device AI knowledge base