← heapsort-ai

Edge AI

34 items

ARTICLEDEV.to AI·vor 19Std

If You Time-Traveled Ten Years Back, Would Your AI Still Work?

Dieser Artikel führt den "Zeitreise-Test" für KI ein und zeigt, dass die meisten modernen KI-Anwendungen bei einer Zeitreise in die Vergangenheit aufgrund ihrer Abhängigkeit von Cloud-Infrastruktur und nicht existierenden Remote-Servern versagen würden. Er betont, dass Cloud-KI zwar leistungsfähig ist, aber nicht eigenständig auf dem Gerät funktioniert und kritisch von externen Systemen abhängt.

55
ARTICLE↑ trendingReddit r/LocalLLaMA·vor 28T

I got a real transformer language model running locally on a stock Game Boy Color!

Ein Transformer-Sprachmodell (TinyStories-260K) wurde erfolgreich lokal auf einem handelsüblichen Game Boy Color ausgeführt, unter Verwendung von INT8-Gewichten und Festkomma-Arithmetik. Diese beeindruckende technische Leistung umfasste ein benutzerdefiniertes ROM und die Tokenisierung auf dem Gerät, trotz extrem langsamer Leistung und unsinniger Ausgabe.

I got a real transformer language model running locally on a stock Game Boy Color!
42
RESEARCHarXiv CS.AI·vor 6T

Toward a Modular Architecture for Embedded AI Agent Systems at the Edge

Dieses Papier schlägt eine modulare Referenzarchitektur für eingebettete Agentensysteme vor, die die Herausforderungen bei der Bereitstellung agentischer KI in ubiquitären Computerumgebungen mit strengen Speicher- und Energiebeschränkungen adressiert. Es führt ein gestaffeltes Design ein, das On-Device-Agenten (komprimierte neuronale Netze) von Cloud-Augmented-Agenten (SLMs) für verschiedene Denkebenen entkoppelt.

29
NEWSDEV.to AI·4/22/2026

DEEPX and Hyundai Are Building Generative AI Robots

DEEPX und Hyundai arbeiten zusammen, um generative KI-Roboter mithilfe des neuen Edge-KI-Chips DX-M2 von DEEPX zu entwickeln, wodurch generative KI-Workloads von der Cloud auf das Gerät verlagert werden. Dieser Schritt verspricht geringere Latenz, niedrigeren Stromverbrauch und Echtzeit-Entscheidungsfindung, was einen wichtigen Trend der generativen KI hin zum Edge bestätigt.

29
ARTICLEDEV.to AI·vor 8T

Building the Future of Local AI Intelligence

Gemma 4 ist eine neue KI-Modellfamilie, die darauf ausgelegt ist, lokale, von Entwicklern gesteuerte Intelligenz bereitzustellen und KI von reinen Cloud-Systemen zu lokalen Lösungen zu verlagern. Sie bietet leistungsstarkes Denken, große Kontextfenster für ganze Codebasen und eine effiziente lokale Bereitstellung, wodurch die Abhängigkeit von Cloud-APIs reduziert wird.

29
RESEARCHarXiv CS.LG·4/23/2026

DR-Venus: Towards Frontier Edge-Scale Deep Research Agents with Only 10K Open Data

DR-Venus stellt einen führenden 4B Deep Research Agent für Edge-Scale-Bereitstellung vor, der effektiv mit nur 10K offenen Daten trainiert wurde. Das Training erfolgt in zwei Stufen: Supervised Fine-Tuning für grundlegende Agentenfunktionen, gefolgt von Reinforcement Learning zur Verbesserung der Ausführungssicherheit bei komplexen Forschungsaufgaben.

28
ARTICLEDEV.to AI·4/13/2026

Gemma 4 and the Architecture of On-Device AI

Googles Gemma 4 Ankündigung markiert einen fundamentalen architektonischen Wandel hin zu On-Device-KI, der dezentrales, lokales Computing gegenüber zentralisierter Cloud-Inferenz priorisiert. Dies kehrt den traditionellen Ansatz der Modellskalierung um und konzentriert sich nun auf die Effizienzbeschränkungen von Endgeräten wie Smartphones.

27
NEWSDEV.to AI·vor 9T

Bonsai Image 4B: difusión de 1 bit que corre en un iPhone

PrismML hat Bonsai Image 4B auf den Markt gebracht, eine Familie von Bildgenerierungsmodellen, die 1-Bit- oder ternäre Gewichte verwenden, um hochwertige Diffusion direkt auf Geräten wie iPhones auszuführen. Diese Innovation ermöglicht eine 8,3-fache Modellkomprimierung, wodurch die Größe von 7,75 GB auf 0,93 GB reduziert wird, während bis zu 95 % der ursprünglichen Qualität erhalten bleiben.

27
ARTICLEDEV.to AI·5/8/2026

AI Is Escaping The Browser | The Gemma 4 Edition

Der Artikel untersucht den Übergang der KI, die früher hauptsächlich in Browsern und der Cloud existierte, hin zur Bereitstellung auf gewöhnlicher Hardware. Diese Verschiebung, veranschaulicht durch Modelle wie Gemma 4, wird als bedeutendere Entwicklung hervorgehoben als das bloße Rennen um Leistungsbenchmarks.

27
RESEARCHDEV.to AI·5/8/2026

Micro LM delivers large‑model quality on device

Eine neue Studie stellt Micro Language Models (μLMs) vor, ultrakompakte Modelle (8M–30M Parameter), die große Modellqualität auf Geräten liefern. Dieser Ansatz löst das Dilemma zwischen sofortiger erster Antwort und vollständiger, durchdachter Antwort bei Edge-Assistenten, indem Antworten lokal begonnen und die Latenz durch Cloud-Modelle reduziert werden.

27