← heapsort-ai

on-device AI

27 items

NEWSDEV.to AI·vor 16T

苹果发布M4 Ultra芯片:端侧AI算力突破新高度

Apple hat den M4 Ultra Chip vorgestellt, der für Edge-KI-Berechnungen entwickelt wurde und über eine 200 TOPS NPU sowie eine intelligente Speicherpool-Technologie verfügt. Dieser Chip ermöglicht die lokale Ausführung von großen Sprachmodellen mit 70 Milliarden Parametern und bietet Datenschutz, geringe Latenz und Kosteneinsparungen.

28
ARTICLEDEV.to AI·4/13/2026

Open-Sourcing Mano-P Today: Pure Vision GUI Agent, OSWorld #1, Apache 2.0

Mano-P, ein reiner Vision-GUI-Agent, wurde unter Apache 2.0 quelloffen veröffentlicht und zeichnet sich dadurch aus, dass er ausschließlich über Screenshots mit Computerbildschirmen interagiert. Es erzielt Spitzenleistungen bei OSWorld-Benchmarks, legt Wert auf Datenschutz durch On-Device-Ausführung und ist somit ein grundlegendes Werkzeug für die Entwicklung personalisierter KI.

27
RESEARCHarXiv CS.CL·4/17/2026

HUOZIIME: An On-Device LLM-enhanced Input Method for Deep Personalization

HUOZIIME ist ein innovativer, LLM-gestützter Eingabemethoden-Editor (IME) für Mobilgeräte, der eine tiefe, echtzeitnahe Personalisierung anstrebt. Er nutzt ein nachtrainiertes Basis-LLM und einen hierarchischen Speichermechanismus, um benutzerspezifische Historie zu erfassen, wodurch ein effizienter und privater Betrieb unter mobilen Einschränkungen sichergestellt wird.

27
ARTICLEDEV.to AI·4/13/2026

Gemma 4 and the Architecture of On-Device AI

Googles Gemma 4 Ankündigung markiert einen fundamentalen architektonischen Wandel hin zu On-Device-KI, der dezentrales, lokales Computing gegenüber zentralisierter Cloud-Inferenz priorisiert. Dies kehrt den traditionellen Ansatz der Modellskalierung um und konzentriert sich nun auf die Effizienzbeschränkungen von Endgeräten wie Smartphones.

27
ARTICLEDEV.to AI·vor 18T

AI MAX & Intel: Local LLMs Change Everything

Die persönliche KI-Revolution beginnt und ermöglicht es großen Sprachmodellen (LLMs), direkt auf PCs zu laufen, wodurch die Cloud nicht mehr benötigt wird. Dieser Wandel bietet beispiellose Privatsphäre, größere Kontrolle und Offline-Fähigkeit, was die Interaktion mit künstlicher Intelligenz grundlegend neu definiert.

27
ARTICLEDEV.to AI·5/8/2026

AI Is Escaping The Browser | The Gemma 4 Edition

Der Artikel untersucht den Übergang der KI, die früher hauptsächlich in Browsern und der Cloud existierte, hin zur Bereitstellung auf gewöhnlicher Hardware. Diese Verschiebung, veranschaulicht durch Modelle wie Gemma 4, wird als bedeutendere Entwicklung hervorgehoben als das bloße Rennen um Leistungsbenchmarks.

27
RESEARCHDEV.to AI·5/8/2026

Micro LM delivers large‑model quality on device

Eine neue Studie stellt Micro Language Models (μLMs) vor, ultrakompakte Modelle (8M–30M Parameter), die große Modellqualität auf Geräten liefern. Dieser Ansatz löst das Dilemma zwischen sofortiger erster Antwort und vollständiger, durchdachter Antwort bei Edge-Assistenten, indem Antworten lokal begonnen und die Latenz durch Cloud-Modelle reduziert werden.

27
RESEARCHarXiv CS.LG·4/28/2026

Parameter Efficiency Is Not Memory Efficiency: Rethinking Fine-Tuning for On-Device LLM Adaptation

Diese Forschung stellt die Annahme in Frage, dass PEFT gleich Speichereffizienz für On-Device-LLMs ist, und zeigt, dass bestehende Methoden zu Out-of-Memory-Fehlern führen können. Sie stellt LARS vor, ein neues Framework, das den Speicherverbrauch von der Sequenzlänge entkoppelt, indem es den Aktivierungsunterraum einschränkt, und den Speicherbedarf um durchschnittlich 33,54% reduziert.

27
ARTICLEDEV.to AI·4/18/2026

How I built a Zero-Upload AI Workspace in the browser using WebGPU

PrivaKit ist ein browserbasierter KI-Arbeitsbereich, der für sensible Daten entwickelt wurde und sämtliche Inferenz (OCR, Transkription, Bildverarbeitung) strikt geräteintern mittels WebGPU/WASM durchführt. Es eliminiert die Notwendigkeit, vertrauliche Dokumente oder Aufzeichnungen auf Drittanbieter-Cloud-APIs hochzuladen, was die Privatsphäre für Fachleute in Bereichen wie Personalwesen, Recht und Finanzen gewährleistet.

27
DOCDEV.to AI·4/25/2026

Tian AI Knowledge Base: Million Entries on Your Phone

Tian AI entwickelte eine lokale Wissensbasis mit Millionen von Einträgen, gespeichert in einer einzigen SQLite-Datei und in Millisekunden durchsuchbar, um kleinere LLMs auf Telefonen zu erweitern. Dieses System nutzt einen KnowledgeRetriever, um Anfragen direkt zu beantworten oder relevanten Kontext in den LLM-Prompt einzufügen und so erweiterte Antworten zu generieren.

27