← heapsort-ai

efficiency

106 items

RESEARCHarXiv CS.LG·vor 29T

LKV: End-to-End Learning of Head-wise Budgets and Token Selection for LLM KV Cache Eviction

Dieses Papier stellt LKV (Learned KV Eviction) vor, einen neuartigen Ansatz zur Optimierung des Key-Value (KV)-Cache-Speichers in Large Language Models (LLMs). LKV formuliert die KV-Cache-Kompression als ein durchgängiges, differenzierbares Optimierungsproblem, das Budgets und Token-Auswahl lernt, um die Einschränkungen heuristischer Methoden zu überwinden.

27
RESEARCHarXiv CS.CL·vor 27T

ReVision: Scaling Computer-Use Agents via Temporal Visual Redundancy Reduction

ReVision stellt eine Methode zur Skalierung von Computernutzungsagenten vor, indem die zeitliche visuelle Redundanz in Interaktionstrajektorien reduziert wird. Es verwendet einen gelernten Patch-Selektor, um redundante visuelle Token zu entfernen, was den Token-Verbrauch um etwa 46% senkt und die Effizienz für multimodale Sprachmodelle über Benchmarks hinweg verbessert.

27
RESEARCHarXiv CS.CL·vor 6T

Adaptive Latent Agentic Reasoning

Diese Forschung stellt das Adaptive Latent Agentic Reasoning (ALAR) vor, ein Dual-Modus-Framework zur Steigerung der Effizienz von LLM-Agenten. ALAR nutzt kompaktes latentes Denken für Routineaufgaben und skaliert bei Bedarf einer tieferen Überlegung auf explizites Chain-of-Thought, wodurch vergleichbare oder bessere Aufgabenpräzision bei erheblichen Effizienzsteigerungen erzielt werden.

27
ARTICLEDEV.to AI·vor 17T

From Script to Strategy: How AI Identifies the Perfect 30-Second Demo Clip

Dieser Artikel untersucht, wie KI-Automatisierung die mühsame Aufgabe der Auswahl von 30-Sekunden-Demo-Clips in einen strategischen Vorteil verwandeln kann. Die KI bewertet Skripte basierend auf emotionaler und tonaler Übereinstimmung, Inhaltsrelevanz, technischer Perfektion und struktureller Integrität, um das ideale Segment zu finden. Dieser KI-gesteuerte Ansatz optimiert den Prozess der Erstellung wirkungsvoller Demos für Kunden.

27
ARTICLEDEV.to AI·5/5/2026

The Best AI Tools for Builders (Built for Operators Who Ship Fast and Need AI That Improves Their Aim, Not Just Their Speed)

Dieser Artikel erörtert, wie Entwickler Produkte oft schnell ohne vorherige Validierung auf den Markt bringen, angetrieben von der Freude am Bauen. Er stellt KI-Tools vor, die darauf ausgelegt sind, sowohl Geschwindigkeit als auch Präzision zu verbessern und dabei zu helfen, die Lücke zwischen der Entwicklung eines Produkts und dessen effektivem Verkauf oder dessen Lieferung zu schließen.

27
NEWSDEV.to AI·vor 24T

Today's AI & Tech Digest: AI Psychosis, Small Model Efficiency, and Mobile Coding (2026-05-16)

Das tägliche Tech-Digest beleuchtet die Spannung zwischen der "KI-Psychose" – der irrationalen Überintegration von LLMs – und der technischen Verfeinerung kleiner, spezialisierter Modelle. Es behandelt verschiedene Themen, darunter eine mobile Sicherheitslücke, KI-Tools zur Kompetenzentwicklung und die domänenspezifische Dominanz von KI in der Rechtstechnologie.

27
RESEARCHarXiv CS.AI·vor 21T

Skim: Speculative Execution for Fast and Efficient Web Agents

Skim ist ein spekulatives Ausführungsframework für Web-Agenten, das die vorhersagbare Struktur von Websites nutzt, um die Effizienz zu steigern. Es ermöglicht den meisten Anfragen, ressourcenintensive Komponenten zu umgehen, indem es Offline-Profile und ein kleines Modell für schnelle Antworten verwendet, wobei ein leichter Verifizierer seltene Fehlspekulationen abfängt.

27