← heapsort-ai

Optimization

134 items

RESEARCHarXiv CS.CL·vor 12T

EvoSpec: Evolving Speculative Decoding via Real-Time Vocabulary and Parameter AdaptationTarget

EvoSpec stellt ein Framework für die Echtzeitentwicklung von Entwurfsmodellen in der spekulativen Dekodierung für große Sprachmodelle vor, das das Problem großer Vokabulargrößen angeht. Es verwendet dynamische Vokabular- und Parameteranpassung mittels eines kontextsensitiven Mechanismus und einer leichten Online-Abgleichstrategie zur Verbesserung der Akzeptanzraten und Minimierung von Verteilungsunterschieden.

27
RESEARCHarXiv CS.CL·vor 13T

In-Context Optimization for Retrieval-Augmented Generation: A Gradient-Descent Perspective

Diese Forschungsarbeit untersucht Retrieval-Augmented Generation (RAG) aus der Perspektive der In-Context-Optimierung. Sie zeigt, dass eine einzelne lineare Selbstaufmerksamkeitsschicht einen Gradientenabstiegschritt auf einem vereinheitlichten linearisierten RAG-Ziel implementieren kann, was ein exaktes Regime offenbart, in dem abrufgestützte Vorhersage und In-Context-Optimierung zusammenfallen.

27
ARTICLEDEV.to AI·4/27/2026

Context Compression in .NET

Dieser schnelle Tipp erklärt, wie Kontextkomprimierung in .NET für RAG-Systeme implementiert werden kann, da ein direktes Äquivalent zu Tools wie LLMLingua fehlt. Es wird vorgeschlagen, ein kleineres, günstigeres Arbeitsmodell zu verwenden, um abgerufene Dokumentation vorzuverarbeiten und nur wesentliche Fakten zu extrahieren, um Kosten und Latenz bei Premium-KI-Modellen zu reduzieren.

27
RESEARCHarXiv CS.LG·4/6/2026

Characterizing WebGPU Dispatch Overhead for LLM Inference Across Four GPU Vendors, Three Backends, and Three Browsers

Este estudo caracteriza a sobrecarga de despacho do WebGPU para inferência de LLM em diversas plataformas de GPU, backends e navegadores. Ele revela que benchmarks simples superestimam os custos e identifica o verdadeiro custo por despacho da API WebGPU, destacando a necessidade dessa distinção para otimizações eficazes.

27
RESEARCHarXiv CS.AI·4/30/2026

Hierarchical Multi-Persona Induction from User Behavioral Logs: Learning Evidence-Grounded and Truthful Personas

Dieser Artikel schlägt einen hierarchischen Rahmen vor, um evidenzbasierte Benutzer-Personas aus Verhaltensprotokollen zu induzieren, indem die Persona-Qualität optimiert wird. Die Methode nutzt eine gruppengeweise Erweiterung von DPO und zeigt kohärentere, wahrheitsgetreuere Personas sowie eine verbesserte Vorhersage zukünftiger Interaktionen.

27
RESEARCHarXiv CS.AI·5/6/2026

Accelerating battery research with an AI interface between FINALES and Kadi4Mat

Diese Studie optimiert Formierungsprotokolle für Natrium-Ionen-Knopfzellen hinsichtlich Dauereffizienz und Lebensdauerleistung, unter Verwendung einer KI-Schnittstelle zwischen FINALES und Kadi4Mat. Der Rahmen nutzt mehrzielige Stapel-Bayes'sche Optimierung zur Steuerung der Experimentauswahl, um die Entdeckung zu beschleunigen und den Ressourcenverbrauch zu reduzieren.

27
RESEARCHarXiv CS.AI·4/14/2026

Linear Programming for Multi-Criteria Assessment with Cardinal and Ordinal Data: A Pessimistic Virtual Gap Analysis

Diese Arbeit stellt neuartige, auf linearer Programmierung basierende Virtual Gap Analysis (VGA)-Modelle zur multikriteriellen Bewertung vor, die Probleme subjektiver Einschätzungen und Datenvielfalt adressieren. Die zweistufige Methode bewertet Alternativen pessimistisch unter Verwendung kardinaler und ordinaler Daten, was ein effizientes Ranking und die Eliminierung ungünstiger Optionen innerhalb von Entscheidungsunterstützungssystemen ermöglicht.

27
RESEARCHarXiv CS.AI·4/22/2026

On Solving the Multiple Variable Gapped Longest Common Subsequence Problem

Dieses Papier behandelt das Problem der Variable Gapped Longest Common Subsequence (VGLCS), eine Verallgemeinerung des LCS-Problems mit flexiblen Lückenbeschränkungen, relevant für den Vergleich molekularer Sequenzen und die Zeitreihenanalyse. Es wird ein Suchrahmenwerk basierend auf einer wurzelbasierten Zustandsgraphendarstellung und einer iterativen Beam-Search-Strategie vorgeschlagen, um die kombinatorische Explosion zu bewältigen und qualitativ hochwertige Lösungen zu finden.

26