← heapsort-ai

Optimization

134 items

RESEARCHarXiv CS.LG·4/27/2026

Focus Session: Hardware and Software Techniques for Accelerating Multimodal Foundation Models

Diese Forschung stellt eine vielschichtige Methodik zur Beschleunigung multimodaler Fundamentmodelle (MFMs) durch Hardware- und Software-Co-Design vor. Sie nutzt Optimierungstechniken wie hierarchiebewusste Mixed-Precision-Quantisierung, strukturelles Pruning und spekulatives Decoding, um Rechen- und Speicheranforderungen zu reduzieren.

27
RESEARCHarXiv CS.LG·4/17/2026

TOPCELL: Topology Optimization of Standard Cell via LLMs

TOPCELL ist ein neuartiges Framework, das Large Language Models (LLMs) zur Optimierung der Transistortopologie im Standardzellendesign nutzt und die Einschränkungen traditioneller erschöpfender Suchmethoden überwindet. Durch die Umformulierung der Topologie-Exploration als generative Aufgabe und den Einsatz von GRPO zur Feinabstimmung verbessert es die Entdeckung von routbaren und physikalisch bewussten Layouts für fortgeschrittene Technologieknoten erheblich.

27
ARTICLEDEV.to AI·vor 29T

When I started running models locally, I thought quantization meant squeezing more into RAM. Turns o

Der Artikel rät von der Standardverwendung von Q4_K_M für die lokale LLM-Inferenz ab und betont, dass optimale Leistung durch das Testen von Quantisierungsstufen erzielt wird, die auf spezifische Workflows zugeschnitten sind. Er schlägt vor, dass aggressive Quantisierung wie Q3_K_S die Latenz erheblich reduzieren kann, mit kaum wahrnehmbarem Qualitätsverlust für viele Aufgaben, obwohl die Kontextlänge einen Kompromiss darstellt.

27
RESEARCHarXiv CS.LG·4/20/2026

Mapping High-Performance Regions in Battery Scheduling across Data Uncertainty, Battery Design, and Planning Horizons

Diese Studie analysiert die Batteriespeicherung mittels mehrstufiger modellprädiktiver Regelung, wobei das Zusammenspiel von Datenmerkmalen, Prognoseunsicherheit und Planungshorizont untersucht wird. Sie identifiziert einen „effektiven Horizont“ für die optimale Vorlaufzeit, der Rechenkosten reduziert und praktische Anleitungen für den industriellen Speicherbetrieb bietet.

27
RESEARCHarXiv CS.LG·5/4/2026

Information-Theoretic Generalization Bounds for Stochastic Gradient Descent with Predictable Virtual Noise

Dieser Artikel führt vorhersehbare, geschichtsadaptive virtuelle Störungen ein, um informations-theoretische Generalisierungsgrenzen für den Stochastischen Gradientenabstieg zu verbessern. Dieser neue Ansatz ermöglicht es den Störungkovarianzen, dynamisch von der früheren SGD-Historie abzuhängen, wodurch Einschränkungen bestehender Methoden, die feste Kovarianzen erfordern, behoben werden.

27
RESEARCHarXiv CS.LG·4/21/2026

Matched-Learning-Rate Analysis of Attention Drift and Transfer Retention in Fine-Tuned CLIP

Diese Studie untersucht, wie Anpassungsmethoden (Full FT vs. LoRA) und Optimierungsskalen Aufmerksamkeitsdrift und Transferretention in feingestimmten CLIP-Modellen beeinflussen. Ein kontrollierter Vergleich von Lernraten zeigt, dass die Lernrate strukturelle Veränderungen stark moduliert, wobei Full FT bei höheren Raten eine deutliche Kontraktion zeigt, während LoRA entropiepositiv bleibt.

27
RESEARCHarXiv CS.AI·vor 24T

Mixed Integer Goal Programming for Personalized Meal Optimization with User-Defined Serving Granularity

Dieser Artikel schlägt gemischte ganzzahlige Zielprogrammierung (MIGP) zur personalisierten Mahlzeitenoptimierung vor. Die Methodik behebt Einschränkungen bestehender Formulierungen durch die Verwendung ganzzahliger Variablen für praktische Portionszählungen und Zielprogrammierungsabweichungen für weiche Nährstoffziele, was eine benutzerdefinierte Portionsgranularität ermöglicht.

27
RESEARCHarXiv CS.LG·vor 21T

Mirror Descent-Type Algorithms for the Variational Inequality Problem with Functional Constraints

Dieses Papier befasst sich mit eingeschränkten Variationsungleichheitsproblemen mit funktionalen Einschränkungen und schlägt Mirror-Descent-ähnliche Algorithmen vor. Diese Algorithmen werden auf ihre optimale Konvergenzrate für Probleme mit beschränkten und monotonen Operatoren sowie Lipschitz-konvexen funktionalen Einschränkungen analysiert.

27
RESEARCHarXiv CS.LG·5/7/2026

Lookahead Drifting Model

Dieses Papier schlägt ein "Lookahead-Drifting-Modell" für die Verteilungszuordnung vor, das die Leistung der Bildgenerierung durch eine einstufige neuronale Funktionsbewertung verbessert. Das Modell berechnet in jeder Trainingsiteration sequenziell eine Reihe von Drifting-Termen, die positive Stichproben und die Modellausgabe nutzen, um Gradienteninformationen höherer Ordnung zu erfassen.

27
RESEARCHarXiv CS.AI·vor 7T

Position Paper: Post-Solve Robustness in Decision Engines: Feasible Regions and Smoothness Under Perturbations

Dieses Papier führt eine fehlende Schicht in Optimierungspipelines ein, um die Robustheitslücke nach der Lösung in gemischt-ganzzahligen linearen Programmierungs-Entscheidungsmaschinen (MILP) zu adressieren. Es formalisiert eine Epsilon-nahe-optimale zulässige Nachbarschaft und die Glattheit der Lösung, um zu bewerten, wie weit einer gefundenen Lösung unter Parameterstörungen vertraut werden kann.

27
RESEARCHarXiv CS.LG·vor 7T

Foundation-Preserving Adaptation via Generalized Rayleigh-Quotient Optimization

Dieses Papier stellt FoLoRA vor, ein Optimierungsframework, das die Verschlechterung nicht-zielgerichteter Fähigkeiten beim Feintuning von Basismodellen adressiert. Es verwendet einen verallgemeinerten Rayleigh-Quotienten, um den Nutzen der Aufgabe und die Vergessensstrafe auszubalancieren und so Updates zur Erhaltung des Vortrainingswissens zu steuern.

27
RESEARCHarXiv CS.LG·vor 17T

DualOptim+: Bridging Shared and Decoupled Optimizer States for Better Machine Unlearning in Large Language Models

DualOptim+ ist ein neuartiges Optimierungsframework zur Verbesserung des maschinellen Entlernens in großen Sprachmodellen, das geteilte und entkoppelte Optimiererzustände überbrückt. Es verwendet Basiszustände für gemeinsame Repräsentationen und Delta-Zustände für zielspezifische Residuen, wobei eine quantisierte 8-Bit-Variante den Speicherbedarf ohne Leistungseinbußen reduziert.

27
RESEARCHarXiv CS.LG·vor 27T

QuIDE: Mastering the Quantized Intelligence Trade-off via Active Optimization

QuIDE schlägt eine einheitliche Metrik, den Intelligenzindex I, zur Bewertung der Effizienz quantisierter neuronaler Netze vor, indem es den Kompressions-Genauigkeits-Latenz-Kompromiss zusammenfasst. Experimente zeigen eine aufgabenabhängige optimale Quantisierung (4- oder 8-Bit), die ein reproduzierbares Bewertungsprotokoll und eine Fitnessfunktion für die gemischte Präzisionssuche bietet.

27
RESEARCHarXiv CS.AI·vor 20T

Embedding by Elicitation: Dynamic Representations for Bayesian Optimization of System Prompts

Dieser Artikel stellt ReElicit vor, ein Bayes'sches Optimierungsframework basierend auf "Embedding durch Elicitation" zur Abstimmung von System-Prompts in KI. Es nutzt LLMs, um einen interpretierbaren Merkmalsraum zu generieren und einen Gaußschen Prozess-Surrogat, um Prompts basierend auf aggregiertem Feedback auszuwählen und zu verfeinern.

27
RESEARCHarXiv CS.LG·vor 11T

Balancing Multimodal Learning through Label Space Reshaping

Der Artikel behandelt das Modalitätenungleichgewicht beim multimodalen Lernen, bei dem einige Modalitäten die Optimierung dominieren. Er schlägt vor, dass diese Diskrepanz aus unterschiedlichen Schwierigkeiten bei der Abbildung zwischen modalitätsspezifischen Merkmalsräumen und dem gemeinsamen Labelraum resultiert, und führt BMLR ein, um diese Schwierigkeit auszugleichen.

27
RESEARCHarXiv CS.LG·vor 15T

FuRA: Full-Rank Parameter-Efficient Fine-Tuning with Spectral Preconditioning

Diese Forschung stellt FuRA (Full-Rank Adaptation) vor, eine neuartige parameter-effiziente Feinabstimmungsmethode, die bestehende Techniken durch spektrale Vorbedingung verbessert. Durch die Reparameterisierung von Gewichtsmatrizen mittels vollständiger Singulärwertzerlegung und die Beschränkung von Aktualisierungen übertrifft FuRA die uneingeschränkte vollständige Feinabstimmung bei gleichzeitiger Effizienz.

27