Optimization

134 items

RESEARCHarXiv CS.LG·4/27/2026

Focus Session: Hardware and Software Techniques for Accelerating Multimodal Foundation Models

Diese Forschung stellt eine vielschichtige Methodik zur Beschleunigung multimodaler Fundamentmodelle (MFMs) durch Hardware- und Software-Co-Design vor. Sie nutzt Optimierungstechniken wie hierarchiebewusste Mixed-Precision-Quantisierung, strukturelles Pruning und spekulatives Decoding, um Rechen- und Speicheranforderungen zu reduzieren.

Optimization multimodal AI AI acceleration Foundation Models

RESEARCHarXiv CS.LG·4/17/2026

TOPCELL: Topology Optimization of Standard Cell via LLMs

TOPCELL ist ein neuartiges Framework, das Large Language Models (LLMs) zur Optimierung der Transistortopologie im Standardzellendesign nutzt und die Einschränkungen traditioneller erschöpfender Suchmethoden überwindet. Durch die Umformulierung der Topologie-Exploration als generative Aufgabe und den Einsatz von GRPO zur Feinabstimmung verbessert es die Entdeckung von routbaren und physikalisch bewussten Layouts für fortgeschrittene Technologieknoten erheblich.

Optimization LLMs chip design Generative AI

ARTICLEDEV.to AI·vor 29T

When I started running models locally, I thought quantization meant squeezing more into RAM. Turns o

Der Artikel rät von der Standardverwendung von Q4_K_M für die lokale LLM-Inferenz ab und betont, dass optimale Leistung durch das Testen von Quantisierungsstufen erzielt wird, die auf spezifische Workflows zugeschnitten sind. Er schlägt vor, dass aggressive Quantisierung wie Q3_K_S die Latenz erheblich reduzieren kann, mit kaum wahrnehmbarem Qualitätsverlust für viele Aufgaben, obwohl die Kontextlänge einen Kompromiss darstellt.

Optimization LLMs quantization hardware

RESEARCHarXiv CS.LG·4/20/2026

Mapping High-Performance Regions in Battery Scheduling across Data Uncertainty, Battery Design, and Planning Horizons

Diese Studie analysiert die Batteriespeicherung mittels mehrstufiger modellprädiktiver Regelung, wobei das Zusammenspiel von Datenmerkmalen, Prognoseunsicherheit und Planungshorizont untersucht wird. Sie identifiziert einen „effektiven Horizont“ für die optimale Vorlaufzeit, der Rechenkosten reduziert und praktische Anleitungen für den industriellen Speicherbetrieb bietet.

Optimization Battery Technology energy management Predictive Analytics

RESEARCHarXiv CS.AI·4/20/2026

Bilevel Optimization of Agent Skills via Monte Carlo Tree Search

Diese Forschung stellt einen zweistufigen Optimierungsrahmen zur systematischen Verbesserung von „Agentenfähigkeiten“ in großen Sprachmodellen (LLM) vor. Sie nutzt eine äußere Schleife der Monte Carlo Tree Search, um Struktur und Inhalt dieser Fähigkeiten gemeinsam zu optimieren und die Aufgabenleistung zu verbessern.

Optimization Monte Carlo Tree Search large language models AI agents

RESEARCHarXiv CS.LG·5/4/2026

Information-Theoretic Generalization Bounds for Stochastic Gradient Descent with Predictable Virtual Noise

Dieser Artikel führt vorhersehbare, geschichtsadaptive virtuelle Störungen ein, um informations-theoretische Generalisierungsgrenzen für den Stochastischen Gradientenabstieg zu verbessern. Dieser neue Ansatz ermöglicht es den Störungkovarianzen, dynamisch von der früheren SGD-Historie abzuhängen, wodurch Einschränkungen bestehender Methoden, die feste Kovarianzen erfordern, behoben werden.

information theory Optimization Generalization machine learning

RESEARCHarXiv CS.LG·4/21/2026

Matched-Learning-Rate Analysis of Attention Drift and Transfer Retention in Fine-Tuned CLIP

Diese Studie untersucht, wie Anpassungsmethoden (Full FT vs. LoRA) und Optimierungsskalen Aufmerksamkeitsdrift und Transferretention in feingestimmten CLIP-Modellen beeinflussen. Ein kontrollierter Vergleich von Lernraten zeigt, dass die Lernrate strukturelle Veränderungen stark moduliert, wobei Full FT bei höheren Raten eine deutliche Kontraktion zeigt, während LoRA entropiepositiv bleibt.

CLIP Optimization attention Fine-tuning

RESEARCHarXiv CS.AI·vor 24T

Mixed Integer Goal Programming for Personalized Meal Optimization with User-Defined Serving Granularity

Dieser Artikel schlägt gemischte ganzzahlige Zielprogrammierung (MIGP) zur personalisierten Mahlzeitenoptimierung vor. Die Methodik behebt Einschränkungen bestehender Formulierungen durch die Verwendung ganzzahliger Variablen für praktische Portionszählungen und Zielprogrammierungsabweichungen für weiche Nährstoffziele, was eine benutzerdefinierte Portionsgranularität ermöglicht.

nutrition Optimization meal planning operations research

RESEARCHarXiv CS.LG·vor 21T

Mirror Descent-Type Algorithms for the Variational Inequality Problem with Functional Constraints

Dieses Papier befasst sich mit eingeschränkten Variationsungleichheitsproblemen mit funktionalen Einschränkungen und schlägt Mirror-Descent-ähnliche Algorithmen vor. Diese Algorithmen werden auf ihre optimale Konvergenzrate für Probleme mit beschränkten und monotonen Operatoren sowie Lipschitz-konvexen funktionalen Einschränkungen analysiert.

Optimization machine learning variational inequalities mathematics

RESEARCHarXiv CS.AI·vor 7T

Agents on a Tree: Pathwise Coordination for Multi-Objective Molecular Optimization

Der Artikel stellt ATOM vor, ein Multi-Agenten-Framework für die multikriterielle molekulare Optimierung mittels einer baumstrukturierten Suche. Agenten koordinieren sich entlang verschiedener Pfade des Baumes, um alternative molekulare Evolutionstrajektorien zu vergleichen, unterstützt durch einen globalen Speicher.

Optimization Molecular Optimization machine learning AI

RESEARCHarXiv CS.LG·5/7/2026

Lookahead Drifting Model

Dieses Papier schlägt ein "Lookahead-Drifting-Modell" für die Verteilungszuordnung vor, das die Leistung der Bildgenerierung durch eine einstufige neuronale Funktionsbewertung verbessert. Das Modell berechnet in jeder Trainingsiteration sequenziell eine Reihe von Drifting-Termen, die positive Stichproben und die Modellausgabe nutzen, um Gradienteninformationen höherer Ordnung zu erfassen.

neural networks Optimization deep learning machine learning

RESEARCHarXiv CS.AI·vor 7T

Position Paper: Post-Solve Robustness in Decision Engines: Feasible Regions and Smoothness Under Perturbations

Dieses Papier führt eine fehlende Schicht in Optimierungspipelines ein, um die Robustheitslücke nach der Lösung in gemischt-ganzzahligen linearen Programmierungs-Entscheidungsmaschinen (MILP) zu adressieren. Es formalisiert eine Epsilon-nahe-optimale zulässige Nachbarschaft und die Glattheit der Lösung, um zu bewerten, wie weit einer gefundenen Lösung unter Parameterstörungen vertraut werden kann.

robustness Optimization Perturbations Decision Engines

RESEARCHarXiv CS.LG·vor 7T

Foundation-Preserving Adaptation via Generalized Rayleigh-Quotient Optimization

Dieses Papier stellt FoLoRA vor, ein Optimierungsframework, das die Verschlechterung nicht-zielgerichteter Fähigkeiten beim Feintuning von Basismodellen adressiert. Es verwendet einen verallgemeinerten Rayleigh-Quotienten, um den Nutzen der Aufgabe und die Vergessensstrafe auszubalancieren und so Updates zur Erhaltung des Vortrainingswissens zu steuern.

Finetuning neural networks Optimization machine learning

RESEARCHarXiv CS.LG·vor 17T

DualOptim+: Bridging Shared and Decoupled Optimizer States for Better Machine Unlearning in Large Language Models

DualOptim+ ist ein neuartiges Optimierungsframework zur Verbesserung des maschinellen Entlernens in großen Sprachmodellen, das geteilte und entkoppelte Optimiererzustände überbrückt. Es verwendet Basiszustände für gemeinsame Repräsentationen und Delta-Zustände für zielspezifische Residuen, wobei eine quantisierte 8-Bit-Variante den Speicherbedarf ohne Leistungseinbußen reduziert.

Optimization learning machine unlearning large language models

RESEARCHarXiv CS.LG·vor 26T

Plan Before You Trade: Inference-Time Optimization for RL Trading Agents

Dieses Papier stellt FPILOT vor, ein Plugin-Inferenzzeit-Optimierungsframework für Reinforcement Learning Handelsagenten. Es nutzt vorhergesagte Preisverläufe, um die Strategie zur Inferenzzeit zu optimieren, bevor ein Handel ausgeführt wird, und ist mit jedem vortrainierten Agenten kompatibel.

Optimization financial trading reinforcement learning AI in finance

RESEARCHarXiv CS.LG·vor 27T

Vertex-Softmax: Tight Transformer Verification via Exact Softmax Optimization

Die Arbeit stellt Vertex-Softmax vor, eine neue Methode zur zertifizierten Verifikation von Transformer-Aufmerksamkeit durch exakte Softmax-Optimierung. Es wird bewiesen, dass das exakte Optimum an einem Eckpunkt des Beschränkungsbereichs erreicht wird, was eine engere obere Schranke liefert.

Optimization machine learning Verification AI

RESEARCHarXiv CS.LG·vor 27T

QuIDE: Mastering the Quantized Intelligence Trade-off via Active Optimization

QuIDE schlägt eine einheitliche Metrik, den Intelligenzindex I, zur Bewertung der Effizienz quantisierter neuronaler Netze vor, indem es den Kompressions-Genauigkeits-Latenz-Kompromiss zusammenfasst. Experimente zeigen eine aufgabenabhängige optimale Quantisierung (4- oder 8-Bit), die ein reproduzierbares Bewertungsprotokoll und eine Fitnessfunktion für die gemischte Präzisionssuche bietet.

neural networks Optimization machine learning AI Efficiency

RESEARCHarXiv CS.AI·vor 20T

Embedding by Elicitation: Dynamic Representations for Bayesian Optimization of System Prompts

Dieser Artikel stellt ReElicit vor, ein Bayes'sches Optimierungsframework basierend auf "Embedding durch Elicitation" zur Abstimmung von System-Prompts in KI. Es nutzt LLMs, um einen interpretierbaren Merkmalsraum zu generieren und einen Gaußschen Prozess-Surrogat, um Prompts basierend auf aggregiertem Feedback auszuwählen und zu verfeinern.

Bayesian Optimization Optimization System prompts machine learning

RESEARCHarXiv CS.LG·vor 11T

Balancing Multimodal Learning through Label Space Reshaping

Der Artikel behandelt das Modalitätenungleichgewicht beim multimodalen Lernen, bei dem einige Modalitäten die Optimierung dominieren. Er schlägt vor, dass diese Diskrepanz aus unterschiedlichen Schwierigkeiten bei der Abbildung zwischen modalitätsspezifischen Merkmalsräumen und dem gemeinsamen Labelraum resultiert, und führt BMLR ein, um diese Schwierigkeit auszugleichen.

multimodal learning Optimization learning machine learning

RESEARCHarXiv CS.LG·vor 15T

FuRA: Full-Rank Parameter-Efficient Fine-Tuning with Spectral Preconditioning

Diese Forschung stellt FuRA (Full-Rank Adaptation) vor, eine neuartige parameter-effiziente Feinabstimmungsmethode, die bestehende Techniken durch spektrale Vorbedingung verbessert. Durch die Reparameterisierung von Gewichtsmatrizen mittels vollständiger Singulärwertzerlegung und die Beschränkung von Aktualisierungen übertrifft FuRA die uneingeschränkte vollständige Feinabstimmung bei gleichzeitiger Effizienz.

Optimization deep learning machine learning spectral preconditioning