← heapsort-ai

Optimization

134 items

RESEARCHarXiv CS.LG·il y a 5j

Pseudospectral Bounds for Transient Amplification in Coupled Gradient Descent

L'article développe une théorie pseudospectrale précise pour les systèmes de descente de gradient couplés avec des jacobiens triangulaires par blocs, pertinents pour l'optimisation bilivellulaire et l'entraînement contradictoire. Il établit des bornes pour l'amplification transitoire et caractérise les seuils de couplage critiques pour l'instabilité spectrale.

31
ARTICLEDEV.to AI·il y a 14j

How AI & TOS Optimization Are Solving a $50K/Day Problem at Container Terminals

Le contenu met en évidence un problème d'inefficacité de 50 000 $ par jour dans les terminaux à conteneurs mondiaux, appelé Temps de Rotation des Navires (TRT). Il explique comment l'optimisation de l'IA et du Système d'Exploitation de Terminal (TOS) est cruciale pour résoudre les goulots d'étranglement de la logistique portuaire et améliorer l'efficacité opérationnelle.

31
ARTICLEDEV.to AI·il y a 19j

Designing with Nvidia's Ising Quantum AI: A Calibration Playbook for ML Engineers

Les modèles d'IA quantique d'Ising de Nvidia sont des optimiseurs combinatoires utilisés pour mapper des états matériels de haute dimension en configurations de basse énergie pour un fonctionnement optimal. La mise en service de cette technologie nécessite une calibration minutieuse pour garantir une convergence fiable et éviter d'être contournée par les opérateurs.

31
RESEARCHarXiv CS.LG·16/04/2026

Generalization Guarantees on Data-Driven Tuning of Gradient Descent with Langevin Updates

Cet article présente l'algorithme Langevin Gradient Descent (LGD) pour les problèmes de régression convexe, prouvant que les configurations optimales d'hyperparamètres atteignent la solution optimale de Bayes. Le travail offre également des garanties de généralisation pour le méta-apprentissage des hyperparamètres optimaux du LGD, avec une borne de pseudo-dimension de O(dh).

29
RESEARCHarXiv CS.AI·04/05/2026

Agentic AI for Trip Planning Optimization Application

Cette recherche présente un cadre d'IA agéntique pour optimiser la planification de trajets pour les véhicules intelligents, dépassant la simple faisabilité pour considérer des facteurs dynamiques comme le trafic et l'énergie. Il utilise un agent d'orchestration coordonnant des agents spécialisés et propose un nouveau jeu de données pour une évaluation objective, atteignant une précision significative sur le TOP Benchmark.

29
RESEARCHarXiv CS.LG·il y a 26j

Population Risk Bounds for Kolmogorov-Arnold Networks Trained by DP-SGD with Correlated Noise

Cette recherche établit les premières bornes de risque de population pour les réseaux de Kolmogorov-Arnold (KANs) entraînés par SGD par mini-lots, incluant le SGD différentiellement privé (DP-SGD) avec bruit corrélé. Elle couvre des scénarios plus pratiques que la théorie KAN antérieure et fournit des résultats plus précis pour les spécialisations à deuxième couche fixe.

29
RESEARCHarXiv CS.AI·il y a 4j

GITCO: Gated Inference-Time Context Optimization in TSFMs

Cet article présente GITCO, un cadre léger d'optimisation du contexte au moment de l'inférence qui améliore la précision des modèles de fondation de séries temporelles (TSFMs) basés sur des patchs. Il identifie et supprime sélectivement les patchs nuisibles sans mettre à jour les poids du modèle, obtenant une réduction de +1,95% du MASE sur TimesFM 2.5.

28
RESEARCHarXiv CS.LG·il y a 15j

WeCon: An Efficient Weight-Conditioned Neural Solver for Multi-Objective Combinatorial Optimization Problems

Les chercheurs proposent WeCon, un solveur neuronal efficace conditionné par le poids pour les Problèmes d'Optimisation Combinatoire Multi-Objectifs (MOCOPs). Il améliore la modélisation du contexte conditionné par le poids et l'optimisation des préférences, abordant les limites des méthodes existantes en matière d'injection de poids et de construction de paires de solutions pour l'entraînement.

28
RESEARCHarXiv CS.AI·il y a 14j

Practical Quantum CIM Empowerment via All-Domestic-Core Agentic Large Model

Cette étude intègre une machine d'Ising cohérente (CIM) pompée par laser femtoseconde avec un système agéntique piloté par des LLM, utilisant LangGraph et LangChain. Elle démontre que les LLM peuvent effectuer efficacement des tâches telles que le calibrage des modèles QUBO/Ising et l'itération des poids de contrainte, réalisant ainsi l'autonomisation pratique du CIM quantique avec une technologie nationale.

28
RESEARCHarXiv CS.LG·06/04/2026

From Broad Exploration to Stable Synthesis: Entropy-Guided Optimization for Autoregressive Image Generation

O artigo analisa a interação entre Chain-of-Thought (CoT) e Reinforcement Learning (RL) na geração de imagens a partir de texto (T2I) usando uma análise sistemática baseada em entropia. Ele revela que menor entropia dos tokens de imagem e do CoT textual se correlaciona com melhor qualidade de imagem, propondo a estratégia Entropy-Guided Group Relative Policy Optimization (EG-GRPO) para otimização com base na incerteza.

28
RESEARCHarXiv CS.LG·il y a 21j

Systematic Optimization of Real-Time Diffusion Model Inference on Apple M3 Ultra

Cette recherche optimise systématiquement l'inférence des modèles de diffusion en temps réel sur l'Apple M3 Ultra, explorant diverses techniques telles que la conversion CoreML et la quantification. L'étude a atteint 22.7 FPS pour la transformation img2img de 512x512 en combinant la conversion CoreML du SDXS-512 avec un pipeline de caméra à 3 threads.

28
RESEARCHarXiv CS.LG·il y a 5j

Inverse Critical Experiment Design via Gradient Optimization and a Multigroup Attention-Based Neural Network Architecture

Cette recherche présente une méthodologie pour la conception inverse d'expériences critiques, essentielle pour la validation des conceptions avancées de réacteurs nucléaires. Elle utilise la modélisation de substitution par réseaux de neurones profonds et l'optimisation de gradient non paramétrique pour générer des géométries d'expériences maximisant la similarité neutronique.

28