Optimization

134 items

ARTICLEDEV.to AI·22/04/2026

Blog 1: Foundations of Gradient Descent

Cet article présente la Descente de Gradient comme l'algorithme d'optimisation fondamental pour les réseaux de neurones, expliquant comment il minimise itérativement une fonction de perte. Il utilise l'analogie d'une personne les yeux bandés naviguant sur un terrain vallonné pour illustrer le concept de base.

neural networks Gradient Descent Optimization machine learning

RESEARCHarXiv CS.LG·il y a 5j

Pseudospectral Bounds for Transient Amplification in Coupled Gradient Descent

L'article développe une théorie pseudospectrale précise pour les systèmes de descente de gradient couplés avec des jacobiens triangulaires par blocs, pertinents pour l'optimisation bilivellulaire et l'entraînement contradictoire. Il établit des bornes pour l'amplification transitoire et caractérise les seuils de couplage critiques pour l'instabilité spectrale.

Gradient Descent Optimization Numerical Analysis Machine Learning Theory

RESEARCHDEV.to AI·il y a 3j

Optimization hardness as transient chaos in an analog approach to constraintsatisfaction

Cette recherche explore la difficulté des problèmes d'optimisation, la reliant au comportement chaotique transitoire dans une approche analogique de la satisfaction de contraintes. L'étude examine comment la dynamique de tels systèmes peut éclairer les défis liés à la recherche de solutions optimales.

analog computing Optimization constraint satisfaction Computational Science

ARTICLEDEV.to AI·il y a 14j

How AI & TOS Optimization Are Solving a $50K/Day Problem at Container Terminals

Le contenu met en évidence un problème d'inefficacité de 50 000 $ par jour dans les terminaux à conteneurs mondiaux, appelé Temps de Rotation des Navires (TRT). Il explique comment l'optimisation de l'IA et du Système d'Exploitation de Terminal (TOS) est cruciale pour résoudre les goulots d'étranglement de la logistique portuaire et améliorer l'efficacité opérationnelle.

logistics Optimization AI Port Operations

DOCDEV.to AI·il y a 5j

Optimizing a Customer Support Agent on AgentCore

Le contenu aborde l'évolution des piles d'agents IA, soulignant le défi actuel d'optimiser les agents déployés sans les reconstruire. Il introduit AgentCore Optimization comme solution pour mener des expériences A/B contrôlées et évaluer les performances des agents en direct.

Optimization LangGraph A/B testing Amazon Bedrock

ARTICLEDEV.to AI·il y a 19j

Designing with Nvidia's Ising Quantum AI: A Calibration Playbook for ML Engineers

Les modèles d'IA quantique d'Ising de Nvidia sont des optimiseurs combinatoires utilisés pour mapper des états matériels de haute dimension en configurations de basse énergie pour un fonctionnement optimal. La mise en service de cette technologie nécessite une calibration minutieuse pour garantir une convergence fiable et éviter d'être contournée par les opérateurs.

Optimization ML Engineering hardware NVIDIA

CASEDEV.to AI·22/04/2026

ACMI: How I Replaced PostgreSQL, Notion, and LangGraph with 200 Lines of Redis for My AI Agent Team

L'auteur explique comment il a remplacé PostgreSQL, Notion et LangGraph par 200 lignes de Redis pour gérer efficacement le contexte d'une équipe de 10 agents IA. Ce changement a résolu les problèmes de communication inter-agents, les requêtes relationnelles lentes et les coûts élevés des tokens API.

System design Optimization data management Redis

RESEARCHarXiv CS.LG·16/04/2026

Generalization Guarantees on Data-Driven Tuning of Gradient Descent with Langevin Updates

Cet article présente l'algorithme Langevin Gradient Descent (LGD) pour les problèmes de régression convexe, prouvant que les configurations optimales d'hyperparamètres atteignent la solution optimale de Bayes. Le travail offre également des garanties de généralisation pour le méta-apprentissage des hyperparamètres optimaux du LGD, avec une borne de pseudo-dimension de O(dh).

Meta-Learning Optimization Generalization Hyperparameter Tuning

ARTICLEO'Reilly Radar·il y a 4j

I Let an AI Agent Run 40 Experiments While I Slept

L'auteur a configuré un agent d'IA sur un GPU pour exécuter des expériences d'entraînement pendant la nuit. L'agent a mené 40 expériences, améliorant la perte de validation de 5,9% et réduisant l'utilisation de la mémoire de 44 Go à 17 Go.

Optimization experimentation machine learning automation

I Let an AI Agent Run 40 Experiments While I Slept

RESEARCHarXiv CS.CL·22/04/2026

Mango: Multi-Agent Web Navigation via Global-View Optimization

Mango est une méthode de navigation web multi-agents qui optimise l'exploration de sites complexes en utilisant une vue globale. Il détermine dynamiquement les points de départ optimaux et alloue le budget de navigation de manière adaptative, atteignant un taux de succès de 63,6% avec GPT-5-mini.

Optimization web navigation large language models AI agents

RESEARCHarXiv CS.AI·04/05/2026

Agentic AI for Trip Planning Optimization Application

Cette recherche présente un cadre d'IA agéntique pour optimiser la planification de trajets pour les véhicules intelligents, dépassant la simple faisabilité pour considérer des facteurs dynamiques comme le trafic et l'énergie. Il utilise un agent d'orchestration coordonnant des agents spécialisés et propose un nouveau jeu de données pour une évaluation objective, atteignant une précision significative sur le TOP Benchmark.

Optimization Intelligent Vehicles Benchmarks Agentic AI

RESEARCHarXiv CS.LG·il y a 26j

Population Risk Bounds for Kolmogorov-Arnold Networks Trained by DP-SGD with Correlated Noise

Cette recherche établit les premières bornes de risque de population pour les réseaux de Kolmogorov-Arnold (KANs) entraînés par SGD par mini-lots, incluant le SGD différentiellement privé (DP-SGD) avec bruit corrélé. Elle couvre des scénarios plus pratiques que la théorie KAN antérieure et fournit des résultats plus précis pour les spécialisations à deuxième couche fixe.

neural networks Optimization Differential Privacy machine learning

ARTICLEDeepLearning.AI (YouTube)·il y a 18j

AI Dev 26 x SF | Or Dagan: Optimizing Accuracy, Cost, and Latency in Real-World Agents

Le contenu discute de l'optimisation des agents d'IA dans le monde réel, en se concentrant sur des métriques de performance clés telles que la précision, le coût et la latence. Il explore probablement des stratégies et des techniques pour équilibrer ces facteurs pour un déploiement efficace.

Optimization accuracy latency cost

AI Dev 26 x SF | Or Dagan: Optimizing Accuracy, Cost, and Latency in Real-World Agents

RESEARCHarXiv CS.AI·il y a 4j

GITCO: Gated Inference-Time Context Optimization in TSFMs

Cet article présente GITCO, un cadre léger d'optimisation du contexte au moment de l'inférence qui améliore la précision des modèles de fondation de séries temporelles (TSFMs) basés sur des patchs. Il identifie et supprime sélectivement les patchs nuisibles sans mettre à jour les poids du modèle, obtenant une réduction de +1,95% du MASE sur TimesFM 2.5.

forecasting Optimization machine learning Foundation Models

RESEARCHarXiv CS.LG·il y a 15j

WeCon: An Efficient Weight-Conditioned Neural Solver for Multi-Objective Combinatorial Optimization Problems

Les chercheurs proposent WeCon, un solveur neuronal efficace conditionné par le poids pour les Problèmes d'Optimisation Combinatoire Multi-Objectifs (MOCOPs). Il améliore la modélisation du contexte conditionné par le poids et l'optimisation des préférences, abordant les limites des méthodes existantes en matière d'injection de poids et de construction de paires de solutions pour l'entraînement.

neural networks Optimization machine learning AI

RESEARCHarXiv CS.AI·il y a 14j

Practical Quantum CIM Empowerment via All-Domestic-Core Agentic Large Model

Cette étude intègre une machine d'Ising cohérente (CIM) pompée par laser femtoseconde avec un système agéntique piloté par des LLM, utilisant LangGraph et LangChain. Elle démontre que les LLM peuvent effectuer efficacement des tâches telles que le calibrage des modèles QUBO/Ising et l'itération des poids de contrainte, réalisant ainsi l'autonomisation pratique du CIM quantique avec une technologie nationale.

Quantum Computing LangChain Optimization LLMs

ARTICLEDEV.to AI·il y a 5j

How I Cut My LLM API Costs by 75% with a Simple Python Proxy

L'article explique comment l'auteur a réduit ses coûts d'API LLM de 75% grâce à un simple proxy Python. Ce proxy optimise les requêtes en les dirigeant vers des modèles moins chers, en mettant en cache les invites identiques et en traitant les requêtes par lots.

Optimization cost reduction API Python

RESEARCHarXiv CS.LG·06/04/2026

From Broad Exploration to Stable Synthesis: Entropy-Guided Optimization for Autoregressive Image Generation

O artigo analisa a interação entre Chain-of-Thought (CoT) e Reinforcement Learning (RL) na geração de imagens a partir de texto (T2I) usando uma análise sistemática baseada em entropia. Ele revela que menor entropia dos tokens de imagem e do CoT textual se correlaciona com melhor qualidade de imagem, propondo a estratégia Entropy-Guided Group Relative Policy Optimization (EG-GRPO) para otimização com base na incerteza.

Optimization deep learning reinforcement learning Text-to-Image Generation

RESEARCHarXiv CS.LG·il y a 21j

Systematic Optimization of Real-Time Diffusion Model Inference on Apple M3 Ultra

Cette recherche optimise systématiquement l'inférence des modèles de diffusion en temps réel sur l'Apple M3 Ultra, explorant diverses techniques telles que la conversion CoreML et la quantification. L'étude a atteint 22.7 FPS pour la transformation img2img de 512x512 en combinant la conversion CoreML du SDXS-512 avec un pipeline de caméra à 3 threads.

Diffusion Models Optimization apple-silicon image generation

RESEARCHarXiv CS.LG·il y a 5j

Inverse Critical Experiment Design via Gradient Optimization and a Multigroup Attention-Based Neural Network Architecture

Cette recherche présente une méthodologie pour la conception inverse d'expériences critiques, essentielle pour la validation des conceptions avancées de réacteurs nucléaires. Elle utilise la modélisation de substitution par réseaux de neurones profonds et l'optimisation de gradient non paramétrique pour générer des géométries d'expériences maximisant la similarité neutronique.

neural networks Optimization nuclear engineering machine learning