Optimization

134 items

ARTICLEDEV.to AI·22/4/2026

Blog 1: Foundations of Gradient Descent

Esta publicación de blog presenta el Descenso de Gradiente como el algoritmo de optimización fundamental para las redes neuronales, explicando cómo minimiza iterativamente una función de pérdida. Utiliza la analogía de una persona vendada navegando por un terreno montañoso para ilustrar el concepto central.

neural networks Gradient Descent Optimization machine learning

RESEARCHarXiv CS.LG·hace 5d

Pseudospectral Bounds for Transient Amplification in Coupled Gradient Descent

El artículo desarrolla una teoría pseudosespectral aguda para sistemas de descenso de gradiente acoplado con jacobianos triangulares por bloques, relevantes para la optimización bilivel y el entrenamiento adversarial. Establece límites para la amplificación transitoria y caracteriza los umbrales de acoplamiento críticos para la inestabilidad espectral.

Gradient Descent Optimization Numerical Analysis Machine Learning Theory

RESEARCHDEV.to AI·hace 3d

Optimization hardness as transient chaos in an analog approach to constraintsatisfaction

Esta investigación explora la dificultad de los problemas de optimización, vinculándola al comportamiento caótico transitorio en un enfoque analógico para la satisfacción de restricciones. El estudio investiga cómo la dinámica de dichos sistemas puede iluminar los desafíos para encontrar soluciones óptimas.

analog computing Optimization constraint satisfaction Computational Science

ARTICLEDEV.to AI·hace 14d

How AI & TOS Optimization Are Solving a $50K/Day Problem at Container Terminals

El contenido resalta un problema de ineficiencia de $50,000 al día en las terminales de contenedores globales, conocido como Tiempo de Rotación de Buques (TRT). Discute cómo la optimización de la IA y del Sistema Operativo de Terminal (TOS) son cruciales para resolver cuellos de botella en la logística portuaria y mejorar la eficiencia operativa.

logistics Optimization AI Port Operations

DOCDEV.to AI·hace 5d

Optimizing a Customer Support Agent on AgentCore

El contenido describe la evolución de las pilas de agentes de IA, enfocándose en la optimización de agentes ya implementados. Presenta AgentCore Optimization como una herramienta para realizar experimentos A/B controlados y evaluar el rendimiento de agentes en vivo.

Optimization LangGraph A/B testing Amazon Bedrock

ARTICLEDEV.to AI·hace 19d

Designing with Nvidia's Ising Quantum AI: A Calibration Playbook for ML Engineers

Los modelos de IA cuántica de Ising de Nvidia son optimizadores combinatorios que asignan estados de hardware de alta dimensión a configuraciones de baja energía para una operación óptima. La producción de esta tecnología como servicio requiere una calibración cuidadosa para asegurar una convergencia fiable y evitar que los operadores la omitan.

Optimization ML Engineering hardware NVIDIA

CASEDEV.to AI·22/4/2026

ACMI: How I Replaced PostgreSQL, Notion, and LangGraph with 200 Lines of Redis for My AI Agent Team

El autor detalla cómo reemplazó PostgreSQL, Notion y LangGraph con 200 líneas de Redis para gestionar eficientemente el contexto de un equipo de 10 agentes de IA. Este cambio solucionó problemas de comunicación entre agentes, consultas relacionales lentas y altos costos de tokens de API.

System design Optimization data management Redis

RESEARCHarXiv CS.LG·16/4/2026

Generalization Guarantees on Data-Driven Tuning of Gradient Descent with Langevin Updates

Este artículo introduce el algoritmo Langevin Gradient Descent (LGD) para problemas de regresión convexa, demostrando que las configuraciones óptimas de hiperparámetros alcanzan la solución óptima de Bayes. El trabajo también ofrece garantías de generalización para el meta-aprendizaje de hiperparámetros óptimos de LGD, con un límite de pseudo-dimensión de O(dh).

Meta-Learning Optimization Generalization Hyperparameter Tuning

ARTICLEO'Reilly Radar·hace 4d

I Let an AI Agent Run 40 Experiments While I Slept

El autor configuró un agente de IA en una GPU para ejecutar experimentos de entrenamiento durante la noche. El agente realizó 40 experimentos, mejorando la pérdida de validación en un 5,9% y reduciendo el uso de memoria de 44 GB a 17 GB.

Optimization experimentation machine learning automation

I Let an AI Agent Run 40 Experiments While I Slept

RESEARCHarXiv CS.CL·22/4/2026

Mango: Multi-Agent Web Navigation via Global-View Optimization

Mango es un método multiagente para la navegación web que optimiza la exploración de sitios complejos al aprovechar una vista global. Determina puntos de partida óptimos y asigna el presupuesto de navegación de forma adaptativa, logrando una tasa de éxito del 63,6% con GPT-5-mini.

Optimization web navigation large language models AI agents

RESEARCHarXiv CS.AI·4/5/2026

Agentic AI for Trip Planning Optimization Application

Esta investigación introduce un marco de IA agéntica para optimizar la planificación de viajes en vehículos inteligentes, superando la mera viabilidad para considerar factores dinámicos como el tráfico y la energía. Emplea un agente de orquestación que coordina agentes especializados y proporciona un nuevo conjunto de datos para evaluación objetiva, logrando una precisión significativa en el TOP Benchmark.

Optimization Intelligent Vehicles Benchmarks Agentic AI

RESEARCHarXiv CS.LG·hace 26d

Population Risk Bounds for Kolmogorov-Arnold Networks Trained by DP-SGD with Correlated Noise

Esta investigación establece los primeros límites de riesgo poblacional para Redes de Kolmogorov-Arnold (KANs) entrenadas con SGD por mini-lotes, incluyendo SGD diferencialmente privado (DP-SGD) con ruido correlacionado. Cubre escenarios más prácticos que la teoría KAN anterior y proporciona resultados más nítidos para especializaciones de segunda capa fija.

neural networks Optimization Differential Privacy machine learning

ARTICLEDeepLearning.AI (YouTube)·hace 18d

AI Dev 26 x SF | Or Dagan: Optimizing Accuracy, Cost, and Latency in Real-World Agents

El contenido trata sobre la optimización de agentes de IA en el mundo real, centrándose en métricas clave de rendimiento como la precisión, el costo y la latencia. Es probable que explore estrategias y técnicas para equilibrar estos factores para una implementación efectiva.

Optimization accuracy latency cost

AI Dev 26 x SF | Or Dagan: Optimizing Accuracy, Cost, and Latency in Real-World Agents

RESEARCHarXiv CS.AI·hace 4d

GITCO: Gated Inference-Time Context Optimization in TSFMs

Este artículo presenta GITCO, un marco ligero para la optimización del contexto en tiempo de inferencia que mejora la precisión de los Modelos Fundacionales de Series Temporales (TSFMs) basados en parches. Identifica y suprime selectivamente parches dañinos sin actualizar los pesos del modelo, logrando una reducción del +1,95% en el MASE en TimesFM 2.5.

forecasting Optimization machine learning Foundation Models

RESEARCHarXiv CS.LG·hace 15d

WeCon: An Efficient Weight-Conditioned Neural Solver for Multi-Objective Combinatorial Optimization Problems

Investigadores proponen WeCon, un solucionador neuronal eficiente condicionado por pesos para Problemas de Optimización Combinatoria Multi-Objetivo (MOCOPs). Mejora el modelado de contexto condicionado por pesos y la optimización de preferencias, abordando las limitaciones de los métodos existentes en la inyección de pesos y la construcción de pares de soluciones para el entrenamiento.

neural networks Optimization machine learning AI

RESEARCHarXiv CS.AI·hace 14d

Practical Quantum CIM Empowerment via All-Domestic-Core Agentic Large Model

Este estudio integra una Máquina de Ising Coherente (CIM) bombeada por láser de femtosegundos con un sistema agéntico impulsado por LLMs, utilizando LangGraph y LangChain. Demuestra que los LLMs pueden realizar eficazmente tareas como la calibración de modelos QUBO/Ising y la iteración de pesos de restricción, logrando la habilitación práctica de CIM cuántico con tecnología doméstica.

Quantum Computing LangChain Optimization LLMs

ARTICLEDEV.to AI·hace 5d

How I Cut My LLM API Costs by 75% with a Simple Python Proxy

El artículo explica cómo el autor redujo los costos de la API de LLM en un 75% con un simple proxy de Python. Este proxy optimiza las solicitudes al enrutar a modelos más baratos, almacenar en caché las indicaciones idénticas y procesar las solicitudes por lotes.

Optimization cost reduction API Python

RESEARCHarXiv CS.LG·6/4/2026

From Broad Exploration to Stable Synthesis: Entropy-Guided Optimization for Autoregressive Image Generation

O artigo analisa a interação entre Chain-of-Thought (CoT) e Reinforcement Learning (RL) na geração de imagens a partir de texto (T2I) usando uma análise sistemática baseada em entropia. Ele revela que menor entropia dos tokens de imagem e do CoT textual se correlaciona com melhor qualidade de imagem, propondo a estratégia Entropy-Guided Group Relative Policy Optimization (EG-GRPO) para otimização com base na incerteza.

Optimization deep learning reinforcement learning Text-to-Image Generation

RESEARCHarXiv CS.LG·hace 21d

Systematic Optimization of Real-Time Diffusion Model Inference on Apple M3 Ultra

Esta investigación optimiza sistemáticamente la inferencia de modelos de difusión en tiempo real en el Apple M3 Ultra, explorando varias técnicas como la conversión CoreML y la cuantificación. El estudio logró 22.7 FPS para la transformación img2img de 512x512 combinando la conversión CoreML del SDXS-512 con una tubería de cámara de 3 hilos.

Diffusion Models Optimization apple-silicon image generation

RESEARCHarXiv CS.LG·hace 5d

Inverse Critical Experiment Design via Gradient Optimization and a Multigroup Attention-Based Neural Network Architecture

Esta investigación introduce una metodología para el diseño inverso de experimentos críticos, fundamental para la validación de diseños avanzados de reactores nucleares. Utiliza modelado subrogado de redes neuronales profundas y optimización de gradiente no paramétrica para generar geometrías experimentales que maximizan la similitud neutrónica.

neural networks Optimization nuclear engineering machine learning