← heapsort-ai

Optimization

134 items

RESEARCHarXiv CS.LG·hace 5d

Pseudospectral Bounds for Transient Amplification in Coupled Gradient Descent

El artículo desarrolla una teoría pseudosespectral aguda para sistemas de descenso de gradiente acoplado con jacobianos triangulares por bloques, relevantes para la optimización bilivel y el entrenamiento adversarial. Establece límites para la amplificación transitoria y caracteriza los umbrales de acoplamiento críticos para la inestabilidad espectral.

31
RESEARCHDEV.to AI·hace 3d

Optimization hardness as transient chaos in an analog approach to constraintsatisfaction

Esta investigación explora la dificultad de los problemas de optimización, vinculándola al comportamiento caótico transitorio en un enfoque analógico para la satisfacción de restricciones. El estudio investiga cómo la dinámica de dichos sistemas puede iluminar los desafíos para encontrar soluciones óptimas.

31
ARTICLEDEV.to AI·hace 19d

Designing with Nvidia's Ising Quantum AI: A Calibration Playbook for ML Engineers

Los modelos de IA cuántica de Ising de Nvidia son optimizadores combinatorios que asignan estados de hardware de alta dimensión a configuraciones de baja energía para una operación óptima. La producción de esta tecnología como servicio requiere una calibración cuidadosa para asegurar una convergencia fiable y evitar que los operadores la omitan.

31
RESEARCHarXiv CS.LG·16/4/2026

Generalization Guarantees on Data-Driven Tuning of Gradient Descent with Langevin Updates

Este artículo introduce el algoritmo Langevin Gradient Descent (LGD) para problemas de regresión convexa, demostrando que las configuraciones óptimas de hiperparámetros alcanzan la solución óptima de Bayes. El trabajo también ofrece garantías de generalización para el meta-aprendizaje de hiperparámetros óptimos de LGD, con un límite de pseudo-dimensión de O(dh).

29
RESEARCHarXiv CS.AI·4/5/2026

Agentic AI for Trip Planning Optimization Application

Esta investigación introduce un marco de IA agéntica para optimizar la planificación de viajes en vehículos inteligentes, superando la mera viabilidad para considerar factores dinámicos como el tráfico y la energía. Emplea un agente de orquestación que coordina agentes especializados y proporciona un nuevo conjunto de datos para evaluación objetiva, logrando una precisión significativa en el TOP Benchmark.

29
RESEARCHarXiv CS.LG·hace 26d

Population Risk Bounds for Kolmogorov-Arnold Networks Trained by DP-SGD with Correlated Noise

Esta investigación establece los primeros límites de riesgo poblacional para Redes de Kolmogorov-Arnold (KANs) entrenadas con SGD por mini-lotes, incluyendo SGD diferencialmente privado (DP-SGD) con ruido correlacionado. Cubre escenarios más prácticos que la teoría KAN anterior y proporciona resultados más nítidos para especializaciones de segunda capa fija.

29
RESEARCHarXiv CS.AI·hace 4d

GITCO: Gated Inference-Time Context Optimization in TSFMs

Este artículo presenta GITCO, un marco ligero para la optimización del contexto en tiempo de inferencia que mejora la precisión de los Modelos Fundacionales de Series Temporales (TSFMs) basados en parches. Identifica y suprime selectivamente parches dañinos sin actualizar los pesos del modelo, logrando una reducción del +1,95% en el MASE en TimesFM 2.5.

28
RESEARCHarXiv CS.LG·hace 15d

WeCon: An Efficient Weight-Conditioned Neural Solver for Multi-Objective Combinatorial Optimization Problems

Investigadores proponen WeCon, un solucionador neuronal eficiente condicionado por pesos para Problemas de Optimización Combinatoria Multi-Objetivo (MOCOPs). Mejora el modelado de contexto condicionado por pesos y la optimización de preferencias, abordando las limitaciones de los métodos existentes en la inyección de pesos y la construcción de pares de soluciones para el entrenamiento.

28
RESEARCHarXiv CS.AI·hace 14d

Practical Quantum CIM Empowerment via All-Domestic-Core Agentic Large Model

Este estudio integra una Máquina de Ising Coherente (CIM) bombeada por láser de femtosegundos con un sistema agéntico impulsado por LLMs, utilizando LangGraph y LangChain. Demuestra que los LLMs pueden realizar eficazmente tareas como la calibración de modelos QUBO/Ising y la iteración de pesos de restricción, logrando la habilitación práctica de CIM cuántico con tecnología doméstica.

28
RESEARCHarXiv CS.LG·6/4/2026

From Broad Exploration to Stable Synthesis: Entropy-Guided Optimization for Autoregressive Image Generation

O artigo analisa a interação entre Chain-of-Thought (CoT) e Reinforcement Learning (RL) na geração de imagens a partir de texto (T2I) usando uma análise sistemática baseada em entropia. Ele revela que menor entropia dos tokens de imagem e do CoT textual se correlaciona com melhor qualidade de imagem, propondo a estratégia Entropy-Guided Group Relative Policy Optimization (EG-GRPO) para otimização com base na incerteza.

28
RESEARCHarXiv CS.LG·hace 21d

Systematic Optimization of Real-Time Diffusion Model Inference on Apple M3 Ultra

Esta investigación optimiza sistemáticamente la inferencia de modelos de difusión en tiempo real en el Apple M3 Ultra, explorando varias técnicas como la conversión CoreML y la cuantificación. El estudio logró 22.7 FPS para la transformación img2img de 512x512 combinando la conversión CoreML del SDXS-512 con una tubería de cámara de 3 hilos.

28
RESEARCHarXiv CS.LG·hace 5d

Inverse Critical Experiment Design via Gradient Optimization and a Multigroup Attention-Based Neural Network Architecture

Esta investigación introduce una metodología para el diseño inverso de experimentos críticos, fundamental para la validación de diseños avanzados de reactores nucleares. Utiliza modelado subrogado de redes neuronales profundas y optimización de gradiente no paramétrica para generar geometrías experimentales que maximizan la similitud neutrónica.

28