← heapsort-ai

Optimization

134 items

RESEARCHarXiv CS.AI·hace 8d

Structure-Induced Information for Rerooting Levin Tree Search

Este artículo introduce nuevos diseños de "rerooter" para el algoritmo $\sqrt{\text{LTS}}$, abordando las limitaciones de escalabilidad de la generación explícita de subobjetivos en la búsqueda de árboles de políticas basada en subobjetivos. Estos diseños descomponen implícitamente los problemas, permitiendo una asignación escalable del esfuerzo de búsqueda.

27
RESEARCHarXiv CS.CL·hace 12d

EvoSpec: Evolving Speculative Decoding via Real-Time Vocabulary and Parameter AdaptationTarget

EvoSpec introduce un marco para la evolución en tiempo real de modelos preliminares en la decodificación especulativa para Grandes Modelos de Lenguaje, abordando el cuello de botella de los vocabularios grandes. Utiliza adaptación dinámica de vocabulario y parámetros, empleando un mecanismo sensible al contexto y una estrategia ligera de alineación en línea para mejorar las tasas de aceptación y minimizar las brechas distribucionales.

27
RESEARCHarXiv CS.CL·hace 13d

In-Context Optimization for Retrieval-Augmented Generation: A Gradient-Descent Perspective

Este trabajo de investigación explora la Generación Aumentada por Recuperación (RAG) desde la perspectiva de la optimización en contexto. Demuestra que una sola capa de autoatención lineal puede ejecutar un paso de descenso de gradiente en un objetivo RAG linealizado unificado, revelando un régimen exacto donde la predicción aumentada por recuperación y la optimización en contexto coinciden.

27
ARTICLEDEV.to AI·hace 16d

MCPs Are Eating Your Context Window (And What To Do About It)

Este artículo analiza cómo los servidores del Protocolo de Contexto del Modelo (MCP) consumen la ventana de contexto de los modelos de IA al cargar de antemano esquemas de herramientas, lo que genera un alto uso de tokens. Propone que las "habilidades" pueden resolver este problema cargando las herramientas de forma perezosa, optimizando así el costo y la eficiencia.

27
ARTICLEDEV.to AI·27/4/2026

Context Compression in .NET

Este consejo rápido explica cómo implementar la compresión de contexto en .NET para sistemas RAG, abordando la falta de un equivalente directo a herramientas como LLMLingua. Propone usar un modelo de trabajo más pequeño y económico para preprocesar la documentación recuperada, extrayendo solo hechos esenciales para reducir costos y latencia con modelos de IA premium.

27
RESEARCHarXiv CS.LG·6/4/2026

Characterizing WebGPU Dispatch Overhead for LLM Inference Across Four GPU Vendors, Three Backends, and Three Browsers

Este estudo caracteriza a sobrecarga de despacho do WebGPU para inferência de LLM em diversas plataformas de GPU, backends e navegadores. Ele revela que benchmarks simples superestimam os custos e identifica o verdadeiro custo por despacho da API WebGPU, destacando a necessidade dessa distinção para otimizações eficazes.

27
RESEARCHarXiv CS.AI·30/4/2026

Hierarchical Multi-Persona Induction from User Behavioral Logs: Learning Evidence-Grounded and Truthful Personas

Este artículo propone un marco jerárquico para inducir múltiples personas de usuario basadas en evidencia a partir de registros de comportamiento, optimizando la calidad de la persona. El método utiliza una extensión de DPO y demuestra personas más coherentes y veraces, mejorando también la predicción de interacciones futuras.

27
RESEARCHarXiv CS.AI·6/5/2026

Accelerating battery research with an AI interface between FINALES and Kadi4Mat

Este estudio optimiza los protocolos de formación de celdas de iones de sodio para la eficiencia de duración y el rendimiento al final de su vida útil, utilizando una interfaz de IA entre FINALES y Kadi4Mat. El marco emplea la optimización bayesiana multi-objetivo para guiar la selección de experimentos, con el objetivo de acelerar el descubrimiento y reducir el consumo de recursos.

27
RESEARCHarXiv CS.AI·14/4/2026

Linear Programming for Multi-Criteria Assessment with Cardinal and Ordinal Data: A Pessimistic Virtual Gap Analysis

Este artículo presenta nuevos modelos de Análisis de Brechas Virtuales (VGA) basados en programación lineal para la evaluación multicriterio, abordando problemas de evaluaciones subjetivas y diversidad de datos. El método de dos pasos evalúa alternativas de manera pesimista utilizando datos cardinales y ordinales, permitiendo una clasificación eficiente y la eliminación de opciones desfavorables en sistemas de apoyo a la decisión.

27
RESEARCHarXiv CS.AI·22/4/2026

On Solving the Multiple Variable Gapped Longest Common Subsequence Problem

Este artículo trata el problema de la Subsecuencia Común Más Larga con Brechas Variables (VGLCS), una generalización del LCS con restricciones de brechas flexibles, relevante para la comparación de secuencias moleculares y el análisis de series temporales. Propone un marco de búsqueda basado en grafos de estado con una estrategia iterativa de búsqueda por haces para controlar la explosión combinatoria y hallar soluciones de alta calidad.

26