← heapsort-ai

AI Research

146 items

RESEARCHarXiv CS.CL·hace 12d

Bridging the Stability-Expressivity Gap: Synthetic Data Scaling and Preference Alignment for Low-Resource Spoken Language Models

Esta investigación aborda la Brecha de Estabilidad-Expresividad en los Modelos de Lenguaje Hablado (SLM) para idiomas de bajos recursos, causada por el uso extensivo de datos sintéticos. Aunque los datos sintéticos mejoran la precisión fonética, degradan la expresividad prosódica, un fenómeno denominado Erosión Sintética. El artículo presenta marcos de autoalineación para recuperar la expresividad.

27
RESEARCHDEV.to AI·4/5/2026

Learning to Efficiently Sample from Diffusion Probabilistic Models

Esta investigación se centra en desarrollar métodos más eficientes para el muestreo de Modelos Probabilísticos de Difusión, con el objetivo de reducir el costo computacional y el tiempo asociados a la generación de muestras de alta calidad. Explora nuevos algoritmos para acelerar el proceso de muestreo manteniendo la fidelidad de los datos generados.

27
RESEARCHarXiv CS.CL·6/4/2026

Single-Agent LLMs Outperform Multi-Agent Systems on Multi-Hop Reasoning Under Equal Thinking Token Budgets

Este estudo argumenta, com base na Desigualdade de Processamento de Dados, que LLMs de agente único são mais eficientes em termos de informação do que sistemas multiagente sob orçamentos de token de raciocínio iguais. A pesquisa testa empiricamente esta previsão, que sugere que sistemas multiagente se tornam competitivos quando a utilização de contexto de um único agente é degradada ou mais poder computacional é despendido.

27
RESEARCHarXiv CS.LG·6/5/2026

Generate, Filter, Control, Replay: A Comprehensive Survey of Rollout Strategies for LLM Reinforcement Learning

Esta encuesta proporciona una visión independiente del optimizador de las estrategias de rollout para el post-entrenamiento de LLM de razonamiento basados en RL. Formaliza los pipelines de rollout con una notación unificada e introduce la taxonomía del ciclo de vida Generate-Filter-Control-Replay (GFCR), descomponiendo los pipelines en cuatro etapas modulares.

27
RESEARCHarXiv CS.CL·7/4/2026

Evolutionary Search for Automated Design of Uncertainty Quantification Methods

Este artigo explora o uso de busca evolucionária impulsionada por LLMs para desenvolver automaticamente métodos de Quantificação de Incerteza (UQ) não supervisionados. Os métodos evoluídos superam baselines manuais em verificação de alegações, demonstrando generalização robusta e estratégias distintas entre diferentes modelos de LLM.

27
RESEARCHarXiv CS.CL·hace 28d

jina-embeddings-v5-omni: Geometry-preserving Embeddings via Locked Aligned Towers

Este trabajo presenta GELATO, un enfoque novedoso para modelos de embedding multimodales que extiende las arquitecturas de estilo VLM. Da como resultado la suite jina-embeddings-v5-omni, que codifica eficientemente texto, imagen, audio y video en un único espacio de embedding semántico al congelar los modelos de texto base y entrenar solo los componentes de conexión.

27
RESEARCHarXiv CS.AI·hace 19d

High Quality Embeddings for Horn Logic Reasoning

El artículo introduce enfoques novedosos para crear embeddings de alta calidad para sentencias lógicas, fundamentales para entrenar redes neuronales en la clasificación eficiente de elecciones hechas por razonadores lógicos. Estos métodos implican generar anclas con términos repetidos, equilibrar ejemplos fáciles, medianos y difíciles para el entrenamiento de triplet loss, y enfatizar periódicamente los ejemplos más difíciles.

27
RESEARCHarXiv CS.AI·hace 21d

Scalable Uncertainty Reasoning in Knowledge Graphs

Esta investigación propone un marco modular para abordar el razonamiento de incertidumbre escalable en Grafos de Conocimiento, donde los datos del mundo real a menudo contienen incertidumbre. Aborda tres niveles de incertidumbre —valores de atributos imprecisos, existencia de triples probabilísticas y conocimiento de esquema incompleto— mediante técnicas adaptadas como literales probabilísticos, circuitos probabilísticos y embeddings geométricos.

27
RESEARCHarXiv CS.AI·hace 19d

AgentCo-op: Retrieval-Based Synthesis of Interoperable Multi-Agent Workflows

AgentCo-op es un marco de síntesis basado en recuperación que compone flujos de trabajo multiagente interoperables a partir de habilidades, herramientas y agentes externos. Aplica reparación local autoguiada a componentes implicados en fallos de ejecución y se ha demostrado en estudios de caso de genómica para coordinar agentes especializados.

27
ARTICLEHugging Face (YouTube)·hace 19d

On the slow death of Scaling (birth of Adaption Labs) | Sara Hooker | HF ML Club India EP2

Este contenido explora la evolución de las metodologías de IA, discutiendo el declive de los enfoques tradicionales de escalado y el surgimiento de nuevas estrategias, ejemplificado por el nacimiento de Adaption Labs. Presentado por Sara Hooker, el episodio del HF ML Club India profundiza en cambios significativos dentro del campo de la inteligencia artificial.

On the slow death of Scaling (birth of Adaption Labs) | Sara Hooker | HF ML Club India EP2
27
ARTICLEDEV.to AI·13/4/2026

I Ran 500 More Agent Memory Experiments. The Real Problem Wasn’t Recall. It Was Binding.

Este artículo describe los hallazgos de 500 experimentos con la memoria de agentes de IA, indicando que el desafío principal no es la recuperación, sino el problema de unión (binding). La investigación sugiere que mejorar cómo los agentes de IA conectan piezas de información dispares es crucial para avanzar en sus capacidades cognitivas.

27