AI Research

146 items

RESEARCHarXiv CS.LG·hace 13d

ARBITER: Reasoning Trajectory Basins and Majority Vote Failures in Test-Time Sampling

Cuando los modelos de lenguaje usan muestreo en tiempo de prueba y voto mayoritario, las trayectorias de razonamiento se concentran en

language models Model Evaluation Reasoning AI Research

RESEARCHarXiv CS.CL·hace 12d

Bridging the Stability-Expressivity Gap: Synthetic Data Scaling and Preference Alignment for Low-Resource Spoken Language Models

Esta investigación aborda la Brecha de Estabilidad-Expresividad en los Modelos de Lenguaje Hablado (SLM) para idiomas de bajos recursos, causada por el uso extensivo de datos sintéticos. Aunque los datos sintéticos mejoran la precisión fonética, degradan la expresividad prosódica, un fenómeno denominado Erosión Sintética. El artículo presenta marcos de autoalineación para recuperar la expresividad.

synthetic data speech synthesis spoken language models Low-resource languages

RESEARCHDEV.to AI·4/5/2026

Learning to Efficiently Sample from Diffusion Probabilistic Models

Esta investigación se centra en desarrollar métodos más eficientes para el muestreo de Modelos Probabilísticos de Difusión, con el objetivo de reducir el costo computacional y el tiempo asociados a la generación de muestras de alta calidad. Explora nuevos algoritmos para acelerar el proceso de muestreo manteniendo la fidelidad de los datos generados.

Diffusion Models generative models machine learning Sampling Efficiency

ARTICLEDEV.to AI·hace 26d

The Man Who Summoned Ghosts | Chapter 5: Summoning Ghosts

Este contenido explora la analogía de Andrej Karpathy sobre

LLMs Andrej Karpathy AI philosophy AI metaphors

ARTICLEDEV.to AI·25/4/2026

Tian AI Self-Evolution: Code Modification Engine

Tian AI presenta un motor de autoevolución que analiza y modifica su propio código Python basándose en la experiencia operativa. Este innovador sistema busca alcanzar el "santo grial" de la investigación en IA, permitiendo que la inteligencia artificial se mejore continuamente.

Self-evolving AI machine learning AI Systems code modification

RESEARCHDEV.to AI·11/4/2026

Learning Neural Causal Models from Unknown Interventions

Este trabajo explora métodos para que los modelos neuronales aprendan relaciones de causa y efecto, incluso en escenarios donde las intervenciones que generan datos son desconocidas. La investigación busca mejorar la capacidad de la inteligencia artificial para inferir causalidad a partir de datos complejos.

neural networks machine learning causality causal inference

RESEARCHarXiv CS.CL·6/4/2026

Single-Agent LLMs Outperform Multi-Agent Systems on Multi-Hop Reasoning Under Equal Thinking Token Budgets

Este estudo argumenta, com base na Desigualdade de Processamento de Dados, que LLMs de agente único são mais eficientes em termos de informação do que sistemas multiagente sob orçamentos de token de raciocínio iguais. A pesquisa testa empiricamente esta previsão, que sugere que sistemas multiagente se tornam competitivos quando a utilização de contexto de um único agente é degradada ou mais poder computacional é despendido.

LLMs Information Efficiency Computational Budget Multi-Hop Reasoning

RESEARCHarXiv CS.LG·6/5/2026

Generate, Filter, Control, Replay: A Comprehensive Survey of Rollout Strategies for LLM Reinforcement Learning

Esta encuesta proporciona una visión independiente del optimizador de las estrategias de rollout para el post-entrenamiento de LLM de razonamiento basados en RL. Formaliza los pipelines de rollout con una notación unificada e introduce la taxonomía del ciclo de vida Generate-Filter-Control-Replay (GFCR), descomponiendo los pipelines en cuatro etapas modulares.

Rollout Strategies reinforcement learning machine learning AI Research

CASEOpenAI Blog·hace 29d

How NVIDIA engineers and researchers build with Codex

Ingenieros y investigadores de NVIDIA utilizan Codex con GPT-5.5 para construir sistemas de producción. También emplean estas herramientas para transformar ideas de investigación en experimentos ejecutables.

Codex GPT-5.5 NVIDIA AI development

RESEARCHarXiv CS.CL·7/4/2026

Evolutionary Search for Automated Design of Uncertainty Quantification Methods

Este artigo explora o uso de busca evolucionária impulsionada por LLMs para desenvolver automaticamente métodos de Quantificação de Incerteza (UQ) não supervisionados. Os métodos evoluídos superam baselines manuais em verificação de alegações, demonstrando generalização robusta e estratégias distintas entre diferentes modelos de LLM.

LLMs Uncertainty Quantification Evolutionary Search AI Research

RESEARCHarXiv CS.CL·hace 28d

jina-embeddings-v5-omni: Geometry-preserving Embeddings via Locked Aligned Towers

Este trabajo presenta GELATO, un enfoque novedoso para modelos de embedding multimodales que extiende las arquitecturas de estilo VLM. Da como resultado la suite jina-embeddings-v5-omni, que codifica eficientemente texto, imagen, audio y video en un único espacio de embedding semántico al congelar los modelos de texto base y entrenar solo los componentes de conexión.

embedding models multimodal AI deep learning machine learning

RESEARCHarXiv CS.AI·hace 19d

OSCToM: RL-Guided Adversarial Generation for High-Order Theory of Mind

Este artículo presenta OSCToM, un enfoque para modelar conflictos de creencias anidados en tareas de Teoría de la Mente basadas en LLM. Combina el aprendizaje por refuerzo y modelos sustitutos composicionales para generar estos conflictos, y OSCToM-8B mostró los mejores resultados en los experimentos.

LLMs reinforcement learning AI Research Theory of Mind

RESEARCHarXiv CS.AI·hace 19d

High Quality Embeddings for Horn Logic Reasoning

El artículo introduce enfoques novedosos para crear embeddings de alta calidad para sentencias lógicas, fundamentales para entrenar redes neuronales en la clasificación eficiente de elecciones hechas por razonadores lógicos. Estos métodos implican generar anclas con términos repetidos, equilibrar ejemplos fáciles, medianos y difíciles para el entrenamiento de triplet loss, y enfatizar periódicamente los ejemplos más difíciles.

neural networks Logic reasoning machine learning embeddings

RESEARCHarXiv CS.AI·hace 21d

Scalable Uncertainty Reasoning in Knowledge Graphs

Esta investigación propone un marco modular para abordar el razonamiento de incertidumbre escalable en Grafos de Conocimiento, donde los datos del mundo real a menudo contienen incertidumbre. Aborda tres niveles de incertidumbre —valores de atributos imprecisos, existencia de triples probabilísticas y conocimiento de esquema incompleto— mediante técnicas adaptadas como literales probabilísticos, circuitos probabilísticos y embeddings geométricos.

Uncertainty Reasoning Knowledge Graphs Probabilistic Models Semantic Web

RESEARCHarXiv CS.AI·hace 19d

AgentCo-op: Retrieval-Based Synthesis of Interoperable Multi-Agent Workflows

AgentCo-op es un marco de síntesis basado en recuperación que compone flujos de trabajo multiagente interoperables a partir de habilidades, herramientas y agentes externos. Aplica reparación local autoguiada a componentes implicados en fallos de ejecución y se ha demostrado en estudios de caso de genómica para coordinar agentes especializados.

workflow automation Genomics Scientific Discovery multi-agent systems

ARTICLEHugging Face (YouTube)·hace 19d

On the slow death of Scaling (birth of Adaption Labs) | Sara Hooker | HF ML Club India EP2

Este contenido explora la evolución de las metodologías de IA, discutiendo el declive de los enfoques tradicionales de escalado y el surgimiento de nuevas estrategias, ejemplificado por el nacimiento de Adaption Labs. Presentado por Sara Hooker, el episodio del HF ML Club India profundiza en cambios significativos dentro del campo de la inteligencia artificial.

Adaption Labs machine learning scaling AI Research

On the slow death of Scaling (birth of Adaption Labs) | Sara Hooker | HF ML Club India EP2

NEWSLangChain Blog·hace 21d

Introducing LangChain Labs

LangChain Labs es una nueva iniciativa de investigación aplicada centrada en el aprendizaje continuo para agentes. Con socios, busca avanzar en la investigación abierta sobre sistemas de IA auto-mejorables.

LangChain self-improving AI AI Research AI agents

ARTICLEDEV.to AI·13/4/2026

I Ran 500 More Agent Memory Experiments. The Real Problem Wasn’t Recall. It Was Binding.

Este artículo describe los hallazgos de 500 experimentos con la memoria de agentes de IA, indicando que el desafío principal no es la recuperación, sino el problema de unión (binding). La investigación sugiere que mejorar cómo los agentes de IA conectan piezas de información dispares es crucial para avanzar en sus capacidades cognitivas.

Memory Systems cognitive architectures Binding problem AI Research

RESEARCHHugging Face (YouTube)·27/4/2026

Multi-Agent AutoResearch with Open Source Models

Este contenido explora el concepto de investigación automática multiagente, detallando cómo múltiples agentes de IA pueden colaborar para llevar a cabo tareas de investigación. Se centra específicamente en el aprovechamiento de modelos de código abierto para facilitar y mejorar estos procesos de investigación automatizados.

open source models multi-agent systems automation AI Research

Multi-Agent AutoResearch with Open Source Models

RESEARCHHugging Face (YouTube)·16/4/2026

Hugging Face Journal Club: Embarrassingly Simple Self-Distillation Improves Code Generation

Este contenido del Hugging Face Journal Club explora un método de auto-destilación "vergonzosamente simple" que mejora notablemente la generación de código. Destaca avances en el aprovechamiento de modelos de lenguaje grandes para tareas de programación.

machine learning code generation Self-Distillation large language models

Hugging Face Journal Club: Embarrassingly Simple Self-Distillation Improves Code Generation