← heapsort-ai

AI Research

146 items

RESEARCHarXiv CS.CL·hace 7d

SENSE: Semantic Embedding Navigation with Soft-gated Evaluation for Retrieval-based Speculative Decoding

Este artículo propone SENSE (Semantic Embedding Navigation with Soft-gated Evaluation) para mejorar la Decodificación Especulativa Basada en Recuperación (RSD) en LLMs. SENSE aborda las rígidas dependencias léxicas de RSD, utilizando alineación semántica y evaluación de puerta suave para validar la equivalencia semántica.

29
ARTICLE↑ trendingReddit r/MachineLearning·16/4/2026

Camera-ready paranoia [D]

Un usuario expresa "paranoia de cámara-lista" después de enviar su artículo a CVPRW, temiendo el rechazo por posibles errores a pesar de haber utilizado una herramienta de validación de PDF. Busca confirmación sobre cuándo se incluirá el artículo en las actas, ya que su estado actual es "En producción".

29
RESEARCHarXiv CS.CL·6/4/2026

PolyJarvis: LLM Agent for Autonomous Polymer MD Simulations

PolyJarvis é um agente LLM que automatiza simulações de dinâmica molecular de polímeros para prever propriedades a partir de linguagem natural, utilizando a plataforma RadonPy. O sistema executa tarefas desde a construção do monômero até o cálculo de propriedades, mostrando previsões precisas de densidade e módulos de elasticidade para polímeros como aPS e PMMA.

29
RESEARCHDEV.to AI·hace 18d

Hugging Face: New Research Highlights Value of Specialized AI Models

Hugging Face publicó una investigación de Dharma AI el 22 de mayo de 2026, destacando que los modelos de IA especializados pueden superar a los modelos más grandes y de propósito general en tareas específicas. El estudio sugiere un cambio estratégico en la adquisición de IA, priorizando el rendimiento y la eficiencia específicos de la tarea.

29
RESEARCHarXiv CS.CL·hace 5d

Discourse-Role Labels as Presentation-Time Variables for Context Use in Language Models

Este estudio investiga el efecto de las etiquetas de rol de discurso, como "Referencia" o "Instrucción", en el comportamiento de los modelos de lenguaje. Revela que la tasa de adopción de información engañosa puede cambiar significativamente (56-84 puntos porcentuales) según la etiqueta, con etiquetas como "Instrucción" aumentando la adopción y "Ejemplo" suprimiéndola constantemente.

28
RESEARCHDEV.to AI·17/4/2026

Logical Neural Networks

Las Redes Neuronales Lógicas representan un área de investigación que busca integrar el razonamiento simbólico con el reconocimiento de patrones de las redes neuronales. Este campo explora cómo combinar la representación explícita del conocimiento y la inferencia lógica con la capacidad de aprendizaje de los modelos conexionistas.

28
RESEARCHarXiv CS.CL·20/4/2026

Brain Score Tracks Shared Properties of Languages: Evidence from Many Natural Languages and Structured Sequences

Esta investigación explora la similitud entre el procesamiento de modelos de lenguaje y el procesamiento del lenguaje humano mediante el marco Brain Score. Los hallazgos sugieren que los LMs entrenados en diversos lenguajes naturales e incluso en datos estructurados (genoma humano, Python) muestran un rendimiento similar en Brain Score, lo que indica que la métrica captura la capacidad de extraer estructuras comunes.

28
RESEARCHarXiv CS.CL·4/5/2026

Timing is Everything: Temporal Scaffolding of Semantic Surprise in Humor

Esta investigación propone el marco Dual Prediction Violation (DPV) para explicar el humor, enfatizando la interacción entre contenido y tiempo. Al analizar 828 actuaciones de stand-up chinas, muestra que las características temporales, especialmente las violaciones semánticas máximas y las pausas sistemáticas, predicen la apreciación de la audiencia de manera más significativa que la incongruencia semántica por sí sola.

28
RESEARCHarXiv CS.LG·hace 21d

A Structural Threshold in Decision Capacity Governs Collapse in Self-Play Reinforcement Learning

Este artículo demuestra que un umbral en la capacidad de decisión rige el colapso en agentes de aprendizaje por refuerzo de auto-juego bajo perturbaciones de reglas. La eliminación de todas las decisiones contingentes de alcance positivo provoca un colapso rápido, mientras que preservar incluso una sola evita esta caída.

28
RESEARCHarXiv CS.CL·hace 5d

When Retrieval Doesn't Help: A Large-Scale Study of Biomedical RAG

Un estudio a gran escala reevalúa la Generación Aumentada por Recuperación (RAG) en la respuesta a preguntas médicas, encontrando solo mejoras pequeñas e inconsistentes en comparación con las líneas de base sin recuperación. Sugiere que la elección del modelo base es más crítica que los métodos de recuperación, y el principal cuello de botella es la capacidad del modelo para usar eficazmente la evidencia recuperada.

28
RESEARCHarXiv CS.CL·hace 5d

SaliMory: Orchestrating Cognitive Memory for Conversational Agents

SALIMORY es un framework que entrena un modelo de lenguaje único para gestionar la memoria cognitivamente estructurada de agentes conversacionales, resolviendo problemas de métodos actuales. Utiliza una recompensa de proceso jerárquica y refinamiento contrastivo para mejorar la precisión y personalización, reduciendo los fallos de memoria.

28
RESEARCHarXiv CS.CL·hace 19d

Long-Context Reasoning Through Proxy-Based Chain-of-Thought Tuning

Los grandes modelos de lenguaje tienen un rendimiento deficiente en tareas de razonamiento de contexto largo a pesar de admitir entradas extensas. ProxyCoT propone una nueva estructura de entrenamiento que transfiere las capacidades de razonamiento de contextos proxy cortos a contextos largos completos, superando a los modelos base.

28
RESEARCHarXiv CS.CL·hace 27d

Instructions shape Production of Language, not Processing

Este artículo de investigación explora un mecanismo centrado en la producción en modelos de lenguaje, revelando una asimetría entre el procesamiento y la producción del lenguaje. Demuestra que las instrucciones moldean significativamente la información en los tokens de salida, pero no en los de entrada, correlacionándose fuertemente con el comportamiento del modelo.

28
RESEARCHarXiv CS.LG·hace 27d

Steering Without Breaking: Mechanistically Informed Interventions for Discrete Diffusion Language Models

Este artículo investiga las limitaciones de las intervenciones uniformes en los modelos de lenguaje de difusión discreta (DLMs), mostrando que degradan la calidad de la generación controlada. Los autores descubren que diferentes atributos se consolidan en etapas distintas del proceso de denoising, proponiendo un programador adaptativo para concentrar las intervenciones de manera eficiente.

28
RESEARCHarXiv CS.CL·hace 12d

From AR to Diffusion: Efficiently Adapting Large Language Models with Strictly Causal and Elastic Horizons

FLUID es un nuevo framework que adapta eficientemente modelos autorregresivos (AR) al paradigma de difusión para la generación paralela de texto. Permite la inicialización desde modelos tipo GPT e introduce un mecanismo de denoising dinámico, logrando un rendimiento de vanguardia con costos de entrenamiento significativamente menores.

28
RESEARCHarXiv CS.LG·hace 15d

Reading Calibrated Uncertainty from Language Model Trajectories

Este artículo de investigación propone un nuevo método para cuantificar la incertidumbre en modelos de lenguaje, rastreando la trayectoria acumulativa de las actualizaciones MLP por capa. Al extraer once características geométricas invariantes a escala, una sonda lineal esparsa supera la probabilidad máxima de softmax en la evaluación de la incertidumbre.

28
RESEARCHarXiv CS.CL·hace 15d

RAS: Reflection-Augmented Scaling with In-Context Learning for Executable Cypher Query Generation

El estudio presenta Reflection-Augmented Scaling (RAS) para la generación de consultas Cypher ejecutables, utilizando la retroalimentación de ejecución mediante el aprendizaje en contexto. RAS reduce la tasa de error de ejecución de consultas en un 41-50%, superando a los métodos de escalado independientes.

28
RESEARCHarXiv CS.CL·20/4/2026

DALM: A Domain-Algebraic Language Model via Three-Phase Structured Generation

Se propone DALM (Domain-Algebraic Language Model) para abordar la interferencia de conocimiento en los LLM, reemplazando la generación no restringida de tokens con un denoising estructurado sobre una celosía de dominios. Sigue un camino de generación de tres fases (incertidumbre de dominio, relación y concepto) bajo restricciones algebraicas, evitando la contaminación entre dominios.

27