AI Research

146 items

RESEARCHarXiv CS.LG·hace 28d

Path-Based Gradient Boosting for Graph-Level Prediction

Proponemos PathBoost, un método de refuerzo de árboles de gradiente para clasificación y regresión a nivel de grafo, que aprende características discriminativas basadas en rutas directamente de la estructura del grafo de entrada. Este método introduce adaptaciones para clasificación binaria, incorpora múltiples atributos de nodos y aristas, y selecciona automáticamente nodos ancla, superando o igualando a las redes neuronales de grafos y enfoques de kernel de grafos en varios conjuntos de datos de referencia.

gradient boosting Graph Neural Networks machine learning graph theory

ARTICLEMIT Tech Review AI·13/4/2026

You have no choice in reading this article—maybe

Uri Maoz, durante su doctorado, se centró en la neurociencia computacional, investigando cómo el cerebro dirige los movimientos de los brazos y cómo percibe dicho movimiento. Su estudio profundizó en los complejos mecanismos de control motor y percepción sensorial humanos.

computational neuroscience perception brain motor control

RESEARCHarXiv CS.CL·hace 7d

lmfaoooo at SemEval-2026 Task 1: Humor Is an Audience. Preference Modeling for Constrained Humor Generation

Este artículo describe un sistema para la Tarea-1 de SemEval-2026, que se centra en la generación de humor bajo restricciones explícitas. El enfoque utiliza una estrategia de

evaluation Natural Language Processing humor generation AI Research

RESEARCHarXiv CS.AI·hace 28d

Belief or Circuitry? Causal Evidence for In-Context Graph Learning

Este artículo investiga cómo los LLMs aprenden en contexto, utilizando una tarea de paseo aleatorio en grafos para explorar si coinciden con patrones o infieren estructura latente. Revela que ninguna explicación por sí sola es suficiente, presentando evidencia de codificación simultánea de topologías de grafos e intervenciones causales.

LLMs learning interpretability graph learning

RESEARCHarXiv CS.CL·hace 25d

Merging Methods for Multilingual Knowledge Editing for Large Language Models: An Empirical Odyssey

Este artículo investiga la eficacia de los métodos de fusión de vectores para la edición de conocimiento multilingüe (MKE) en Grandes Modelos de Lenguaje, centrándose en reducir la interferencia entre ediciones específicas de idiomas. Evaluando seis variantes de fusión con dos LLM, dos métodos de edición y 12 idiomas en el benchmark MzsRE, encuentra que la suma vectorial con covarianza compartida es la estrategia más fiable.

multilingual LLMs Natural Language Processing Vector Merging Knowledge Editing

RESEARCHarXiv CS.CL·hace 27d

HEBATRON: A Hebrew-Specialized Open-Weight Mixture-of-Experts Language Model

Hebatron es un modelo de lenguaje grande de código abierto especializado en hebreo, construido sobre la arquitectura Mixture-of-Experts (MoE) Nemotron-3 de NVIDIA. Logra un promedio de razonamiento en hebreo del 73,8%, superando a sus competidores y ofreciendo un rendimiento de inferencia significativamente mayor al activar menos parámetros por pasada.

language models NVIDIA AI Hebrew AI Mixture of Experts

RESEARCHarXiv CS.AI·hace 27d

EVOCHAMBER: Test-Time Co-evolution of Multi-Agent System at Individual, Team, and Population Scales

EVOCHAMBER introduce un marco sin entrenamiento para la evolución multiagente en tiempo de prueba a escalas individual, de equipo y poblacional, diferenciándose de los enfoques de agente único. Incorpora CODREAM, un protocolo post-tarea para la reflexión colaborativa y el enrutamiento asimétrico del conocimiento después de fallas o desacuerdos del equipo.

Evolutionary AI machine learning multi-agent systems Collaboration

RESEARCHarXiv CS.CL·hace 26d

Bridging the Missing-Modality Gap: Improving Text-Only Calibration of Vision Language Models

Los modelos de lenguaje visual (VLMs) sufren caídas de precisión y una severa descalibración al operar con entradas de solo texto, incluso con información semántica preservada. Se propone el Latent Imagination Module (LIM) para predecir incrustaciones latentes imaginadas a partir de texto, mejorando la precisión y reduciendo el error de calibración en escenarios de imágenes faltantes.

Miscalibration Vision-Language Models Latent Imagination Text-Only Inputs

RESEARCHarXiv CS.CL·hace 27d

Sampling More, Getting Less: Calibration is the Diversity Bottleneck in LLMs

Este estudio aborda la falta de diversidad en las salidas de los LLM, atribuyéndola a cómo los modelos asignan la masa de probabilidad entre continuaciones válidas e inválidas durante la decodificación. Introduce un marco de validez-diversidad que descompone el problema en dos formas complementarias de descalibración: calibración de orden y calibración de forma.

Calibration diversity LLMs decoding

RESEARCHarXiv CS.CL·hace 26d

BoostTaxo: Zero-Shot Taxonomy Induction via Boosting-Style Agentic Reasoning and Constraint-Aware Calibration

BoostTaxo introduce un nuevo framework de LLM estilo boosting para la inducción de taxonomías zero-shot, buscando superar las limitaciones de generalización y eficiencia de los métodos actuales. Mejora la construcción de taxonomías mediante un proceso de identificación de padres de grueso a fino, utilizando el refinamiento de definición y la selección híbrida de candidatos.

Taxonomy induction Semantic hierarchies AI Research LLM

RESEARCHarXiv CS.LG·hace 11d

Balancing Multimodal Learning through Label Space Reshaping

El artículo aborda el desequilibrio de modalidades en el aprendizaje multimodal, donde algunas modalidades dominan la optimización. Propone que esta discrepancia surge de diferentes dificultades de mapeo entre el espacio de características específicas de la modalidad y el espacio de etiquetas compartido, introduciendo BMLR para igualar esta dificultad.

multimodal learning Optimization learning machine learning

RESEARCHarXiv CS.LG·hace 11d

Continuity and Ordinality Matter: Constraining Time Series Tokens for Effective Time Series Analysis with Large Language Models

Este artículo presenta COM (Continuity and Ordinality Matter), una estrategia que integra restricciones geométricas en las etapas de inicialización y entrenamiento de los grandes modelos de lenguaje basados en tokens (TS-LLMs) para el análisis de series temporales. La investigación demuestra que preservar la continuidad y la ordinalidad en los embeddings de tokens de series temporales mejora significativamente el rendimiento y la generalizabilidad del modelo.

machine learning Tokenization large language models Time Series Analysis

RESEARCHarXiv CS.CL·hace 18d

Does Slightly Mean Somewhat? Measuring Vague Intensity Words in LLM Numeric Actions

Este estudio investiga cómo los grandes modelos de lenguaje (LLMs), específicamente Claude Haiku, interpretan palabras de intensidad vagas al producir acciones numéricas. La investigación revela que el modelo comprime 10 palabras de intensidad en 5 salidas medianas distintas y está influenciado por el estado actual del sistema.

LLMs language interpretation numeric actions NLP

RESEARCHarXiv CS.CL·hace 6d

On the Persistent Effects of Lexicality in Large Language Mod

Este trabajo investiga el efecto persistente de la superposición léxica, en lugar del contenido semántico, en las representaciones extraídas de grandes modelos de lenguaje (LLMs) y sus implicaciones. Los autores encuentran que la influencia léxica se extiende a través de la profundidad de los modelos, arquitecturas y regímenes de entrenamiento, incluso en modelos entrenados para similitud semántica.

LLMs lexicality NLP semantic analysis

RESEARCHarXiv CS.CL·hace 14d

EchoDistill:Alignment Noisy-to-Clean Self-Distillation for Robust Audio LLMs

EchoDistill es un marco de autodestilación basado en alineación diseñado para hacer que los Modelos de Lenguaje Grandes de Audio (ALLMs) sean robustos al ruido del mundo real. Utiliza un profesor de audio limpio para guiar a un estudiante de audio ruidoso en tiempo de inferencia, optimizando las respuestas mediante la optimización de políticas relativas a grupos y la consistencia a nivel de token.

robustness Audio LLMs machine learning Self-Distillation

RESEARCHarXiv CS.AI·hace 15d

PathCal: State-Aware Reflection-Marker Calibration for Efficient Reasoning

Este artículo de investigación presenta 'PathCal', que investiga los distintos roles funcionales y el momento de los marcadores de reflexión en las trayectorias de Chain-of-Thought de los Large Reasoning Language Models. Revela que marcadores como 'wait' o 'but' difieren significativamente en su impacto en la precisión y la longitud de la generación, desafiando enfoques anteriores.

Natural Language Processing Chain-of-Thought Reasoning large language models

RESEARCHarXiv CS.CL·hace 15d

Graph Alignment Topology as an Inductive Bias for Grounding Detection

Los Modelos de Lenguaje Grandes (LLM) están optimizados para producir continuaciones plausibles en lugar de verificar explícitamente si las proposiciones generadas se derivan de documentos fuente, lo que limita su uso en dominios críticos. Esta investigación propone aprovechar la topología de alineación como un sesgo inductivo, construyendo grafos bipartitos alineados entre la información de referencia y las salidas del LLM, y entrenando una Red Neuronal Gráfica (GNN).

LLMs hallucination grounding detection GNNs

RESEARCHarXiv CS.CL·hace 6d

Linear Probes Detect Task Format, Not Reasoning Mode in Language Model Hidden States

Este artículo revela que las sondas lineales, a menudo utilizadas para identificar representaciones de razonamiento distintas en estados ocultos de LLMs, en realidad detectan el formato de la tarea en lugar de los modos de razonamiento. La alta precisión observada en benchmarks con Qwen3-14B desapareció al controlar las variables de formato, sugiriendo un razonamiento en gran medida compartido no vinculado funcionalmente a la geometría del estado oculto.

Benchmarking Natural Language Processing Model Analysis AI Research

RESEARCHarXiv CS.AI·hace 14d

In Search of the Ingredients of Open-Endedness: Replicating Picbreeder with Large Vision-Language Models

Esta investigación explora la capacidad de descubrimiento abierto de la IA en la producción creativa, replicando Picbreeder con modelos de visión-lenguaje. El estudio observa diferencias cualitativas claras entre los resultados generados por la IA y los históricos de referencia humana, intentando caracterizarlos.

Open-Ended Learning Vision-Language Models Evolutionary AI AI Research

RESEARCHarXiv CS.AI·hace 15d

NeuroNL2LTL: A Neurosymbolic Framework for Natural Language Translation of Linear Temporal Logic

NeuroNL2LTL es una arquitectura neurosimbólica que unifica la traducción aprendida con la verificación formal para convertir el lenguaje natural en Lógica Temporal Lineal. Utiliza un entrenamiento con verificador en el bucle, donde los resultados de la verificación sirven como señales de recompensa para el aprendizaje por refuerzo, optimizando la corrección formal.

reinforcement learning Neurosymbolic AI Formal verification Natural Language Processing