← heapsort-ai

Natural Language Processing

168 items

RESEARCHarXiv CS.CL·6/4/2026

Dependency-Guided Parallel Decoding in Discrete Diffusion Language Models

Modelos de linguagem de difusão discreta (dLLMs) aceleram a geração de texto, mas a decodificação paralela degrada a qualidade ao desconsiderar a dependência entre tokens. DEMASK propõe um preditor leve que estima influências condicionais para guiar o desmascaramento simultâneo, comprovadamente melhorando a qualidade. A técnica resulta em um ganho de velocidade de 1.7 a 2.2x, mantendo ou superando o desempenho.

29
RESEARCHDEV.to AI·hace 22d

Solving Math Word Problems by Combining Language Models With Symbolic Solvers

Esta investigación explora un enfoque novedoso para resolver problemas matemáticos de texto combinando el poder de los modelos de lenguaje con la precisión de los solucionadores simbólicos. El método busca aprovechar tanto la comprensión del lenguaje natural como el razonamiento matemático formal para lograr soluciones robustas.

28
DOCDEV.to AI·2/5/2026

Automating Your Literature Review: A Practical AI Approach

Este contenido explica cómo la automatización de la IA puede optimizar las revisiones de literatura, convirtiendo la extracción de datos de PDFs en un proceso simplificado y menos propenso a errores. Destaca la importancia de un ciclo de refinamiento iterativo y presenta la biblioteca de código abierto GROBID para la extracción estructurada de datos académicos.

28
RESEARCHarXiv CS.CL·hace 4d

Efficient Punctuation Restoration via Weighted Lookahead Scoring Method for Streaming ASR Systems

Este artículo presenta un método de puntuación no autorregresivo para la restauración eficiente de la puntuación en sistemas de Reconocimiento Automático de Voz (ASR) en streaming. Compara hipótesis de inserción de puntuación con una línea base sin inserción, utilizando un lookahead limitado, y supera los métodos basados en prompt.

28
ARTICLEDEV.to AI·23/4/2026

How to Cross-Examination in a Click: Finding Inconsistencies Across Witness Statements

Este contenido describe cómo la IA puede automatizar la tarea compleja de encontrar inconsistencias en múltiples declaraciones de testigos para interrogatorios legales. El método implica pasar de la resumen de declaraciones individuales a un análisis comparativo unificado mediante la alineación de entidades y eventos.

28
RESEARCHarXiv CS.AI·15/4/2026

Narrative-Driven Paper-to-Slide Generation via ArcDeck

ArcDeck es un framework de IA multiagente que genera diapositivas a partir de artículos académicos, modelando explícitamente el flujo lógico y la estructura narrativa del texto. Utiliza un árbol de discurso y un proceso de refinamiento iterativo basado en agentes para asegurar la coherencia, demostrando mejoras significativas en las presentaciones generadas.

28
RESEARCHarXiv CS.CL·hace 19d

Long-Context Reasoning Through Proxy-Based Chain-of-Thought Tuning

Los grandes modelos de lenguaje tienen un rendimiento deficiente en tareas de razonamiento de contexto largo a pesar de admitir entradas extensas. ProxyCoT propone una nueva estructura de entrenamiento que transfiere las capacidades de razonamiento de contextos proxy cortos a contextos largos completos, superando a los modelos base.

28
RESEARCHarXiv CS.CL·hace 6d

Fixing FOLIO and MALLS: Verified Annotations and an LLM-assisted Framework to Focus Human Relabeling

Una inspección sistemática de las divisiones de validación de extsf{FOLIO} y extsf{MALLS} reveló altas tasas de formalizaciones FOL incorrectas y oraciones NL ambiguas, distorsionando la evaluación de modelos de IA. Los autores desarrollaron y publicaron verdades fundamentales corregidas para estos conjuntos de datos, demostrando cómo los errores de anotación impactan la evaluación de LLMs de última generación.

28
ARTICLEDEV.to AI·hace 15d

Origin Part 12: The Adapter

Este artículo describe un problema encontrado al implementar un nuevo codificador de IA que, a pesar de mejorar significativamente la identificación de conceptos, estropeó todas las respuestas. Detalla el papel del "Dispatcher" en el sistema Origin, que actúa como intermediario entre el codificador y la respuesta, procesando las activaciones de conceptos para determinar las acciones adecuadas.

28
DOCDEV.to AI·hace 5d

Cignara

Cignara es una plataforma basada en la nube y potenciada por IA, diseñada para optimizar el análisis de datos, la automatización y la toma de decisiones, utilizando ML y PNL. Su arquitectura presenta infraestructura de nube, una capa de procesamiento de datos y un motor de IA/ML con modelos de PNL y análisis predictivo.

28
RESEARCHarXiv CS.CL·1/5/2026

Targeted Linguistic Analysis of Sign Language Models with Minimal Translation Pairs

El artículo presenta ASL-MTP, un nuevo conjunto de datos de referencia para analizar cómo los modelos de lengua de señas capturan fenómenos lingüísticos y utilizan múltiples articuladores. Este dataset se emplea para un análisis lingüístico dirigido de un modelo de traducción ASL-a-inglés de última generación.

28
RESEARCHarXiv CS.CL·hace 22d

Greedy or not, here I come: Language production under vocabulary constraints in humans and resource-rational models

Esta investigación explora cómo los humanos se comunican con vocabularios limitados, comparando sus estrategias con algoritmos de muestreo computacional impulsados por grandes modelos de lenguaje. El estudio revela que la producción del lenguaje humano bajo restricciones a menudo refleja el muestreo codicioso, aunque los individuos más hábiles muestran comportamientos de revisión no codiciosos.

28
RESEARCHarXiv CS.CL·hace 22d

Fluency and Faithfulness in Human and Machine Literary Translation

Esta investigación examina el equilibrio entre fluidez y fidelidad en la traducción literaria, comparando traducciones humanas, de Google Translate y TranslateGemma de 106 novelas en 16 idiomas. Los hallazgos muestran una correlación negativa constante entre fluidez y fidelidad, y sugieren que la longitud del segmento es importante para la evaluación automática.

28
RESEARCHarXiv CS.CL·hace 15d

Learnability-Informed Fine-Tuning of Diffusion Language Models

Esta investigación introduce LIFT, un algoritmo de ajuste fino informado por la "learnability" (capacidad de aprendizaje), diseñado para mejorar las capacidades de razonamiento de los modelos de lenguaje de difusión. LIFT aborda las deficiencias del SFT estándar aprendiendo tokens de forma adaptativa según su dificultad y el contexto disponible en diferentes pasos de tiempo de difusión, mostrando un rendimiento mejorado.

28
RESEARCHarXiv CS.AI·hace 5d

SMAC-Talk: A Natural Language Extension of the StarCraft Multi-Agent Challenge for Large Language Models

Este artículo presenta SMAC-Talk, una extensión del StarCraft Multi-Agent Challenge, para evaluar agentes basados en LLM en entornos cooperativos multiagente. Incluye un canal de comunicación en lenguaje natural para investigar la coordinación y la confianza de los agentes, así como escenarios con comunicadores engañosos.

28
ARTICLEDEV.to AI·1/5/2026

From Mumbles to Memos: Teaching AI to Decipher Technician Voice Notes

Este artículo aborda el cuello de botella de productividad causado por el descifrado manual de notas de voz de técnicos, proponiendo la IA como solución para transformar las grabaciones de campo en resúmenes profesionales. Describe una metodología, el 'Actionable Framework: The 3-Part Jargon List', para entrenar a la IA a categorizar información específica de audios no estructurados.

27