Natural Language Processing

168 items

RESEARCHarXiv CS.CL·6/4/2026

Dependency-Guided Parallel Decoding in Discrete Diffusion Language Models

Modelos de linguagem de difusão discreta (dLLMs) aceleram a geração de texto, mas a decodificação paralela degrada a qualidade ao desconsiderar a dependência entre tokens. DEMASK propõe um preditor leve que estima influências condicionais para guiar o desmascaramento simultâneo, comprovadamente melhorando a qualidade. A técnica resulta em um ganho de velocidade de 1.7 a 2.2x, mantendo ou superando o desempenho.

Dependency Prediction DEMASK Parallel Decoding machine learning

RESEARCHDEV.to AI·hace 22d

Solving Math Word Problems by Combining Language Models With Symbolic Solvers

Esta investigación explora un enfoque novedoso para resolver problemas matemáticos de texto combinando el poder de los modelos de lenguaje con la precisión de los solucionadores simbólicos. El método busca aprovechar tanto la comprensión del lenguaje natural como el razonamiento matemático formal para lograr soluciones robustas.

mathematical reasoning Symbolic AI Natural Language Processing problem-solving

DOCDEV.to AI·2/5/2026

Automating Your Literature Review: A Practical AI Approach

Este contenido explica cómo la automatización de la IA puede optimizar las revisiones de literatura, convirtiendo la extracción de datos de PDFs en un proceso simplificado y menos propenso a errores. Destaca la importancia de un ciclo de refinamiento iterativo y presenta la biblioteca de código abierto GROBID para la extracción estructurada de datos académicos.

research Data Extraction Natural Language Processing AI

RESEARCHarXiv CS.CL·hace 4d

Multi-Granularity Reasoning for Natural Language Inference

El artículo propone una novedosa Red de Razonamiento Multigranularidad (MGRN) para la Inferencia del Lenguaje Natural (NLI). Aborda las limitaciones de los modelos basados en transformadores existentes al aprovechar características semánticas jerárquicas para capturar interacciones complejas para un razonamiento efectivo.

deep learning Natural Language Inference machine learning Natural Language Processing

RESEARCHarXiv CS.CL·hace 4d

Efficient Punctuation Restoration via Weighted Lookahead Scoring Method for Streaming ASR Systems

Este artículo presenta un método de puntuación no autorregresivo para la restauración eficiente de la puntuación en sistemas de Reconocimiento Automático de Voz (ASR) en streaming. Compara hipótesis de inserción de puntuación con una línea base sin inserción, utilizando un lookahead limitado, y supera los métodos basados en prompt.

machine learning Natural Language Processing Automatic Speech Recognition

ARTICLEDEV.to AI·23/4/2026

How to Cross-Examination in a Click: Finding Inconsistencies Across Witness Statements

Este contenido describe cómo la IA puede automatizar la tarea compleja de encontrar inconsistencias en múltiples declaraciones de testigos para interrogatorios legales. El método implica pasar de la resumen de declaraciones individuales a un análisis comparativo unificado mediante la alineación de entidades y eventos.

AI applications Document analysis Natural Language Processing legal tech

DOCAWS Machine Learning Blog·hace 19d

Integrating AWS API MCP Server with Amazon Quick using Amazon Bedrock AgentCore Runtime

Esta publicación explica cómo integrar Amazon Quick con los servicios de AWS utilizando el soporte de Model Context Protocol (MCP) de Amazon Bedrock AgentCore Runtime. Demuestra la creación de un asistente de IA conversacional que traduce el lenguaje natural en comandos de AWS CLI, simplificando las operaciones.

integration Natural Language Processing Amazon Bedrock AWS

RESEARCHarXiv CS.AI·15/4/2026

Narrative-Driven Paper-to-Slide Generation via ArcDeck

ArcDeck es un framework de IA multiagente que genera diapositivas a partir de artículos académicos, modelando explícitamente el flujo lógico y la estructura narrativa del texto. Utiliza un árbol de discurso y un proceso de refinamiento iterativo basado en agentes para asegurar la coherencia, demostrando mejoras significativas en las presentaciones generadas.

paper-to-slide generation Natural Language Processing academic presentations AI

RESEARCHarXiv CS.CL·23/4/2026

OThink-SRR1: Search, Refine and Reasoning with Reinforced Learning for Large Language Models

OThink-SRR1 es un marco que mejora los LLMs con un proceso iterativo de Búsqueda-Refinamiento-Razonamiento entrenado mediante aprendizaje por refuerzo. Aborda los desafíos de RAG destilando hechos relevantes de documentos recuperados, mejorando la eficiencia y precisión en QA multi-salto complejo.

multi-hop-qa LLMs reinforcement learning RAG

RESEARCHarXiv CS.CL·hace 19d

Long-Context Reasoning Through Proxy-Based Chain-of-Thought Tuning

Los grandes modelos de lenguaje tienen un rendimiento deficiente en tareas de razonamiento de contexto largo a pesar de admitir entradas extensas. ProxyCoT propone una nueva estructura de entrenamiento que transfiere las capacidades de razonamiento de contextos proxy cortos a contextos largos completos, superando a los modelos base.

machine learning Natural Language Processing Reasoning large language models

RESEARCHarXiv CS.CL·hace 6d

Fixing FOLIO and MALLS: Verified Annotations and an LLM-assisted Framework to Focus Human Relabeling

Una inspección sistemática de las divisiones de validación de extsf{FOLIO} y extsf{MALLS} reveló altas tasas de formalizaciones FOL incorrectas y oraciones NL ambiguas, distorsionando la evaluación de modelos de IA. Los autores desarrollaron y publicaron verdades fundamentales corregidas para estos conjuntos de datos, demostrando cómo los errores de anotación impactan la evaluación de LLMs de última generación.

LLMs Neurosymbolic AI Natural Language Processing Benchmarks

ARTICLEDEV.to AI·hace 15d

Origin Part 12: The Adapter

Este artículo describe un problema encontrado al implementar un nuevo codificador de IA que, a pesar de mejorar significativamente la identificación de conceptos, estropeó todas las respuestas. Detalla el papel del "Dispatcher" en el sistema Origin, que actúa como intermediario entre el codificador y la respuesta, procesando las activaciones de conceptos para determinar las acciones adecuadas.

Natural Language Processing Debugging system architecture AI development

DOCDEV.to AI·hace 5d

Cignara

Cignara es una plataforma basada en la nube y potenciada por IA, diseñada para optimizar el análisis de datos, la automatización y la toma de decisiones, utilizando ML y PNL. Su arquitectura presenta infraestructura de nube, una capa de procesamiento de datos y un motor de IA/ML con modelos de PNL y análisis predictivo.

cloud computing machine learning AI platform Natural Language Processing

RESEARCHarXiv CS.CL·1/5/2026

Targeted Linguistic Analysis of Sign Language Models with Minimal Translation Pairs

El artículo presenta ASL-MTP, un nuevo conjunto de datos de referencia para analizar cómo los modelos de lengua de señas capturan fenómenos lingüísticos y utilizan múltiples articuladores. Este dataset se emplea para un análisis lingüístico dirigido de un modelo de traducción ASL-a-inglés de última generación.

machine learning Sign Language AI Benchmarking Natural Language Processing

RESEARCHarXiv CS.CL·hace 22d

Greedy or not, here I come: Language production under vocabulary constraints in humans and resource-rational models

Esta investigación explora cómo los humanos se comunican con vocabularios limitados, comparando sus estrategias con algoritmos de muestreo computacional impulsados por grandes modelos de lenguaje. El estudio revela que la producción del lenguaje humano bajo restricciones a menudo refleja el muestreo codicioso, aunque los individuos más hábiles muestran comportamientos de revisión no codiciosos.

cognitive science human behavior language production Natural Language Processing

RESEARCHarXiv CS.CL·hace 22d

Fluency and Faithfulness in Human and Machine Literary Translation

Esta investigación examina el equilibrio entre fluidez y fidelidad en la traducción literaria, comparando traducciones humanas, de Google Translate y TranslateGemma de 106 novelas en 16 idiomas. Los hallazgos muestran una correlación negativa constante entre fluidez y fidelidad, y sugieren que la longitud del segmento es importante para la evaluación automática.

Literary Translation Translation Evaluation Natural Language Processing machine translation

RESEARCHarXiv CS.CL·hace 15d

Learnability-Informed Fine-Tuning of Diffusion Language Models

Esta investigación introduce LIFT, un algoritmo de ajuste fino informado por la "learnability" (capacidad de aprendizaje), diseñado para mejorar las capacidades de razonamiento de los modelos de lenguaje de difusión. LIFT aborda las deficiencias del SFT estándar aprendiendo tokens de forma adaptativa según su dificultad y el contexto disponible en diferentes pasos de tiempo de difusión, mostrando un rendimiento mejorado.

Diffusion Models learning machine learning Natural Language Processing

RESEARCHarXiv CS.AI·hace 5d

SMAC-Talk: A Natural Language Extension of the StarCraft Multi-Agent Challenge for Large Language Models

Este artículo presenta SMAC-Talk, una extensión del StarCraft Multi-Agent Challenge, para evaluar agentes basados en LLM en entornos cooperativos multiagente. Incluye un canal de comunicación en lenguaje natural para investigar la coordinación y la confianza de los agentes, así como escenarios con comunicadores engañosos.

LLMs Natural Language Processing StarCraft multi-agent systems

ARTICLEDEV.to AI·1/5/2026

From Mumbles to Memos: Teaching AI to Decipher Technician Voice Notes

Este artículo aborda el cuello de botella de productividad causado por el descifrado manual de notas de voz de técnicos, proponiendo la IA como solución para transformar las grabaciones de campo en resúmenes profesionales. Describe una metodología, el 'Actionable Framework: The 3-Part Jargon List', para entrenar a la IA a categorizar información específica de audios no estructurados.

workflow automation AI training productivity Natural Language Processing

RESEARCHarXiv CS.AI·6/4/2026

Competency Questions as Executable Plans: a Controlled RAG Architecture for Cultural Heritage Storytelling

Este conteúdo apresenta uma arquitetura RAG (Retrieval Augmented Generation) controlada que utiliza perguntas de competência como planos executáveis. O objetivo é aplicar essa metodologia para a criação de narrativas no campo do patrimônio cultural.

cultural heritage storytelling Natural Language Processing AI