Natural Language Processing

168 items

RESEARCHarXiv CS.CL·hace 8d

CSRP: Chain-of-Thought Reasoning for Chinese Text Correction via Reinforcement Learning with Efficiency-Aware Rewards

Este artículo propone CSRP, un marco de tres etapas para la corrección de errores gramaticales chinos (CGEC) utilizando Grandes Modelos de Lenguaje (LLMs). CSRP aborda los desafíos de los modelos de propósito general y la optimización de métricas con preentrenamiento continuo, SFT Chain-of-Thought y optimización de políticas con recompensas conscientes de la eficiencia que penalizan ediciones innecesarias, logrando un rendimiento de vanguardia en el benchmark NACGEC.

reinforcement learning Grammar Correction Natural Language Processing AI Research

RESEARCHarXiv CS.CL·hace 8d

lmfaoooo at SemEval-2026 Task 1: Humor Is an Audience. Preference Modeling for Constrained Humor Generation

Este artículo describe un sistema para la Tarea-1 de SemEval-2026, que se centra en la generación de humor bajo restricciones explícitas. El enfoque utiliza una estrategia de

evaluation Natural Language Processing humor generation AI Research

RESEARCHarXiv CS.AI·hace 29d

SkillLens: Adaptive Multi-Granularity Skill Reuse for Cost-Efficient LLM Agents

SkillLens es un marco jerárquico de evolución de habilidades para agentes LLM que organiza y reutiliza habilidades con granularidad mixta. Esto permite a los agentes reutilizar directamente sub-habilidades compatibles y adaptar solo las partes localmente incompatibles, optimizando costos y relevancia.

Skill reuse LLM Agents AI frameworks Natural Language Processing

RESEARCHarXiv CS.CL·hace 26d

Merging Methods for Multilingual Knowledge Editing for Large Language Models: An Empirical Odyssey

Este artículo investiga la eficacia de los métodos de fusión de vectores para la edición de conocimiento multilingüe (MKE) en Grandes Modelos de Lenguaje, centrándose en reducir la interferencia entre ediciones específicas de idiomas. Evaluando seis variantes de fusión con dos LLM, dos métodos de edición y 12 idiomas en el benchmark MzsRE, encuentra que la suma vectorial con covarianza compartida es la estrategia más fiable.

multilingual LLMs Natural Language Processing Vector Merging Knowledge Editing

RESEARCHarXiv CS.CL·hace 27d

TimelineReasoner: Advancing Timeline Summarization with Large Reasoning Models

TimelineReasoner es un nuevo marco que utiliza Grandes Modelos de Razonamiento (LRMs) para mejorar la creación de resúmenes de líneas de tiempo, yendo más allá de la generación pasiva de Modelos de Lenguaje Grande (LLMs). Propone un proceso activo de dos etapas, Cognición Global y Exploración Detallada, para extraer y refinar líneas de tiempo estructuradas de noticias online.

timeline-summarization Natural Language Processing Reasoning large language models

RESEARCHarXiv CS.CL·hace 23d

DiscoExplorer: An Open Interface for the Study of Multilingual Discourse Relations

DiscoExplorer introduce una interfaz web de código abierto para facilitar el estudio y la comparación interlingüística de las relaciones de discurso en 16 idiomas. Esta herramienta aborda la complejidad de los datos relevantes y la falta de interfaces accesibles en lingüística computacional, proporcionando funciones de consulta, búsqueda y visualización.

Discourse Relations Open Source Natural Language Processing Computational Linguistics

RESEARCHarXiv CS.AI·hace 27d

State-Centric Decision Process

El Proceso de Decisión Centrado en el Estado (SDP) es un nuevo marco que aborda la falta de estructura de tiempo de ejecución en entornos de lenguaje, como navegadores web, que emiten texto sin procesar en lugar de estados. Permite a un agente construir entradas MDP faltantes, como el espacio de estados y transiciones certificadas, tomando acciones y verificando observaciones contra predicados en lenguaje natural.

Decision Processes reinforcement learning Natural Language Processing AI agents

RESEARCHarXiv CS.CL·hace 19d

Residual Skill Optimization for Text-to-SQL Ensembles

DivSkill-SQL introduce un marco de optimización de habilidades residuales para construir conjuntos Text-to-SQL complementarios, mejorando la precisión al dirigirse a las contribuciones marginales a Pass@K. Logra ganancias significativas de precisión en Spider2-Lite para Snowflake y BigQuery sobre las bases de referencia de conjuntos existentes.

ensemble methods Text-to-SQL machine learning Natural Language Processing

RESEARCHarXiv CS.CL·hace 7d

IdiomX A Multilingual Benchmark for Idiom Understanding, Retrieval, and Interpretation

IdiomX es un benchmark multilingüe a gran escala introducido para abordar los desafíos de las expresiones idiomáticas en el procesamiento del lenguaje natural. Contiene más de 190 mil ejemplos contextualizados que abarcan más de 12 mil modismos con representaciones semánticas alineadas en inglés, árabe y francés.

language models Natural Language Processing datasets Benchmarks

RESEARCHarXiv CS.CL·hace 15d

Raon-Speech Technical Report

Raon-Speech es un modelo de lenguaje de voz de 9 mil millones de parámetros de alto rendimiento para la comprensión, respuesta y generación de voz en inglés y coreano, logrando excelentes resultados en 42 benchmarks. Transforma con éxito un LLM pre-entrenado en un SpeechLM, manteniendo sólidas capacidades de texto a través de etapas de entrenamiento específicas.

multimodal AI Benchmarking Natural Language Processing large language models

RESEARCHarXiv CS.CL·hace 16d

Knowledge Distillation for Low-Resource Open-source Text-to-SQL Model

Este artículo propone un marco Text-to-SQL consciente del conocimiento para convertir preguntas en lenguaje natural en consultas SQL ejecutables, incluso en entornos de bajos recursos. Aborda desafíos como la escasez de datos anotados y las definiciones de esquemas opacos, inyectando conocimiento específico de la tarea en el entrenamiento y la inferencia.

Knowledge Distillation Text-to-SQL Low-Resource AI Natural Language Processing

RESEARCHarXiv CS.AI·hace 16d

PathCal: State-Aware Reflection-Marker Calibration for Efficient Reasoning

Este artículo de investigación presenta 'PathCal', que investiga los distintos roles funcionales y el momento de los marcadores de reflexión en las trayectorias de Chain-of-Thought de los Large Reasoning Language Models. Revela que marcadores como 'wait' o 'but' difieren significativamente en su impacto en la precisión y la longitud de la generación, desafiando enfoques anteriores.

Natural Language Processing Chain-of-Thought Reasoning large language models

RESEARCHarXiv CS.CL·hace 16d

Query-Adaptive Semantic Chunking for Retrieval-Augmented Generation: A Dynamic Strategy with Contextual Window Expansion

Este artículo presenta el Query-Adaptive Semantic Chunking (QASC), una estrategia dinámica para sistemas de Generación Aumentada por Recuperación (RAG) que integra consultas de usuario en la segmentación de documentos. QASC utiliza la puntuación de similitud de coseno, la expansión de ventanas contextuales y la agregación de puntuaciones a nivel de fragmento para optimizar la recuperación de contexto, superando las limitaciones de los métodos de fragmentación fija.

RAG Natural Language Processing Information Retrieval Semantic Chunking

RESEARCHarXiv CS.CL·hace 7d

Linear Probes Detect Task Format, Not Reasoning Mode in Language Model Hidden States

Este artículo revela que las sondas lineales, a menudo utilizadas para identificar representaciones de razonamiento distintas en estados ocultos de LLMs, en realidad detectan el formato de la tarea en lugar de los modos de razonamiento. La alta precisión observada en benchmarks con Qwen3-14B desapareció al controlar las variables de formato, sugiriendo un razonamiento en gran medida compartido no vinculado funcionalmente a la geometría del estado oculto.

Benchmarking Natural Language Processing Model Analysis AI Research

RESEARCHarXiv CS.CL·hace 9d

When English Rewrites Local Knowledge: Global Narrative Dominance in Large Language Models

Este artículo de investigación explora la dominancia narrativa global en Modelos de Lenguaje Grandes (LLMs), donde el conocimiento cultural local a menudo es eclipsado por narrativas globales. Introduce el conjunto de datos CulturalNB para contextos culturales bengalíes y demuestra que las preguntas formuladas en inglés tienden a aumentar la sustitución global y el encuadre institucional, reduciendo la cobertura de la perspectiva local.

Dataset Cross-lingual Cultural Bias Natural Language Processing

RESEARCHarXiv CS.AI·hace 16d

NeuroNL2LTL: A Neurosymbolic Framework for Natural Language Translation of Linear Temporal Logic

NeuroNL2LTL es una arquitectura neurosimbólica que unifica la traducción aprendida con la verificación formal para convertir el lenguaje natural en Lógica Temporal Lineal. Utiliza un entrenamiento con verificador en el bucle, donde los resultados de la verificación sirven como señales de recompensa para el aprendizaje por refuerzo, optimizando la corrección formal.

reinforcement learning Neurosymbolic AI Formal verification Natural Language Processing

RESEARCHarXiv CS.CL·hace 7d

Translating Classical Poetry into Modern Prose

Se presenta Padyam2Gadyam, un conjunto de datos para la traducción de poesía a prosa del telugu clásico al telugu y inglés contemporáneo. La evaluación de cinco modelos de lenguaje grandes (LLMs) en esta tarea mostró que su rendimiento general aún necesita una mejora considerable.

poetry LLMs Translation Natural Language Processing

RESEARCHarXiv CS.AI·hace 13d

Soro: A Lightweight Foundation Model and Chatbot for Tajik

Soro es una familia de grandes modelos de lenguaje conversacionales (LLMs) especializados en tayiko, diseñados para su implementación en Tayikistán bajo estrictas limitaciones de cómputo. Desarrollado a partir de checkpoints de Gemma 3 y preentrenado con un corpus tayiko de 1.900 millones de tokens, supera a las bases de referencia en nuevos benchmarks específicos del tayiko.

Tajik Language Benchmarking Chatbot Natural Language Processing

ARTICLEDEV.to AI·hace 26d

Helping ChatGPT better recognize context in sensitive conversations

Este análisis técnico explora cómo mejorar la capacidad de ChatGPT para reconocer el contexto en conversaciones sensibles, fundamental para respuestas precisas y empáticas. Destaca las limitaciones actuales, como la falta de conocimiento específico del dominio y la comprensión insuficiente de los matices, buscando soluciones técnicas para estos desafíos.

Contextual Understanding ChatGPT machine learning Natural Language Processing

DOCDEV.to AI·26/4/2026

GPT-5.5 System Card

La GPT-5.5 System Card de OpenAI describe un modelo de lenguaje basado en transformadores, que se basa en GPT-3 con enfoque en escalado y ajuste fino. Su arquitectura es principalmente solo decodificador y utiliza mecanismos de autoatención y redes feed-forward.

AI architecture Natural Language Processing large language models