← heapsort-ai

Natural Language Processing

168 items

RESEARCHarXiv CS.CL·20/4/2026

DALM: A Domain-Algebraic Language Model via Three-Phase Structured Generation

Se propone DALM (Domain-Algebraic Language Model) para abordar la interferencia de conocimiento en los LLM, reemplazando la generación no restringida de tokens con un denoising estructurado sobre una celosía de dominios. Sigue un camino de generación de tres fases (incertidumbre de dominio, relación y concepto) bajo restricciones algebraicas, evitando la contaminación entre dominios.

27
RESEARCHarXiv CS.CL·17/4/2026

Hierarchical Retrieval Augmented Generation for Adversarial Technique Annotation in Cyber Threat Intelligence Text

Este artículo introduce H-TechniqueRAG, un novedoso marco de Generación Aumentada por Recuperación (RAG) jerárquico para la anotación de técnicas adversarias en texto de Inteligencia de Amenazas Cibernéticas (CTI). Aborda la limitación de los enfoques RAG planos al incorporar la taxonomía inherente táctica-técnica del MITRE ATT&CK mediante un mecanismo de recuperación de dos etapas.

27
RESEARCHarXiv CS.CL·22/4/2026

Syntax as a Rosetta Stone: Universal Dependencies for In-Context Coptic Translation

Este artículo presenta un enfoque novedoso de aprendizaje en contexto para la traducción automática de copto a inglés de bajos recursos, aumentando las entradas con información sintáctica de análisis de Dependencias Universales. Aunque la información sintáctica por sí sola es menos útil que los glosarios basados en diccionarios, su combinación mejora significativamente el rendimiento y logra resultados de vanguardia.

27
RESEARCHarXiv CS.CL·22/4/2026

Probing for Reading Times

Esta investigación explora las representaciones de modelos de lenguaje para los tiempos de lectura humanos en cinco idiomas, comparándolas con predictores escalares. Se encuentra que las capas tempranas de los modelos superan a la sorpresa en la predicción de medidas de lectura de primera pasada, sugiriendo una alineación funcional entre la profundidad del modelo y las etapas temporales de la lectura humana.

27
RESEARCHDEV.to AI·21/4/2026

Improving Video-Text Retrieval by Multi-Stream Corpus Alignment and Dual SoftmaxLoss

Esta investigación propone un método novedoso para mejorar la recuperación de video-texto mediante la integración de la alineación de corpus multi-stream. También introduce una función Dual SoftmaxLoss para mejorar aún más la precisión y eficiencia de la coincidencia entre el contenido de video y las descripciones textuales.

27
RESEARCHarXiv CS.CL·13/4/2026

Uncertainty Estimation for the Open-Set Text Classification systems

Este artículo se centra en la estimación precisa de la incertidumbre para sistemas de clasificación de texto de conjunto abierto (OSTC), donde las muestras de texto pueden clasificarse en clases existentes o rechazarse como desconocidas. Adapta el método Holistic Uncertainty Estimation (HolUE) para el dominio del texto con el fin de capturar las incertidumbres del texto y de la galería, y propone un nuevo benchmark de OSTC.

27
RESEARCHarXiv CS.CL·hace 21d

SKG-Eval: Stateful Evaluation of Multi-Turn Dialogue via Incremental Semantic Knowledge Graphs

SKG-Eval aborda el desafío de evaluar sistemas de diálogo multi-turno modelando el diálogo como un Grafo de Conocimiento Semántico (SKG) en evolución. Este framework actualiza incrementalmente el grafo mediante la extracción estructurada de tríos para detectar problemas de largo alcance como contradicción e inconsistencia, ofreciendo una evaluación mejorada más allá de las representaciones aisladas por turno.

27
RESEARCHarXiv CS.CL·hace 7d

Cognitive-Linguistic Indicators of Depression in Online Communities: Analysed by DistilBERT and Holographic Reduced Representation

Este artículo investiga si la combinación de características lingüísticas con base cognitiva con embeddings basados en transformadores mejora la detección automatizada de depresión en texto en línea. El estudio compara un modelo de referencia TF-IDF con un modelo híbrido DistilBERT HRR, demostrando que este último logra una puntuación F1 macro significativamente superior de 0.94.

27
RESEARCHDEV.to AI·hace 26d

Generative Simulation Benchmarking for heritage language revitalization programs for extreme data sparsity scenarios

El texto aborda el desafío de construir modelos de lenguaje para lenguas patrimoniales en peligro crítico con escasez extrema de datos. El autor relata su experiencia personal con un conjunto de datos minúsculo para una lengua como el Halkomelem, subrayando la necesidad de enfoques novedosos para tales escenarios.

27
CASEAWS Machine Learning Blog·hace 12d

Training Azerbaijani language models on Amazon SageMaker AI

Azercell Telecom se asoció con el AWS Generative AI Innovation Center para desarrollar un modelo de lenguaje grande (LLM) en azerí en Amazon SageMaker AI. Esta colaboración de seis semanas estableció un marco listo para producción para casos de uso de telecomunicaciones y un chatbot, superando los desafíos de escasez de datos y complejidad lingüística.

27
NEWSDEV.to AI·19/4/2026

Claude Code's Playwright MCP Server: Generate Web Tests from Natural Language

Claude Code ahora se integra con Playwright a través de un servidor MCP dedicado, permitiendo generar automatización de pruebas completa a partir de indicaciones en lenguaje natural. Este puente directo permite a los desarrolladores describir escenarios de prueba, que Claude escriba y ejecute código Playwright, e informe los resultados, todo dentro de la terminal.

27