Natural Language Processing

168 items

RESEARCHarXiv CS.CL·20/4/2026

DALM: A Domain-Algebraic Language Model via Three-Phase Structured Generation

Se propone DALM (Domain-Algebraic Language Model) para abordar la interferencia de conocimiento en los LLM, reemplazando la generación no restringida de tokens con un denoising estructurado sobre una celosía de dominios. Sigue un camino de generación de tres fases (incertidumbre de dominio, relación y concepto) bajo restricciones algebraicas, evitando la contaminación entre dominios.

language models machine learning Natural Language Processing AI Research

RESEARCHarXiv CS.CL·17/4/2026

Hierarchical Retrieval Augmented Generation for Adversarial Technique Annotation in Cyber Threat Intelligence Text

Este artículo introduce H-TechniqueRAG, un novedoso marco de Generación Aumentada por Recuperación (RAG) jerárquico para la anotación de técnicas adversarias en texto de Inteligencia de Amenazas Cibernéticas (CTI). Aborda la limitación de los enfoques RAG planos al incorporar la taxonomía inherente táctica-técnica del MITRE ATT&CK mediante un mecanismo de recuperación de dos etapas.

cybersecurity RAG Natural Language Processing MITRE ATT&CK

RESEARCHarXiv CS.CL·22/4/2026

Syntax as a Rosetta Stone: Universal Dependencies for In-Context Coptic Translation

Este artículo presenta un enfoque novedoso de aprendizaje en contexto para la traducción automática de copto a inglés de bajos recursos, aumentando las entradas con información sintáctica de análisis de Dependencias Universales. Aunque la información sintáctica por sí sola es menos útil que los glosarios basados en diccionarios, su combinación mejora significativamente el rendimiento y logra resultados de vanguardia.

universal-dependencies Natural Language Processing machine translation in-context learning

RESEARCHarXiv CS.CL·22/4/2026

Probing for Reading Times

Esta investigación explora las representaciones de modelos de lenguaje para los tiempos de lectura humanos en cinco idiomas, comparándolas con predictores escalares. Se encuentra que las capas tempranas de los modelos superan a la sorpresa en la predicción de medidas de lectura de primera pasada, sugiriendo una alineación funcional entre la profundidad del modelo y las etapas temporales de la lectura humana.

language models human-computer interaction cognitive science Natural Language Processing

RESEARCHDEV.to AI·21/4/2026

Improving Video-Text Retrieval by Multi-Stream Corpus Alignment and Dual SoftmaxLoss

Esta investigación propone un método novedoso para mejorar la recuperación de video-texto mediante la integración de la alineación de corpus multi-stream. También introduce una función Dual SoftmaxLoss para mejorar aún más la precisión y eficiencia de la coincidencia entre el contenido de video y las descripciones textuales.

machine learning computer vision Natural Language Processing Information Retrieval

DOCDEV.to AI·hace 6d

Email Spam Classifier with Streamlit and Docker

Esta guía detalla un pipeline completo de Machine Learning para la clasificación de spam en correos electrónicos. Compara modelos Naive Bayes y RoBERTa, visualiza con Streamlit e implementa usando Docker.

Docker Streamlit machine learning Natural Language Processing

NEWSDEV.to AI·hace 29d

We gave actual claws to Openclaw agent and it flies a drone now

Un agente Openclaw, que se volvió viral por controlar un dron con un mensaje en lenguaje natural, ahora puede pilotar drones de forma autónoma a través de Mavlink en Dimensional. Este desarrollo de código abierto permite al agente gestionar la percepción, el seguimiento y el control de vuelo a partir de una única consulta.

Open Source Autonomous systems Natural Language Processing robotics

RESEARCHarXiv CS.CL·13/4/2026

Uncertainty Estimation for the Open-Set Text Classification systems

Este artículo se centra en la estimación precisa de la incertidumbre para sistemas de clasificación de texto de conjunto abierto (OSTC), donde las muestras de texto pueden clasificarse en clases existentes o rechazarse como desconocidas. Adapta el método Holistic Uncertainty Estimation (HolUE) para el dominio del texto con el fin de capturar las incertidumbres del texto y de la galería, y propone un nuevo benchmark de OSTC.

machine learning Natural Language Processing trustworthy AI Uncertainty Estimation

RESEARCHarXiv CS.AI·hace 29d

More Thinking, More Bias: Length-Driven Position Bias in Reasoning Models

Una nueva investigación revela que el sesgo de posición en modelos de razonamiento, como Chain-of-thought, escala con la longitud de la trayectoria de razonamiento. Este efecto se observó en múltiples configuraciones de modelos y benchmarks, sugiriendo que "pensar más" puede exacerbar ciertos sesgos.

AI bias Natural Language Processing reasoning models Machine learning research

RESEARCHarXiv CS.CL·hace 21d

SKG-Eval: Stateful Evaluation of Multi-Turn Dialogue via Incremental Semantic Knowledge Graphs

SKG-Eval aborda el desafío de evaluar sistemas de diálogo multi-turno modelando el diálogo como un Grafo de Conocimiento Semántico (SKG) en evolución. Este framework actualiza incrementalmente el grafo mediante la extracción estructurada de tríos para detectar problemas de largo alcance como contradicción e inconsistencia, ofreciendo una evaluación mejorada más allá de las representaciones aisladas por turno.

Knowledge Graphs Natural Language Processing Evaluation Metrics dialogue systems

RESEARCHarXiv CS.CL·hace 7d

Cognitive-Linguistic Indicators of Depression in Online Communities: Analysed by DistilBERT and Holographic Reduced Representation

Este artículo investiga si la combinación de características lingüísticas con base cognitiva con embeddings basados en transformadores mejora la detección automatizada de depresión en texto en línea. El estudio compara un modelo de referencia TF-IDF con un modelo híbrido DistilBERT HRR, demostrando que este último logra una puntuación F1 macro significativamente superior de 0.94.

online-communities depression detection machine learning Natural Language Processing

ARTICLEDEV.to AI·7/5/2026

The Transformer: The Architecture Behind Modern AI

La arquitectura Transformer, introducida por Vaswani en 2017, marcó un cambio fundamental en la IA, pasando del procesamiento secuencial a la comprensión paralela mediante su mecanismo de atención. Esta innovación permite a los modelos procesar significado y contexto simultáneamente, similar a pensar directamente en un idioma.

AI architecture Attention Mechanism Transformer machine learning

RESEARCHDEV.to AI·hace 25d

A Survey on Gender Bias in Natural Language Processing

Una encuesta sobre el sesgo de género en el Procesamiento del Lenguaje Natural analiza cómo los estereotipos de género se perpetúan en los modelos de IA. El estudio discute métodos para mitigar estos sesgos y explora los desafíos en la creación de sistemas de PNL más equitativos.

AI bias Natural Language Processing AI ethics gender bias

ARTICLEDEV.to AI·hace 23d

Understanding How ChatGPT Generates Images: A Deep Dive into AI Creativity

Este artículo explora cómo ChatGPT contribuye a la generación de imágenes, las tecnologías subyacentes y las implicaciones para desarrolladores, artistas y empresas. La capacidad de crear imágenes a partir de descripciones textuales agiliza los procesos y democratiza el arte, mejorando la productividad.

AI Creativity ChatGPT image generation Natural Language Processing

RESEARCHDEV.to AI·1/5/2026

Deep Dyna-Q: Integrating Planning for Task-Completion Dialogue Policy Learning

Este contenido trata sobre Deep Dyna-Q, un enfoque que integra la planificación para el aprendizaje de políticas de diálogo en sistemas conversacionales de IA. El objetivo es optimizar el proceso de completar tareas a través de la interacción dialogada con la IA.

reinforcement learning Natural Language Processing AI algorithms dialogue systems

RESEARCHDEV.to AI·27/4/2026

Using WordNet to Complement Training Information in Text Categorization

Este contenido trata sobre la aplicación de WordNet para complementar la información de entrenamiento en la categorización de textos. Se centra en aprovechar la información semántica de WordNet para mejorar el rendimiento y la precisión de los modelos de clasificación de texto.

Text Categorization machine learning Natural Language Processing WordNet

RESEARCHDEV.to AI·hace 26d

Generative Simulation Benchmarking for heritage language revitalization programs for extreme data sparsity scenarios

El texto aborda el desafío de construir modelos de lenguaje para lenguas patrimoniales en peligro crítico con escasez extrema de datos. El autor relata su experiencia personal con un conjunto de datos minúsculo para una lengua como el Halkomelem, subrayando la necesidad de enfoques novedosos para tales escenarios.

language models Natural Language Processing Data Sparsity endangered languages

CASEAWS Machine Learning Blog·hace 12d

Training Azerbaijani language models on Amazon SageMaker AI

Azercell Telecom se asoció con el AWS Generative AI Innovation Center para desarrollar un modelo de lenguaje grande (LLM) en azerí en Amazon SageMaker AI. Esta colaboración de seis semanas estableció un marco listo para producción para casos de uso de telecomunicaciones y un chatbot, superando los desafíos de escasez de datos y complejidad lingüística.

Telecommunications Natural Language Processing Amazon SageMaker Generative AI

RESEARCHDEV.to AI·25/4/2026

JSUT corpus: free large-scale Japanese speech corpus for end-to-end speechsynthesis

El corpus JSUT es un conjunto de datos de voz japonés gratuito y a gran escala, diseñado para la investigación en síntesis de voz de extremo a extremo. Proporciona recursos valiosos para el desarrollo de modelos avanzados de IA en tecnología de voz para el idioma japonés.

japanese language speech synthesis machine learning Natural Language Processing

NEWSDEV.to AI·19/4/2026

Claude Code's Playwright MCP Server: Generate Web Tests from Natural Language

Claude Code ahora se integra con Playwright a través de un servidor MCP dedicado, permitiendo generar automatización de pruebas completa a partir de indicaciones en lenguaje natural. Este puente directo permite a los desarrolladores describir escenarios de prueba, que Claude escriba y ejecute código Playwright, e informe los resultados, todo dentro de la terminal.

Claude Code Natural Language Processing Playwright AI