NLP

124 items

ARTICLEDEV.to AI·25/4/2026

The hidden engine behind the AI Revolution: The Transformer

El verdadero motor detrás de la revolución de la IA no es ChatGPT, sino la arquitectura Transformer, introducida por el artículo "Attention Is All You Need". Esta innovación permitió el procesamiento masivo paralelo del lenguaje, utilizando GPUs y cambiando fundamentalmente cómo las máquinas entienden el lenguaje.

AI history deep learning Transformer NLP

RESEARCHarXiv CS.AI·15/4/2026

GoodPoint: Learning Constructive Scientific Paper Feedback from Author Responses

Esta investigación presenta GoodPoint, un método que utiliza LLMs y respuestas de autores para generar retroalimentación constructiva para artículos científicos. Desarrolla GoodPoint-ICLR, un conjunto de datos de artículos ICLR, y una receta de entrenamiento que emplea fine-tuning y optimización de preferencias para una retroalimentación válida y accionable.

LLMs Feedback Generation machine learning NLP

RESEARCHarXiv CS.CL·22/4/2026

Scripts Through Time: A Survey of the Evolving Role of Transliteration in NLP

Este artículo examina el papel de la transliteración en PNL, una técnica clave para superar la "barrera de escritura" en la transferencia interlingüística. El estudio presenta una taxonomía de motivaciones y enfoques, analizando su evolución y necesidad en los LLM modernos en varios contextos beneficiosos.

Cross-lingual AI language models LLMs NLP

RESEARCHarXiv CS.CL·hace 29d

TajPersLexon: A Tajik-Persian Lexical Resource and Hybrid Model for Cross-Script Low-Resource NLP

Este trabajo introduce TajPersLexon, un recurso léxico paralelo tayiko-persa con 40.112 pares de palabras para PNL interescritura en entornos de bajos recursos. Evalúa modelos híbridos, neuronales y de recuperación, demostrando una alta precisión para las bases neuronales y de recuperación (98-99%) y un equilibrio favorable entre precisión y eficiencia para el modelo híbrido (96,4%) en la post-corrección de OCR.

Lexical resource Cross-script NLP Hybrid model

RESEARCHarXiv CS.CL·hace 22d

Why are language models less surprised than humans? Testing the Parse Multiplicity Mismatch Hypothesis

Este artículo investiga por qué los modelos de lenguaje muestran menos "sorpresa" que los humanos al procesar oraciones sintácticamente ambiguas. Prueba la hipótesis de que los LMs pueden considerar simultáneamente un mayor número de interpretaciones de oraciones utilizando Gramáticas de Red Neuronal Recurrente.

syntactic-ambiguity language models cognitive science NLP

RESEARCHarXiv CS.LG·21/4/2026

Annotation Entropy Predicts Per-Example Learning Dynamics in LoRA Fine-Tuning

Esta investigación descubre que el ajuste fino LoRA provoca 'desaprendizaje' en ejemplos controvertidos, donde una alta discrepancia de anotadores se correlaciona con un aumento de la pérdida durante el entrenamiento. Este patrón es distinto del ajuste fino completo y se observa consistentemente en varios modelos y conjuntos de datos.

model training machine learning NLP Fine-tuning

RESEARCHarXiv CS.CL·7/5/2026

The Impact of Vocabulary Overlaps on Knowledge Transfer in Multilingual Machine Translation

Este artículo investiga sistemáticamente el impacto de vocabularios conjuntos y disjuntos en la transferencia de conocimiento en la traducción automática neuronal multilingüe (MNMT). Los experimentos muestran que las amplias superposiciones de vocabulario, la relación lingüística y la coincidencia de dominio conducen a un mejor rendimiento, incluso en configuraciones fuera de dominio.

neural networks knowledge transfer NLP machine translation

RESEARCHarXiv CS.CL·hace 26d

Differences in Text Generated by Diffusion and Autoregressive Language Models

Esta investigación examina las diferencias inherentes en el texto generado por Modelos de Lenguaje de Difusión (DLM) y Modelos de Lenguaje Autorregresivos (ARM), encontrando que los DLM muestran menor entropía n-grama, pero mayor coherencia y diversidad semántica. Experimentos controlados indican que los objetivos de entrenamiento de los DLM contribuyen a la coherencia y diversidad semántica, mientras que los algoritmos de decodificación son responsables de la reducción de la entropía.

Diffusion Models language models NLP text generation

RESEARCHarXiv CS.CL·hace 6d

On the Persistent Effects of Lexicality in Large Language Mod

Este trabajo investiga el efecto persistente de la superposición léxica, en lugar del contenido semántico, en las representaciones extraídas de grandes modelos de lenguaje (LLMs) y sus implicaciones. Los autores encuentran que la influencia léxica se extiende a través de la profundidad de los modelos, arquitecturas y regímenes de entrenamiento, incluso en modelos entrenados para similitud semántica.

LLMs lexicality NLP semantic analysis

RESEARCHarXiv CS.CL·hace 13d

CroCo: Cross-Lingual Contrastive Preference Tuning on Self-Generations

Este trabajo presenta CroCo, un método de ajuste de preferencias contrastivas interlingües en autogeneraciones de LLMs, que demuestra una transferencia efectiva entre 14 idiomas sin anotaciones de preferencia específicas. Un modelo de recompensa entrenado en inglés produce clasificaciones útiles en la mayoría de los idiomas, mejorando los modelos existentes y previniendo el olvido catastrófico, siempre que se utilicen datos on-policy.

research machine learning NLP multilingual

RESEARCHarXiv CS.CL·hace 12d

BioELX: Cross-lingual Biomedical Entity Linking via Alias-based Retrieval and LLM Ranking

BioELX es un marco de enlace de entidades biomédicas translingües de dos etapas que no requiere datos de entrenamiento anotados específicos para la tarea. Mejora la recuperación de candidatos utilizando alias multilingües de Wikidata y realiza la desambiguación sensible al contexto con un clasificador LLM preentrenado.

Cross-lingual AI Entity Linking NLP Biomedical AI

DOCDEV.to AI·hace 16d

RAG 시스템 실전 구축 (v18)

Este documento detalla la implementación práctica de sistemas RAG (Retrieval-Augmented Generation), explicando sus conceptos fundamentales y el ciclo operativo. Cubre las etapas de recuperación, aumento y generación de contexto para mejorar las respuestas de los LLM, incluyendo la fragmentación semántica de documentos.

RAG NLP Information Retrieval Generative AI

ARTICLEDEV.to AI·24/4/2026

Layer Normalization — Deep Dive + Problem: Largest Connected Region

Este contenido ofrece una inmersión profunda en la Normalización de Capas, un componente crucial de la Arquitectura Transformer. Detalla su importancia para estabilizar el entrenamiento y mejorar el rendimiento de los Large Language Models (LLMs), originándose del artículo "Attention is All You Need".

Transformer Architecture LLMs deep learning NLP

ARTICLEDEV.to AI·hace 8d

AI debt sales reshape global corporate bond markets

La integración de la IA en la venta de deuda está preparada para alterar significativamente los mercados globales de bonos corporativos, impulsada por la capacidad de los sistemas de IA para analizar grandes volúmenes de datos y hacer predicciones precisas. Las plataformas de venta de deuda con IA utilizan algoritmos de aprendizaje automático y procesamiento de lenguaje natural para evaluar la solvencia e identificar riesgos y oportunidades.

Finance Debt Markets machine learning NLP

ARTICLEDEV.to AI·27/4/2026

Epismo Agent Package

El Análisis Técnico del Paquete de Agentes Epismo detalla una solución innovadora para crear humanos digitales impulsados por IA, destinados a servicio al cliente, entretenimiento y educación. Su arquitectura de microservicios integra procesamiento de lenguaje natural, aprendizaje automático y visión por computadora, gestionados por un Núcleo de Agente y un Grafo de Conocimiento.

digital humans computer vision NLP ML

RESEARCHarXiv CS.CL·21/4/2026

QU-NLP at QIAS 2026: Multi-Stage QLoRA Fine-Tuning for Arabic Islamic Inheritance Reasoning

El artículo presenta la estrategia de ajuste fino QLoRA multi-etapa de QU-NLP para el razonamiento de herencia islámica árabe, utilizando Qwen3-4B. El modelo logró una puntuación MIR-E del 90%, demostrando un rendimiento competitivo con recursos computacionales mínimos.

LLMs Legal AI Arabic AI NLP

DOCDEV.to AI·hace 20d

92. BERT: The Model That Reads in Both Directions

BERT se diferencia de GPT por su capacidad de lectura bidireccional, prediciendo palabras enmascaradas en lugar de secuenciales. Esta comprensión contextual completa lo convirtió en dominante en los benchmarks de PNL y una piedra angular para las tareas de comprensión. El contenido detalla los mecanismos de preentrenamiento y las técnicas de ajuste fino de BERT.

BERT GPT machine learning NLP

ARTICLEDEV.to AI·hace 26d

NLP Video Editing Copilot

Cutting Room AI es una aplicación de escritorio independiente para Windows que permite a los usuarios de DaVinci Resolve Studio controlar su línea de tiempo con lenguaje natural. Traduce comandos en inglés sencillo a llamadas de API de scripting, permitiendo a los usuarios modificar propiedades de clips y realizar operaciones de pista sin necesidad de conocimientos de scripting.

desktop app NLP DaVinci Resolve AI tools

DOCDEV.to AI·hace 26d

Spellar 3.0

Spellar 3.0 es una plataforma de aprendizaje de idiomas impulsada por IA que ofrece instrucción y retroalimentación personalizadas. Su arquitectura técnica incluye un frontend React, un backend Node.js con PostgreSQL y un motor de PNL capaz de analizar la entrada de usuario en varios idiomas.

gamification learning language learning AI platform

ARTICLEDEV.to AI·27/4/2026

Building Smart Fairness Analyzer: An AI-Powered Bias Detection App with MongoDB & NLP

Este proyecto presenta el Smart Fairness Analyzer, una plataforma desarrollada para detectar y auditar sesgos de género, raciales, de edad y socioeconómicos en las respuestas de la IA en tiempo real. La herramienta utiliza métricas académicas de equidad de ML y almacena registros completos de auditoría en MongoDB para su análisis.

ethics bias detection machine learning AI fairness