NLP

124 items

RESEARCHarXiv CS.AI·hace 11d

Frontier LLM-based agents can overcome the ontology curation bottleneck for natural phenotypes

Agentes basados en LLM de vanguardia pueden superar el cuello de botella en la curación de ontologías para fenotipos naturales, un proceso que consume mucho tiempo y depende de expertos humanos. Esto escalará la anotación de descripciones de fenotipos de texto libre a términos de ontología, crucial para la integración de datos morfológicos comparativos.

Phenotype Annotation NLP Research Methods LLM

RESEARCHarXiv CS.CL·hace 18d

Does Slightly Mean Somewhat? Measuring Vague Intensity Words in LLM Numeric Actions

Este estudio investiga cómo los grandes modelos de lenguaje (LLMs), específicamente Claude Haiku, interpretan palabras de intensidad vagas al producir acciones numéricas. La investigación revela que el modelo comprime 10 palabras de intensidad en 5 salidas medianas distintas y está influenciado por el estado actual del sistema.

LLMs language interpretation numeric actions NLP

RESEARCHarXiv CS.CL·hace 13d

In-Context Optimization for Retrieval-Augmented Generation: A Gradient-Descent Perspective

Este trabajo de investigación explora la Generación Aumentada por Recuperación (RAG) desde la perspectiva de la optimización en contexto. Demuestra que una sola capa de autoatención lineal puede ejecutar un paso de descenso de gradiente en un objetivo RAG linealizado unificado, revelando un régimen exacto donde la predicción aumentada por recuperación y la optimización en contexto coinciden.

Optimization RAG machine learning NLP

ARTICLEDEV.to AI·10/4/2026

Neural Machine Translation and Sequence-to-sequence Models: A Tutorial

Este tutorial aborda a tradução automática neural e os modelos sequência a sequência, explorando seus fundamentos e aplicações essenciais no campo da inteligência artificial.

Neural Machine Translation deep learning Sequence-to-sequence Models NLP

ARTICLEDEV.to AI·20/4/2026

Chatbot ไทยประมวลผลภาษาไร้เว้นวรรคได้อย่างไร

Este artículo explora por qué los chatbots en tailandés a menudo fallan debido a la falta de separación clara de palabras en el idioma y cómo construir bots más inteligentes. Detalla los principios y pasos para un procesamiento eficiente del idioma tailandés, destacando soluciones como la arquitectura DIET de Rasa y el tokenizador newmm de PyThaiNLP.

Thai language NLP Chatbot AI development

ARTICLEDEV.to AI·hace 11d

The Real Work in Graph RAG Is Not Extraction

El verdadero desafío en Graph RAG no es la extracción de datos, sino la normalización para garantizar la navegabilidad del grafo. El autor descubrió esto al construir un grafo de conocimiento para 2asy.ai, donde la inconsistencia en la denominación de entidades y tipos de relación hacía que el grafo fuera inútil a pesar de una extracción exitosa.

Graph RAG Knowledge Graphs NLP AI pipelines

ARTICLEDEV.to AI·10/5/2026

How AI-pilled are you?

El producto "How AI-pilled are you?" es una aplicación web que utiliza PNL y ML para evaluar el conocimiento de IA de un individuo. Este análisis técnico describe la arquitectura de la aplicación, que incluye un front-end para la interacción del usuario y un back-end para el procesamiento de datos y tareas de PNL.

Web Architecture machine learning NLP AI

RESEARCHDEV.to AI·12/4/2026

LightLDA: Big Topic Models on Modest Compute Clusters

LightLDA es un algoritmo innovador para construir grandes modelos de tópicos de manera eficiente, incluso en clusters de computación modestos. Optimiza la escalabilidad y el procesamiento de grandes volúmenes de datos, haciendo que el modelado de tópicos avanzado sea más accesible.

Scalability Topic Modeling distributed computing NLP

DOCKDNuggets·hace 11d

Practical NLP in the Browser with Transformers.js

Este tutorial demuestra tareas prácticas de Procesamiento del Lenguaje Natural, como clasificación de texto y respuesta a preguntas, directamente en el navegador utilizando la API pipeline() de la biblioteca Transformers.js.

learning NLP Transformers.js text classification

Practical NLP in the Browser with Transformers.js

ARTICLEDEV.to AI·11/4/2026

Real or Fake? Learning to Discriminate Machine from Human Generated Text

Este conteúdo aborda o desafio de distinguir textos gerados por máquinas daqueles escritos por humanos. O artigo foca em métodos e aprendizados para identificar a autenticidade da autoria textual.

Autenticidade de Texto Geração de Texto NLP Detecção de IA

ARTICLEDEV.to AI·8/4/2026

Building Your Own "Google Maps for Codebases": A Guide to Semantic Code Search with LLMs

O artigo aborda o desafio da busca por palavras-chave em grandes bases de código e propõe a busca de código semântica, alimentada por LLMs, como solução. O objetivo é criar um sistema que permita perguntas em linguagem natural para encontrar código relevante, funcionando como um 'Google Maps para bases de código'.

code search LLMs software development NLP

ARTICLEDEV.to AI·13/4/2026

Understanding Transformers Part 6: Calculating Similarity Between Queries and Keys

Este artículo detalla el cálculo de la similitud entre consultas (queries) y claves (keys) en Transformers utilizando el producto escalar, ilustrando cómo la similitud de una palabra consigo misma es mayor que con otras. Explica que estas puntuaciones se transforman luego en pesos significativos mediante una función softmax.

machine learning Dot Product NLP AI

RESEARCHarXiv CS.CL·30/4/2026

Evaluation Revisited: A Taxonomy of Evaluation Concerns in Natural Language Processing

Impulsado por los avances recientes en LLMs, este trabajo realiza una revisión exploratoria de la larga historia de reflexión metodológica en PNL sobre las preocupaciones de evaluación. Desarrolla una taxonomía, sintetizando posiciones y compensaciones recurrentes, y ofrece una lista de verificación estructurada para apoyar un diseño e interpretación de evaluación más deliberados.

LLMs evaluation NLP

RESEARCHarXiv CS.LG·6/5/2026

On the Invariants of Softmax Attention

Esta investigación define el "campo de energía" en la atención softmax, revelando propiedades invariantes esenciales. Diferencia los invariantes a nivel de mecanismo, derivados de la estructura algebraica, de las regularidades a nivel de modelo observadas en modelos de lenguaje autorregresivos.

neural networks softmax machine learning NLP

RESEARCHarXiv CS.CL·8/4/2026

The Illusion of Latent Generalization: Bi-directionality and the Reversal Curse

Este artigo aborda a 'maldição da reversão' em modelos de linguagem autorregressivos, onde falham ao recuperar fatos em ordem inversa. A pesquisa demonstra que a precisão da reversão exige um sinal de treinamento que torne a entidade de origem um alvo de previsão, indicando armazenamento separado para direções diretas e inversas, em vez de uma representação única e agnóstica à direção.

LLMs NLP bidirectional models representation learning

RESEARCHarXiv CS.CL·6/4/2026

Skeleton-based Coherence Modeling in Narratives

Este artigo explora a modelagem de coerência em texto utilizando redes neurais e a extração de "skeletons" para geração de narrativas. Propõe uma nova Rede de Similaridade Sentença/Skeleton (SSN) que supera técnicas de similaridade básicas, mas conclui que modelos em nível de sentença ainda são mais eficazes na avaliação textual.

neural networks narrative generation coherence modeling NLP

RESEARCHarXiv CS.CL·6/4/2026

Speaking of Language: Reflections on Metalanguage Research in NLP

Este trabalho define metalinguagem e explora sua conexão com PNL e LLMs, discutindo esforços de pesquisa e dimensões de tarefas metalinguísticas. Propõe ainda uma lista de futuras direções de pesquisa pouco estudadas.

LLMs research Metalanguage NLP

RESEARCHarXiv CS.CL·6/4/2026

An Empirical Study of Many-Shot In-Context Learning for Machine Translation of Low-Resource Languages

Este estudo empírico investiga o aprendizado em contexto (ICL) de muitos exemplos para tradução automática de inglês para dez idiomas de baixo recurso. Os achados mostram que o ICL se torna mais eficaz com o aumento do número de exemplos, e a recuperação baseada em BM25 melhora substancialmente a eficiência dos dados.

LLMs Many-Shot Learning NLP machine translation

RESEARCHarXiv CS.CL·6/5/2026

Semantically Enriching Investor Micro-blogs for Opinion-Aware Emotion Analysis: A Practical Approach

Esta investigación propone enriquecer semánticamente los microblogs de inversores para mejorar el análisis de emociones consciente de las opiniones. Aumenta el conjunto de datos StockEmotions con gráficos de opinión granulares utilizando una pipeline LLM y demuestra un rendimiento de clasificación mejorado con Redes Neuronales Gráficas.

Emotion Analysis Graph Neural Networks NLP sentiment analysis

RESEARCHarXiv CS.CL·6/5/2026

Effective Performance Measurement: Challenges and Opportunities in KPI Extraction from Earnings Calls

Este artículo de investigación explora los desafíos en la extracción de KPI de llamadas de ganancias no estructuradas, en contraste con los archivos templados de la SEC. Presenta tres nuevos benchmarks (SECB, ECB y ECB-A) para evaluar modelos, encontrando que los modelos basados en codificadores tienen dificultades con el cambio de dominio.

Finance Information Extraction Benchmarking NLP