← heapsort-ai

NLP

124 items

RESEARCHarXiv CS.AI·hace 11d

Frontier LLM-based agents can overcome the ontology curation bottleneck for natural phenotypes

Agentes basados en LLM de vanguardia pueden superar el cuello de botella en la curación de ontologías para fenotipos naturales, un proceso que consume mucho tiempo y depende de expertos humanos. Esto escalará la anotación de descripciones de fenotipos de texto libre a términos de ontología, crucial para la integración de datos morfológicos comparativos.

27
RESEARCHarXiv CS.CL·hace 13d

In-Context Optimization for Retrieval-Augmented Generation: A Gradient-Descent Perspective

Este trabajo de investigación explora la Generación Aumentada por Recuperación (RAG) desde la perspectiva de la optimización en contexto. Demuestra que una sola capa de autoatención lineal puede ejecutar un paso de descenso de gradiente en un objetivo RAG linealizado unificado, revelando un régimen exacto donde la predicción aumentada por recuperación y la optimización en contexto coinciden.

27
ARTICLEDEV.to AI·20/4/2026

Chatbot ไทยประมวลผลภาษาไร้เว้นวรรคได้อย่างไร

Este artículo explora por qué los chatbots en tailandés a menudo fallan debido a la falta de separación clara de palabras en el idioma y cómo construir bots más inteligentes. Detalla los principios y pasos para un procesamiento eficiente del idioma tailandés, destacando soluciones como la arquitectura DIET de Rasa y el tokenizador newmm de PyThaiNLP.

27
ARTICLEDEV.to AI·hace 11d

The Real Work in Graph RAG Is Not Extraction

El verdadero desafío en Graph RAG no es la extracción de datos, sino la normalización para garantizar la navegabilidad del grafo. El autor descubrió esto al construir un grafo de conocimiento para 2asy.ai, donde la inconsistencia en la denominación de entidades y tipos de relación hacía que el grafo fuera inútil a pesar de una extracción exitosa.

27
ARTICLEDEV.to AI·10/5/2026

How AI-pilled are you?

El producto "How AI-pilled are you?" es una aplicación web que utiliza PNL y ML para evaluar el conocimiento de IA de un individuo. Este análisis técnico describe la arquitectura de la aplicación, que incluye un front-end para la interacción del usuario y un back-end para el procesamiento de datos y tareas de PNL.

27
RESEARCHarXiv CS.CL·30/4/2026

Evaluation Revisited: A Taxonomy of Evaluation Concerns in Natural Language Processing

Impulsado por los avances recientes en LLMs, este trabajo realiza una revisión exploratoria de la larga historia de reflexión metodológica en PNL sobre las preocupaciones de evaluación. Desarrolla una taxonomía, sintetizando posiciones y compensaciones recurrentes, y ofrece una lista de verificación estructurada para apoyar un diseño e interpretación de evaluación más deliberados.

27
RESEARCHarXiv CS.LG·6/5/2026

On the Invariants of Softmax Attention

Esta investigación define el "campo de energía" en la atención softmax, revelando propiedades invariantes esenciales. Diferencia los invariantes a nivel de mecanismo, derivados de la estructura algebraica, de las regularidades a nivel de modelo observadas en modelos de lenguaje autorregresivos.

27
RESEARCHarXiv CS.CL·8/4/2026

The Illusion of Latent Generalization: Bi-directionality and the Reversal Curse

Este artigo aborda a 'maldição da reversão' em modelos de linguagem autorregressivos, onde falham ao recuperar fatos em ordem inversa. A pesquisa demonstra que a precisão da reversão exige um sinal de treinamento que torne a entidade de origem um alvo de previsão, indicando armazenamento separado para direções diretas e inversas, em vez de uma representação única e agnóstica à direção.

27
RESEARCHarXiv CS.CL·6/4/2026

An Empirical Study of Many-Shot In-Context Learning for Machine Translation of Low-Resource Languages

Este estudo empírico investiga o aprendizado em contexto (ICL) de muitos exemplos para tradução automática de inglês para dez idiomas de baixo recurso. Os achados mostram que o ICL se torna mais eficaz com o aumento do número de exemplos, e a recuperação baseada em BM25 melhora substancialmente a eficiência dos dados.

27
RESEARCHarXiv CS.CL·6/5/2026

Semantically Enriching Investor Micro-blogs for Opinion-Aware Emotion Analysis: A Practical Approach

Esta investigación propone enriquecer semánticamente los microblogs de inversores para mejorar el análisis de emociones consciente de las opiniones. Aumenta el conjunto de datos StockEmotions con gráficos de opinión granulares utilizando una pipeline LLM y demuestra un rendimiento de clasificación mejorado con Redes Neuronales Gráficas.

27
RESEARCHarXiv CS.CL·6/5/2026

Effective Performance Measurement: Challenges and Opportunities in KPI Extraction from Earnings Calls

Este artículo de investigación explora los desafíos en la extracción de KPI de llamadas de ganancias no estructuradas, en contraste con los archivos templados de la SEC. Presenta tres nuevos benchmarks (SECB, ECB y ECB-A) para evaluar modelos, encontrando que los modelos basados en codificadores tienen dificultades con el cambio de dominio.

27