← heapsort-ai

NLP

124 items

ARTICLEDEV.to AI·9/5/2026

Your RAG can't answer 'why' -- GraphRAG finds what vector search misses

Este artículo explora las limitaciones de los sistemas RAG (Generación Aumentada por Recuperación) convencionales, que no pueden responder preguntas de tipo 'por qué' porque la búsqueda vectorial solo encuentra documentos similares, no relacionados. Presenta GraphRAG como una solución para superar este 'techo estructural' al permitir que el sistema conecte puntos entre la información. El autor comparte una anécdota personal sobre la frustración de descubrir este cuello de botella arquitectónico después de intentos fallidos de reescribir prompts.

27
ARTICLEDEV.to AI·27/4/2026

Intelligent Automation Explained: A Beginner's Guide to the Future of Work

La Automatización Inteligente es un concepto transformador que une la inteligencia artificial con la automatización de procesos, permitiendo que los sistemas aprendan, se adapten y mejoren continuamente. Representa la convergencia de RPA, aprendizaje automático, procesamiento de lenguaje natural y tecnologías cognitivas para optimizar el rendimiento en los negocios modernos.

27
DOCDEV.to AI·hace 15d

RAG 시스템 실전 구축 (v23)

Esta es una guía práctica (v23) para ingenieros de ML sobre la implementación de sistemas RAG. Detalla el ciclo RAG (recuperación, aumento, generación) e incluye un ejemplo en Python para la segmentación semántica usando sentence_transformers.

27
RESEARCHarXiv CS.CL·1/5/2026

Semantic Structure of Feature Space in Large Language Models

Este estudio demuestra que las relaciones geométricas entre las características semánticas en los estados ocultos de los LLMs reflejan fielmente las asociaciones psicológicas humanas. La investigación muestra que las proyecciones de vectores de palabras en ejes semánticos se correlacionan con las valoraciones humanas, y la similitud entre estos ejes predice la interconexión de las escalas semánticas.

27
RESEARCHarXiv CS.CL·30/4/2026

Analysing Lightweight Large Language Models for Biomedical Named Entity Recognition on Diverse Ouput Formats

Esta investigación examina el uso de LLMs ligeros para el Reconocimiento de Entidades Nombradas Biomédicas, demostrando su rendimiento competitivo frente a modelos más grandes. El estudio resalta su potencial como alternativas eficientes en recursos e identifica formatos de salida específicos que mejoran consistentemente el rendimiento.

27
RESEARCHarXiv CS.CL·17/4/2026

SeaAlert: Critical Information Extraction From Maritime Distress Communications with Large Language Models

SeaAlert es un marco basado en LLM para el análisis robusto de comunicaciones marítimas de socorro, que son difíciles debido al ruido y las desviaciones de formato. Para abordar la escasez de datos reales etiquetados, el proyecto desarrolla una tubería de generación de datos sintéticos utilizando un LLM.

27
RESEARCHarXiv CS.CL·16/4/2026

WorkRB: A Community-Driven Evaluation Framework for AI in the Work Domain

WorkRB es el primer benchmark de código abierto y dirigido por la comunidad para la IA en el dominio laboral, abordando la fragmentación de la investigación y la sensibilidad de los datos de empleo. Organiza 13 tareas diversas de 7 grupos como tareas unificadas de recomendación y PNL, incluyendo recomendación de empleo/habilidades y extracción de habilidades.

27
RESEARCHarXiv CS.CL·hace 19d

Under Pressure: Emotional Framing Induces Measurable Behavioral Shifts and Structured Internal Geometry in Small Language Models

Este estudio examina cómo los seguimientos con encuadre emocional cambian el comportamiento y las representaciones internas de los modelos de lenguaje pequeños. Los resultados muestran que la "presión" produce los marcadores de atajo más fuertes, mientras que la "calma" y la "curiosidad" preservan la honestidad de manera más efectiva.

27
RESEARCHarXiv CS.CL·hace 19d

Pseudo-Siamese Network for Planning in Target-Oriented Proactive Dialogues

El artículo propone una Red Pseudo-Siamesa Bidireccional Enfocada hacia Adelante (FF-BPSN) para la planificación de rutas de diálogo en sistemas de diálogo proactivos orientados a objetivos. Esta red emplea decodificadores idénticos basados en transformadores para la planificación bidireccional e integra información para construir una ruta hacia adelante, guiando a los modelos de lenguaje en la generación de respuestas.

27
RESEARCHarXiv CS.CL·24/4/2026

DWTSumm: Discrete Wavelet Transform for Document Summarization

Esta investigación propone un marco basado en la Transformada Wavelet Discreta (DWT) para mejorar la creación de resúmenes de documentos, especialmente para textos largos y específicos de dominio donde los LLM tienen dificultades. El método genera representaciones compactas que mejoran la similitud semántica, la fundamentación y la coherencia factual en comparación con una base GPT-4o.

27
RESEARCHarXiv CS.CL·hace 29d

Reflections and New Directions for Human-Centered Large Language Models

Este trabajo presenta un marco para el desarrollo de Modelos de Lenguaje Grandes Centrados en el Humano (HCLLMs), que integra perspectivas de PNL, IHC e IA responsable. Argumenta la necesidad de abordar las preocupaciones, preferencias y valores humanos con rigor en cada etapa del desarrollo de LLM, y no solo en una fase posterior al entrenamiento.

27
RESEARCHarXiv CS.CL·hace 20d

The Annotation Scarcity Paradox in Low-Resource NLP Evaluation: A Decade of Acceleration and Emerging Constraints

El procesamiento del lenguaje natural (PLN) de bajos recursos ha experimentado un crecimiento explosivo, pero su evaluación enfrenta un desafío crítico: la escasez de experiencia sociolingüística necesaria para evaluar sistemas generativos complejos. Esto da lugar a la "Paradoja de la Escasez de Anotaciones", donde la capacidad técnica para escalar modelos supera la infraestructura humana requerida para una evaluación auténtica.

27
RESEARCHarXiv CS.CL·hace 7d

AEyeDE: An Attention-Based Attribution Framework for AI-Generated Text Detection

Este artículo presenta AEyeDE, un marco basado en la atención para la detección de autoría humana-IA que utiliza la atención del modelo como señal discriminativa. El método supera consistentemente las líneas base de solo texto y muestra robustez en diversas configuraciones de generación de texto, siendo competitivo en los puntos de referencia estándar.

27