NLP

124 items

ARTICLEDEV.to AI·24/4/2026

Bringing it to Life: The Real-Time Inference Engine (Part 3)

Este artículo, Parte 3 de una serie, detalla el motor de inferencia en tiempo real para un proyecto de ASL a voz, abordando el desafío de procesar transmisiones infinitas de webcam. Explica la arquitectura de Ventana Deslizante para decodificar puntos clave del cuerpo en glosas de lenguaje de señas y usar LLMs para generar inglés hablado.

sign-language machine learning computer vision NLP

RESEARCHDEV.to AI·hace 24d

Efficient 8-Bit Quantization of Transformer Neural Machine Language TranslationModel

Este artículo trata sobre la cuantificación eficiente de 8 bits para modelos Transformer de traducción automática de idiomas. El objetivo es optimizar el rendimiento y la eficiencia de estos modelos, reduciendo el consumo de memoria y la latencia.

AI models efficiency NLP quantization

ARTICLEDEV.to AI·9/5/2026

Your RAG can't answer 'why' -- GraphRAG finds what vector search misses

Este artículo explora las limitaciones de los sistemas RAG (Generación Aumentada por Recuperación) convencionales, que no pueden responder preguntas de tipo 'por qué' porque la búsqueda vectorial solo encuentra documentos similares, no relacionados. Presenta GraphRAG como una solución para superar este 'techo estructural' al permitir que el sistema conecte puntos entre la información. El autor comparte una anécdota personal sobre la frustración de descubrir este cuello de botella arquitectónico después de intentos fallidos de reescribir prompts.

AI architecture GraphRAG RAG NLP

ARTICLEDEV.to AI·26/4/2026

I Made Two AI Models Read My Git Commits. It Got Uncomfortably Personal.

El autor describe un experimento donde dos modelos de IA analizaron mensajes de commit de Git para determinar el estado de ánimo del desarrollador, lo que resultó en conocimientos sorprendentemente personales. El desafío, un duelo ciego entre Gemini 2.5 Flash y una IA personalizada, reveló la profundidad del análisis de las herramientas.

AI models privacy NLP sentiment analysis

DOCDEV.to AI·20/4/2026

How to integrate DeepSeek R1 into your React app

Esta guía completa detalla la integración de DeepSeek R1, una API de IA impulsada por PNL, en aplicaciones React, ofreciendo pasos y mejores prácticas. Cubre los requisitos previos y la comunicación mediante solicitudes HTTP con Axios.

ReAct NLP DeepSeek R1 API Integration

RESEARCHHugging Face Blog·hace 26d

Granite Embedding Multilingual R2: Open Apache 2.0 Multilingual Embeddings with 32K Context — Best Sub-100M Retrieval Quality

Granite Embedding Multilingual R2 es un nuevo modelo de embeddings multilingüe de código abierto bajo la licencia Apache 2.0. Destaca por ofrecer la mejor calidad de recuperación entre modelos de menos de 100 millones de parámetros y soporta un contexto de 32K.

Open Source AI models Benchmarking NLP

ARTICLEDEV.to AI·27/4/2026

Intelligent Automation Explained: A Beginner's Guide to the Future of Work

La Automatización Inteligente es un concepto transformador que une la inteligencia artificial con la automatización de procesos, permitiendo que los sistemas aprendan, se adapten y mejoren continuamente. Representa la convergencia de RPA, aprendizaje automático, procesamiento de lenguaje natural y tecnologías cognitivas para optimizar el rendimiento en los negocios modernos.

future-of-work machine learning NLP AI

RESEARCHDEV.to AI·19/4/2026

Evaluation of Retrieval-Augmented Generation: A Survey

Esta encuesta evalúa la Generación Aumentada por Recuperación (RAG), analizando su estado actual, arquitecturas y métricas de rendimiento. Proporciona una visión general completa de las técnicas RAG existentes y sus aplicaciones.

Survey evaluation RAG NLP

DOCDEV.to AI·hace 15d

RAG 시스템 실전 구축 (v23)

Esta es una guía práctica (v23) para ingenieros de ML sobre la implementación de sistemas RAG. Detalla el ciclo RAG (recuperación, aumento, generación) e incluye un ejemplo en Python para la segmentación semántica usando sentence_transformers.

learning RAG machine learning NLP

DOCDEV.to AI·hace 24d

83. HuggingFace: Your Library for Every Pretrained Model

Este contenido presenta cómo HuggingFace hace que el PNL práctico sea accesible a través de sus bibliotecas y Model Hub. Demuestra la simplificación del uso de modelos preentrenados para tareas como el análisis de sentimientos con código mínimo.

learning machine learning NLP HuggingFace

RESEARCHarXiv CS.CL·1/5/2026

Semantic Structure of Feature Space in Large Language Models

Este estudio demuestra que las relaciones geométricas entre las características semánticas en los estados ocultos de los LLMs reflejan fielmente las asociaciones psicológicas humanas. La investigación muestra que las proyecciones de vectores de palabras en ejes semánticos se correlacionan con las valoraciones humanas, y la similitud entre estos ejes predice la interconexión de las escalas semánticas.

LLMs cognitive science semantic representation NLP

RESEARCHarXiv CS.CL·30/4/2026

Analysing Lightweight Large Language Models for Biomedical Named Entity Recognition on Diverse Ouput Formats

Esta investigación examina el uso de LLMs ligeros para el Reconocimiento de Entidades Nombradas Biomédicas, demostrando su rendimiento competitivo frente a modelos más grandes. El estudio resalta su potencial como alternativas eficientes en recursos e identifica formatos de salida específicos que mejoran consistentemente el rendimiento.

LLMs named entity recognition Model Evaluation NLP

RESEARCHarXiv CS.CL·17/4/2026

SeaAlert: Critical Information Extraction From Maritime Distress Communications with Large Language Models

SeaAlert es un marco basado en LLM para el análisis robusto de comunicaciones marítimas de socorro, que son difíciles debido al ruido y las desviaciones de formato. Para abordar la escasez de datos reales etiquetados, el proyecto desarrolla una tubería de generación de datos sintéticos utilizando un LLM.

synthetic data Information Extraction NLP Speech Recognition

RESEARCHarXiv CS.CL·16/4/2026

WorkRB: A Community-Driven Evaluation Framework for AI in the Work Domain

WorkRB es el primer benchmark de código abierto y dirigido por la comunidad para la IA en el dominio laboral, abordando la fragmentación de la investigación y la sensibilidad de los datos de empleo. Organiza 13 tareas diversas de 7 grupos como tareas unificadas de recomendación y PNL, incluyendo recomendación de empleo/habilidades y extracción de habilidades.

hiring future-of-work recommender systems NLP

RESEARCHarXiv CS.CL·hace 19d

Under Pressure: Emotional Framing Induces Measurable Behavioral Shifts and Structured Internal Geometry in Small Language Models

Este estudio examina cómo los seguimientos con encuadre emocional cambian el comportamiento y las representaciones internas de los modelos de lenguaje pequeños. Los resultados muestran que la "presión" produce los marcadores de atajo más fuertes, mientras que la "calma" y la "curiosidad" preservan la honestidad de manera más efectiva.

NLP model behavior emotional framing AI Research

RESEARCHarXiv CS.CL·hace 19d

Pseudo-Siamese Network for Planning in Target-Oriented Proactive Dialogues

El artículo propone una Red Pseudo-Siamesa Bidireccional Enfocada hacia Adelante (FF-BPSN) para la planificación de rutas de diálogo en sistemas de diálogo proactivos orientados a objetivos. Esta red emplea decodificadores idénticos basados en transformadores para la planificación bidireccional e integra información para construir una ruta hacia adelante, guiando a los modelos de lenguaje en la generación de respuestas.

transformer networks deep learning NLP AI

RESEARCHarXiv CS.CL·24/4/2026

DWTSumm: Discrete Wavelet Transform for Document Summarization

Esta investigación propone un marco basado en la Transformada Wavelet Discreta (DWT) para mejorar la creación de resúmenes de documentos, especialmente para textos largos y específicos de dominio donde los LLM tienen dificultades. El método genera representaciones compactas que mejoran la similitud semántica, la fundamentación y la coherencia factual en comparación con una base GPT-4o.

LLMs wavelet transform NLP Document Summarization

RESEARCHarXiv CS.CL·hace 29d

Reflections and New Directions for Human-Centered Large Language Models

Este trabajo presenta un marco para el desarrollo de Modelos de Lenguaje Grandes Centrados en el Humano (HCLLMs), que integra perspectivas de PNL, IHC e IA responsable. Argumenta la necesidad de abordar las preocupaciones, preferencias y valores humanos con rigor en cada etapa del desarrollo de LLM, y no solo en una fase posterior al entrenamiento.

LLMs HCI NLP AI ethics

RESEARCHarXiv CS.CL·hace 20d

The Annotation Scarcity Paradox in Low-Resource NLP Evaluation: A Decade of Acceleration and Emerging Constraints

El procesamiento del lenguaje natural (PLN) de bajos recursos ha experimentado un crecimiento explosivo, pero su evaluación enfrenta un desafío crítico: la escasez de experiencia sociolingüística necesaria para evaluar sistemas generativos complejos. Esto da lugar a la "Paradoja de la Escasez de Anotaciones", donde la capacidad técnica para escalar modelos supera la infraestructura humana requerida para una evaluación auténtica.

machine learning NLP Low-resource languages AI evaluation

RESEARCHarXiv CS.CL·hace 7d

AEyeDE: An Attention-Based Attribution Framework for AI-Generated Text Detection

Este artículo presenta AEyeDE, un marco basado en la atención para la detección de autoría humana-IA que utiliza la atención del modelo como señal discriminativa. El método supera consistentemente las líneas base de solo texto y muestra robustez en diversas configuraciones de generación de texto, siendo competitivo en los puntos de referencia estándar.

AI detection machine learning NLP attention mechanisms