← heapsort-ai

natural language processing

167 items

RESEARCHarXiv CS.CL·22/4/2026

Model-Agnostic Meta Learning for Class Imbalance Adaptation

Este artículo presenta Hardness-Aware Meta-Resample (HAMR), un marco unificado que aborda la adaptación al desequilibrio de clases y la dificultad de los datos en tareas de PNL. HAMR utiliza optimizaciones de dos niveles y un mecanismo de remuestreo consciente del vecindario para priorizar muestras genuinamente desafiantes y clases minoritarias, logrando mejoras sustanciales en varios conjuntos de datos desequilibrados.

35
RESEARCHarXiv CS.CL·hace 18d

Broadening Access to Transportation Safety Data with Generative AI: A Schema-Grounded Framework for Spatial Natural Language Queries

Este documento presenta una interfaz de lenguaje natural basada en esquemas que utiliza IA Generativa para hacer que los datos de seguridad del transporte sean más accesibles. Su objetivo es cerrar la brecha para los profesionales al traducir las consultas de los usuarios en marcos semánticos estructurados para un análisis confiable.

33
ARTICLEDEV.to AI·22/4/2026

Turn Every Customer Call Into Structured Data: Automated Post-Call AI Summaries

Este contenido detalla una solución impulsada por IA para transformar las llamadas de clientes en datos estructurados. Describe un pipeline que utiliza VoIPBin para la captura de llamadas, Whisper para la transcripción y GPT-4o para el resumen y la extracción de datos, abordando el problema de las notas de llamadas inadecuadas en los CRMs.

33
RESEARCHarXiv CS.CL·22/4/2026

Remask, Don't Replace: Token-to-Mask Refinement in Masked Diffusion Language Models

Este artículo propone una nueva técnica, Token-to-Mask (T2M) remasking, para refinar modelos de lenguaje de difusión enmascarados como LLaDA2.1. El método aborda las deficiencias de la edición Token-to-Token (T2T) al restablecer los tokens sospechosos a un estado de máscara, permitiendo una predicción más precisa.

32
DOCDEV.to AI·hace 5d

Cignara

Cignara es una plataforma basada en la nube y potenciada por IA, diseñada para optimizar el análisis de datos, la automatización y la toma de decisiones, utilizando ML y PNL. Su arquitectura presenta infraestructura de nube, una capa de procesamiento de datos y un motor de IA/ML con modelos de PNL y análisis predictivo.

32
RESEARCHarXiv CS.AI·hace 5d

SMAC-Talk: A Natural Language Extension of the StarCraft Multi-Agent Challenge for Large Language Models

Este artículo presenta SMAC-Talk, una extensión del StarCraft Multi-Agent Challenge, para evaluar agentes basados en LLM en entornos cooperativos multiagente. Incluye un canal de comunicación en lenguaje natural para investigar la coordinación y la confianza de los agentes, así como escenarios con comunicadores engañosos.

31
DOCDEV.to AI·16/4/2026

LLM vs RAG

Este contenido compara LLM (Large Language Model) y RAG (Retrieval-Augmented Generation), destacando sus diferencias fundamentales como tipo, fuente de conocimiento, precisión y casos de uso. Explica que RAG mejora la factualidad de los LLM al integrar datos externos y en tiempo real, mitigando las alucinaciones.

31
RESEARCHarXiv CS.CL·16/4/2026

A Multi-Model Approach to English-Bangla Sentiment Classification of Government Mobile Banking App Reviews

Este estudio clasifica el sentimiento en reseñas en inglés y bengalí de aplicaciones de banca móvil gubernamentales de Bangladés, empleando un enfoque de etiquetado híbrido para 5.652 reseñas. Se encontró que los modelos tradicionales de aprendizaje automático, como Random Forest y Linear SVM, superaron significativamente al XLM-RoBERTa ajustado para esta tarea específica.

31
ARTICLEDEV.to AI·hace 3d

Day 48 of GoDavaii: Building Health AI for 22 Indian Languages - Why It's Harder Than You Think

El artículo describe los desafíos de construir una IA de salud que realmente entienda los matices de los 22 idiomas oficiales de la India, ejemplificado por la complejidad de interpretar una frase simple. En el día 48 desde su lanzamiento, GoDavaii está abordando inmensas complejidades lingüísticas para crear una IA que trascienda las soluciones centradas en el inglés.

30
RESEARCHarXiv CS.CL·hace 4d

Predict and Reconstruct: Joint Objectives for Self-Supervised Language Representation Learning

Este artículo presenta un objetivo de pre-entrenamiento híbrido para codificadores de texto, que combina una pérdida de predicción de espacio latente al estilo JEPA con un objetivo estándar de modelado de lenguaje enmascarado (MLM). Este nuevo enfoque busca fomentar representaciones ancladas en estructuras semánticas más profundas en lugar de solo la identidad superficial de los tokens, mostrando incrustaciones significativamente más uniformes.

30
RESEARCHarXiv CS.CL·14/4/2026

GIANTS: Generative Insight Anticipation from Scientific Literature

Este artículo introduce la tarea de "anticipación de insights", donde los modelos de lenguaje predicen la idea central de un futuro artículo científico a partir de sus predecesores. Para evaluarlo, los autores crearon GiantsBench, un benchmark de 17.000 ejemplos, y presentan GIANTS-4B, un LM entrenado con aprendizaje por refuerzo.

30
RESEARCHDEV.to AI·13/4/2026

Beyond the 80/20 Rule: High-Entropy Minority Tokens Drive EffectiveReinforcement Learning for LLM Reasoning

Este contenido explora un enfoque novedoso para mejorar el Aprendizaje por Refuerzo para el razonamiento de Modelos de Lenguaje Grandes (LLM) al centrarse en "tokens minoritarios de alta entropía". Propone que estos tokens menos frecuentes pero muy informativos son los impulsores clave para un aprendizaje eficaz, desafiando la regla convencional 80/20.

29
DOCDEV.to AI·15/4/2026

Clide

Clide es una herramienta con un motor de IA central que ofrece sugerencias de comandos, autocompletado de código y detección de errores en terminales. Utiliza frameworks de aprendizaje automático como TensorFlow/PyTorch y bibliotecas de PNL como NLTK/spaCy para procesar y comprender la interacción del usuario.

29
ARTICLEDEV.to AI·18/4/2026

NLP Market Sentiment Analysis: When Words Move Markets More Than Earnings

Este contenido explora cómo el Procesamiento del Lenguaje Natural (PLN) cuantifica las narrativas del mercado de diversas fuentes para crear señales comerciales. Detalla un sistema PLN de cinco etapas para el análisis del sentimiento del mercado, basado en matemáticas para proporcionar indicadores del estado de ánimo del mercado.

29
ARTICLEDEV.to AI·22/4/2026

How AI Receptionists Work: A Technical Deep Dive into Dental Practice Phone Automation

Este artículo ofrece una inmersión técnica profunda en cómo funcionan los recepcionistas de IA en consultorios dentales, detallando el flujo de llamadas, los desafíos en la precisión de la conversión de voz a texto y el papel de los LLM en el procesamiento de transcripciones para intención, entidades y sentimiento.

29
ARTICLEDEV.to AI·hace 27d

Everything Google announced at its Android Show, from Googlebooks to vibe-coded widgets

El artículo analiza técnicamente los anuncios del Android Show de Google, enfocándose en la nueva aplicación Google Libros y los widgets codificados por ambiente. Detalla cómo Google Libros usa un motor de renderización propietario con ML para el reconocimiento de texto, mientras que los widgets aprovechan PNL y visión por computadora a través de TensorFlow Lite para experiencias personalizadas.

29
RESEARCHarXiv CS.CL·24/4/2026

GRISP: Guided Recurrent IRI Selection over SPARQL Skeletons

GRISP es un novedoso método de respuesta a preguntas basado en SPARQL sobre grafos de conocimiento, que utiliza un pequeño modelo de lenguaje (SLM) ajustado. Genera esqueletos de consultas SPARQL a partir de preguntas en lenguaje natural y los refina seleccionando elementos del grafo, logrando resultados de vanguardia en benchmarks como Wikidata y Freebase.

29