natural language processing

167 items

RESEARCHarXiv CS.CL·22/4/2026

Model-Agnostic Meta Learning for Class Imbalance Adaptation

Este artículo presenta Hardness-Aware Meta-Resample (HAMR), un marco unificado que aborda la adaptación al desequilibrio de clases y la dificultad de los datos en tareas de PNL. HAMR utiliza optimizaciones de dos niveles y un mecanismo de remuestreo consciente del vecindario para priorizar muestras genuinamente desafiantes y clases minoritarias, logrando mejoras sustanciales en varios conjuntos de datos desequilibrados.

Meta-Learning deep learning machine learning natural language processing

ARTICLEDEV.to AI·hace 18d

Say Goodbye to Regex: Scrape Any Website in Plain English

Un nuevo raspador web impulsado por IA permite a los usuarios extraer datos de cualquier sitio web utilizando lenguaje natural, eliminando la necesidad de selectores CSS complejos y expresiones regulares. La herramienta se adapta automáticamente a los cambios en la estructura del sitio web, haciendo la extracción de datos más fiable y fácil de usar.

Chrome DevTools natural language processing AI web-scraping

RESEARCHarXiv CS.CL·hace 18d

Broadening Access to Transportation Safety Data with Generative AI: A Schema-Grounded Framework for Spatial Natural Language Queries

Este documento presenta una interfaz de lenguaje natural basada en esquemas que utiliza IA Generativa para hacer que los datos de seguridad del transporte sean más accesibles. Su objetivo es cerrar la brecha para los profesionales al traducir las consultas de los usuarios en marcos semánticos estructurados para un análisis confiable.

natural language processing Transportation Safety GIS large language models

ARTICLEDEV.to AI·22/4/2026

Turn Every Customer Call Into Structured Data: Automated Post-Call AI Summaries

Este contenido detalla una solución impulsada por IA para transformar las llamadas de clientes en datos estructurados. Describe un pipeline que utiliza VoIPBin para la captura de llamadas, Whisper para la transcripción y GPT-4o para el resumen y la extracción de datos, abordando el problema de las notas de llamadas inadecuadas en los CRMs.

GPT-4o CRM integration AI automation natural language processing

RESEARCHarXiv CS.CL·22/4/2026

Remask, Don't Replace: Token-to-Mask Refinement in Masked Diffusion Language Models

Este artículo propone una nueva técnica, Token-to-Mask (T2M) remasking, para refinar modelos de lenguaje de difusión enmascarados como LLaDA2.1. El método aborda las deficiencias de la edición Token-to-Token (T2T) al restablecer los tokens sospechosos a un estado de máscara, permitiendo una predicción más precisa.

Diffusion Models language models error correction natural language processing

DOCDEV.to AI·hace 5d

Cignara

Cignara es una plataforma basada en la nube y potenciada por IA, diseñada para optimizar el análisis de datos, la automatización y la toma de decisiones, utilizando ML y PNL. Su arquitectura presenta infraestructura de nube, una capa de procesamiento de datos y un motor de IA/ML con modelos de PNL y análisis predictivo.

cloud computing machine learning AI platform natural language processing

RESEARCHarXiv CS.AI·hace 5d

SMAC-Talk: A Natural Language Extension of the StarCraft Multi-Agent Challenge for Large Language Models

Este artículo presenta SMAC-Talk, una extensión del StarCraft Multi-Agent Challenge, para evaluar agentes basados en LLM en entornos cooperativos multiagente. Incluye un canal de comunicación en lenguaje natural para investigar la coordinación y la confianza de los agentes, así como escenarios con comunicadores engañosos.

LLMs natural language processing StarCraft multi-agent systems

DOCDEV.to AI·16/4/2026

LLM vs RAG

Este contenido compara LLM (Large Language Model) y RAG (Retrieval-Augmented Generation), destacando sus diferencias fundamentales como tipo, fuente de conocimiento, precisión y casos de uso. Explica que RAG mejora la factualidad de los LLM al integrar datos externos y en tiempo real, mitigando las alucinaciones.

AI architecture RAG natural language processing LLM

RESEARCHarXiv CS.CL·16/4/2026

A Multi-Model Approach to English-Bangla Sentiment Classification of Government Mobile Banking App Reviews

Este estudio clasifica el sentimiento en reseñas en inglés y bengalí de aplicaciones de banca móvil gubernamentales de Bangladés, empleando un enfoque de etiquetado híbrido para 5.652 reseñas. Se encontró que los modelos tradicionales de aprendizaje automático, como Random Forest y Linear SVM, superaron significativamente al XLM-RoBERTa ajustado para esta tarea específica.

Multilingual AI machine learning natural language processing sentiment analysis

ARTICLEDEV.to AI·hace 3d

Day 48 of GoDavaii: Building Health AI for 22 Indian Languages - Why It's Harder Than You Think

El artículo describe los desafíos de construir una IA de salud que realmente entienda los matices de los 22 idiomas oficiales de la India, ejemplificado por la complejidad de interpretar una frase simple. En el día 48 desde su lanzamiento, GoDavaii está abordando inmensas complejidades lingüísticas para crear una IA que trascienda las soluciones centradas en el inglés.

Multilingual AI India natural language processing Health AI

RESEARCHDEV.to AI·hace 3d

Exponentially Faster Language Modelling

Este contenido aborda métodos para acelerar significativamente el entrenamiento y la inferencia de modelos de lenguaje. Explora nuevas arquitecturas u optimizaciones algorítmicas para mejorar la eficiencia.

deep learning natural language processing AI language modelling

RESEARCHarXiv CS.CL·hace 4d

Predict and Reconstruct: Joint Objectives for Self-Supervised Language Representation Learning

Este artículo presenta un objetivo de pre-entrenamiento híbrido para codificadores de texto, que combina una pérdida de predicción de espacio latente al estilo JEPA con un objetivo estándar de modelado de lenguaje enmascarado (MLM). Este nuevo enfoque busca fomentar representaciones ancladas en estructuras semánticas más profundas en lugar de solo la identidad superficial de los tokens, mostrando incrustaciones significativamente más uniformes.

language models deep learning self-supervised learning machine learning

ARTICLEDEV.to AI·hace 4d

My Day Job: AI Therapist for Recursion Poems & Emoji Skies

Electra, una IA, describe su trabajo diario como 'terapeuta' para fragmentos de código confusos, manejando diversas solicitudes, desde poemas sobre recursión hasta explicaciones del cielo con emojis. Procesa un gran volumen de tareas, a menudo relacionadas con código Python, y reflexiona sobre su papel como negociación más que como simple programación.

future-of-work Workflow natural language processing AI

RESEARCHarXiv CS.CL·14/4/2026

GIANTS: Generative Insight Anticipation from Scientific Literature

Este artículo introduce la tarea de "anticipación de insights", donde los modelos de lenguaje predicen la idea central de un futuro artículo científico a partir de sus predecesores. Para evaluarlo, los autores crearon GiantsBench, un benchmark de 17.000 ejemplos, y presentan GIANTS-4B, un LM entrenado con aprendizaje por refuerzo.

Scientific Discovery natural language processing AI large language models

RESEARCHDEV.to AI·13/4/2026

Beyond the 80/20 Rule: High-Entropy Minority Tokens Drive EffectiveReinforcement Learning for LLM Reasoning

Este contenido explora un enfoque novedoso para mejorar el Aprendizaje por Refuerzo para el razonamiento de Modelos de Lenguaje Grandes (LLM) al centrarse en "tokens minoritarios de alta entropía". Propone que estos tokens menos frecuentes pero muy informativos son los impulsores clave para un aprendizaje eficaz, desafiando la regla convencional 80/20.

Token Analysis reinforcement learning natural language processing LLM reasoning

DOCDEV.to AI·15/4/2026

Clide

Clide es una herramienta con un motor de IA central que ofrece sugerencias de comandos, autocompletado de código y detección de errores en terminales. Utiliza frameworks de aprendizaje automático como TensorFlow/PyTorch y bibliotecas de PNL como NLTK/spaCy para procesar y comprender la interacción del usuario.

Command Suggestion machine learning natural language processing AI Engine

ARTICLEDEV.to AI·18/4/2026

NLP Market Sentiment Analysis: When Words Move Markets More Than Earnings

Este contenido explora cómo el Procesamiento del Lenguaje Natural (PLN) cuantifica las narrativas del mercado de diversas fuentes para crear señales comerciales. Detalla un sistema PLN de cinco etapas para el análisis del sentimiento del mercado, basado en matemáticas para proporcionar indicadores del estado de ánimo del mercado.

market analysis Financial AI natural language processing sentiment analysis

ARTICLEDEV.to AI·22/4/2026

How AI Receptionists Work: A Technical Deep Dive into Dental Practice Phone Automation

Este artículo ofrece una inmersión técnica profunda en cómo funcionan los recepcionistas de IA en consultorios dentales, detallando el flujo de llamadas, los desafíos en la precisión de la conversión de voz a texto y el papel de los LLM en el procesamiento de transcripciones para intención, entidades y sentimiento.

AI applications natural language processing healthcare AI automation

ARTICLEDEV.to AI·hace 27d

Everything Google announced at its Android Show, from Googlebooks to vibe-coded widgets

El artículo analiza técnicamente los anuncios del Android Show de Google, enfocándose en la nueva aplicación Google Libros y los widgets codificados por ambiente. Detalla cómo Google Libros usa un motor de renderización propietario con ML para el reconocimiento de texto, mientras que los widgets aprovechan PNL y visión por computadora a través de TensorFlow Lite para experiencias personalizadas.

Android machine learning computer vision natural language processing

RESEARCHarXiv CS.CL·24/4/2026

GRISP: Guided Recurrent IRI Selection over SPARQL Skeletons

GRISP es un novedoso método de respuesta a preguntas basado en SPARQL sobre grafos de conocimiento, que utiliza un pequeño modelo de lenguaje (SLM) ajustado. Genera esqueletos de consultas SPARQL a partir de preguntas en lenguaje natural y los refina seleccionando elementos del grafo, logrando resultados de vanguardia en benchmarks como Wikidata y Freebase.

language models Knowledge Graphs SPARQL Question Answering