Natural Language Processing

168 items

ARTICLEDEV.to AI·24/4/2026

GoDavaii's Day 5: When 22 Indian Languages Redefine 'Hard' in Health AI

GoDavaii aborda el desafío de la IA en la salud en India, centrándose en la comprensión de descripciones de salud en 22 idiomas locales con sus matices culturales. La empresa destaca que la interpretación de expresiones de salud culturalmente específicas es mucho más compleja que la traducción directa, un desafío a menudo ignorado por las IAs de salud globales.

Multilingual AI India AI in healthcare Natural Language Processing

RESEARCHDEV.to AI·26/4/2026

Multi-Perspective Context Matching for Machine Comprehension

Este contenido aborda un método innovador de coincidencia de contexto multiperspectiva para mejorar la comprensión automática. La técnica busca aumentar la capacidad de los sistemas de IA para entender textos complejos, analizando información desde diversos ángulos.

Context Matching Natural Language Processing Machine Comprehension

ARTICLEDEV.to AI·27/4/2026

Building Smart Student Engagement Detector: An AI-Powered Early Learning Issue Detection System using ML, NLP & Multimodal Analytics

Este proyecto describe un sistema de detección del compromiso estudiantil impulsado por IA, que utiliza ML, PNL y análisis multimodal para identificar señales tempranas de dificultades de aprendizaje. El objetivo es intervenir antes de que los problemas académicos, de asistencia o de comportamiento se agraven y se reflejen en las calificaciones.

Multimodal Analytics education machine learning Natural Language Processing

RESEARCHarXiv CS.AI·hace 22d

From Prompts to Protocols: An AI Agent for Laboratory Automation

Este artículo presenta una arquitectura de agente de IA que integra grandes modelos de lenguaje con la orquestación de laboratorio. Permite a los científicos crear y monitorear protocolos de laboratorio automatizados de forma interactiva usando lenguaje natural.

Experiment Orchestration AI agent Natural Language Processing large language models

RESEARCHarXiv CS.AI·7/4/2026

Towards the AI Historian: Agentic Information Extraction from Primary Sources

Este relatório técnico apresenta o primeiro módulo de Chronos, um Historiador de IA em desenvolvimento. Ele permite que historiadores convertam imagens digitalizadas de fontes primárias em dados através de interações em linguagem natural, adaptando e refinando fluxos de trabalho.

Open Source Information Extraction Natural Language Processing AI

RESEARCHarXiv CS.CL·7/4/2026

Text Summarization With Graph Attention Networks

Este estudo explorou o uso de informações de grafos (RST e Co-referência) para sumarização de texto, descobrindo que Redes de Atenção Gráficas não melhoraram o desempenho, enquanto um Perceptron Multicamadas obteve sucesso. Adicionalmente, foi criado um novo benchmark para sumarização baseada em grafos ao anotar o dataset XSum com informações RST.

Graph Attention Networks Rhetorical Structure Theory machine learning Natural Language Processing

RESEARCHarXiv CS.LG·6/4/2026

SIEVE: Sample-Efficient Parametric Learning from Natural Language

SIEVE propõe um método para aprendizado paramétrico com eficiência de amostra a partir de contexto de linguagem natural, necessitando de apenas três exemplos de consulta. Ele emprega uma pipeline de geração de dados sintéticos, SIEVE-GEN, que decompõe o contexto para gerar resultados de maior qualidade e destilar o contexto no modelo.

language models Sample Efficiency contextual learning machine learning

RESEARCHarXiv CS.CL·6/4/2026

Speaking of Language: Reflections on Metalanguage Research in NLP

Este trabalho define metalinguagem e explora sua conexão com PNL e LLMs, discutindo esforços de pesquisa e dimensões de tarefas metalinguísticas. Propõe ainda uma lista de futuras direções de pesquisa pouco estudadas.

LLMs research Metalanguage NLP

RESEARCHarXiv CS.AI·23/4/2026

Algorithm Selection with Zero Domain Knowledge via Text Embeddings

El artículo propone ZeroFolio, un método de selección de algoritmos sin características que utiliza embeddings de texto preentrenados de archivos de instancia brutos. Este enfoque, que no requiere conocimiento de dominio, supera los métodos tradicionales con características artesanales en la mayoría de los escenarios evaluados en diversos dominios de problemas.

machine learning Natural Language Processing algorithm selection zero-shot learning

RESEARCHarXiv CS.AI·23/4/2026

Automated Detection of Dosing Errors in Clinical Trial Narratives: A Multi-Modal Feature Engineering Approach with LightGBM

Esta investigación presenta un sistema automatizado para detectar errores de dosificación en narrativas de ensayos clínicos, utilizando LightGBM con ingeniería de características multimodal. El enfoque combina PNL tradicional, embeddings semánticos, patrones médicos y puntuaciones de transformadores para lograr una alta precisión en un conjunto de datos desequilibrado.

machine learning Natural Language Processing healthcare AI

RESEARCHarXiv CS.AI·23/4/2026

Exploring Data Augmentation and Resampling Strategies for Transformer-Based Models to Address Class Imbalance in AI Scoring of Scientific Explanations in NGSS Classroom

Este estudio investiga estrategias de aumento de datos para mejorar la clasificación de texto basada en transformadores en la puntuación automatizada de explicaciones científicas de estudiantes, abordando el desequilibrio de clases. Evalúa métodos como respuestas generadas por GPT-4, EASE y ALP contra una línea base de SciBERT, utilizando un conjunto de datos de 1.466 respuestas de secundaria.

machine learning Natural Language Processing education technology Data Augmentation

RESEARCHarXiv CS.CL·6/5/2026

MedStruct-S: A Benchmark for Key Discovery, Key-Conditioned QA and Semi-Structured Extraction from OCR Clinical Reports

MedStruct-S es un nuevo benchmark para la extracción de información semiestructurada de informes clínicos derivados de OCR, abordando desafíos como representaciones de claves heterogéneas y ruido de OCR. Su objetivo es evaluar la robustez del modelo en entornos del mundo real para el descubrimiento de claves, QA condicionado a claves y extracción de pares clave-valor.

Information Extraction clinical reports Benchmarking Natural Language Processing

RESEARCHarXiv CS.CL·6/5/2026

Geometric Deviation as an Unsupervised Pre-Generation Reliability Signal: Probing LLM Representations for Answerability

Esta investigación explora el uso de la desviación geométrica de los estados ocultos de los LLM como una señal previa a la generación para indicar cuando una consulta está fuera del conocimiento del modelo. Se encontró que esta señal funciona bien para preguntas matemáticas sin respuesta, pero no para preguntas fácticas.

LLMs research Model Evaluation Reliability

RESEARCHarXiv CS.CL·6/5/2026

How Language Models Process Negation

Este estudio investiga cómo los Grandes Modelos de Lenguaje (LLMs) procesan mecanísticamente la negación, revelando que incluso los modelos de código abierto poseen componentes internos para el procesamiento correcto de la negación a pesar de a menudo dar respuestas incorrectas. Su baja precisión se atribuye a la atención de capas tardías que promueve atajos simples, y los modelos implementan tanto la atención a frases negadas como la construcción directa de representaciones de frases negativas.

LLMs Mechanistic Interpretability attention mechanisms Natural Language Processing

RESEARCHarXiv CS.CL·6/5/2026

S^2tory: Story Spine Distillation for Movie Script Summarization

S^2tory es un marco de IA basado en la narratología para la creación de resúmenes de guiones de películas, que aborda la complejidad de las narrativas no lineales identificando "núcleos de la trama" mediante trayectorias de desarrollo de personajes. Emplea un Agente Experto Narrativo para destilar conocimiento, que luego condiciona un modelo para identificar los puntos esenciales de la trama para la generación del resumen.

machine learning narrative AI Natural Language Processing summarization

DOCAndrej Karpathy (YouTube)·20/2/2024

Let's build the GPT Tokenizer

Este contenido ofrece una guía práctica sobre cómo construir un tokenizador GPT, detallando los pasos y conceptos fundamentales involucrados. Explora cómo los modelos GPT procesan el texto, convirtiéndolo en unidades más pequeñas para el análisis.

GPT learning Natural Language Processing tokenizer

DOCfast.ai Blog·20/1/2026

How To Use AI for the Ancient Art of Close Reading

Este contenido explora cómo usar la inteligencia artificial, específicamente los Large Language Models (LLMs), para la antigua práctica de la lectura atenta. Detalla experimentos y enfoques para aplicar la IA a esta forma de arte tradicional.

text analysis LLMs learning Natural Language Processing

How To Use AI for the Ancient Art of Close Reading

RESEARCHarXiv CS.AI·9/4/2026

BDI-Kit Demo: A Toolkit for Programmable and Conversational Data Harmonization

O BDI-Kit é uma ferramenta que aborda a harmonização de dados, superando a heterogeneidade em esquemas e valores. Ele oferece uma API Python para pipelines programáticos e uma interface de chat assistida por IA para especialistas, permitindo explorar, validar e refinar correspondências de dados de forma iterativa.

Data Harmonization Natural Language Processing AI

ARTICLEDEV.to AI·2/5/2026

The Aunty Test - what Bengali-speaking patients see when they ask Health AI in their own language

La IA de salud diseñada para el inglés falla al procesar consultas médicas en idiomas como el bengalí, ofreciendo consejos inadecuados. En contraste, GoDavaii razona de forma nativa en 22 idiomas indios, proporcionando asesoramiento médico preciso y culturalmente relevante.

Multilingual AI Healthcare technology AI bias Natural Language Processing

ARTICLEDEV.to AI·2/5/2026

Advances in Multimodal AI: Researchers Develop New Framework for Fusion of Vision and Language

La IA multimodal, que integra múltiples fuentes de datos como visión y lenguaje, está ganando terreno debido a la creciente digitalización y a sus diversas aplicaciones en varios sectores. A pesar de su promesa, un desafío clave sigue siendo la fusión efectiva de tipos de datos dispares con diferentes requisitos de procesamiento.

multimodal AI computer vision Natural Language Processing