Natural Language Processing

168 items

ARTICLEDEV.to AI·24/04/2026

GoDavaii's Day 5: When 22 Indian Languages Redefine 'Hard' in Health AI

GoDavaii s'attaque au défi technologique de l'IA en santé en Inde, en se concentrant sur la compréhension des descriptions de santé dans 22 langues locales avec leurs nuances culturelles. L'entreprise souligne que l'interprétation des expressions de santé culturellement spécifiques est plus complexe qu'une simple traduction, un défi souvent négligé par les IA de santé mondiales.

Multilingual AI India AI in healthcare Natural Language Processing

RESEARCHDEV.to AI·26/04/2026

Multi-Perspective Context Matching for Machine Comprehension

Ce contenu présente une méthode innovante de correspondance de contexte multi-perspective pour améliorer la compréhension automatique. La technique vise à renforcer la capacité des systèmes d'IA à comprendre des textes complexes en analysant les informations sous plusieurs angles.

Context Matching Natural Language Processing Machine Comprehension

ARTICLEDEV.to AI·27/04/2026

Building Smart Student Engagement Detector: An AI-Powered Early Learning Issue Detection System using ML, NLP & Multimodal Analytics

Ce projet décrit un système de détection de l'engagement étudiant alimenté par l'IA, utilisant le ML, le PNL et l'analyse multimodale pour identifier les signes précoces de difficultés d'apprentissage. L'objectif est d'intervenir avant que les problèmes académiques, d'assiduité ou de comportement ne s'aggravent et n'affectent les résultats scolaires.

Multimodal Analytics education machine learning Natural Language Processing

RESEARCHarXiv CS.AI·il y a 21j

From Prompts to Protocols: An AI Agent for Laboratory Automation

Cet article présente une architecture d'agent IA qui intègre de grands modèles linguistiques à l'orchestration de laboratoire. Elle permet aux scientifiques de créer et de surveiller des protocoles de laboratoire automatisés en langage naturel.

Experiment Orchestration AI agent Natural Language Processing large language models

RESEARCHarXiv CS.AI·07/04/2026

Towards the AI Historian: Agentic Information Extraction from Primary Sources

Este relatório técnico apresenta o primeiro módulo de Chronos, um Historiador de IA em desenvolvimento. Ele permite que historiadores convertam imagens digitalizadas de fontes primárias em dados através de interações em linguagem natural, adaptando e refinando fluxos de trabalho.

Open Source Information Extraction Natural Language Processing AI

RESEARCHarXiv CS.CL·07/04/2026

Text Summarization With Graph Attention Networks

Este estudo explorou o uso de informações de grafos (RST e Co-referência) para sumarização de texto, descobrindo que Redes de Atenção Gráficas não melhoraram o desempenho, enquanto um Perceptron Multicamadas obteve sucesso. Adicionalmente, foi criado um novo benchmark para sumarização baseada em grafos ao anotar o dataset XSum com informações RST.

Graph Attention Networks Rhetorical Structure Theory machine learning Natural Language Processing

RESEARCHarXiv CS.LG·06/04/2026

SIEVE: Sample-Efficient Parametric Learning from Natural Language

SIEVE propõe um método para aprendizado paramétrico com eficiência de amostra a partir de contexto de linguagem natural, necessitando de apenas três exemplos de consulta. Ele emprega uma pipeline de geração de dados sintéticos, SIEVE-GEN, que decompõe o contexto para gerar resultados de maior qualidade e destilar o contexto no modelo.

language models Sample Efficiency contextual learning machine learning

RESEARCHarXiv CS.CL·06/04/2026

Speaking of Language: Reflections on Metalanguage Research in NLP

Este trabalho define metalinguagem e explora sua conexão com PNL e LLMs, discutindo esforços de pesquisa e dimensões de tarefas metalinguísticas. Propõe ainda uma lista de futuras direções de pesquisa pouco estudadas.

LLMs research Metalanguage NLP

RESEARCHarXiv CS.AI·23/04/2026

Algorithm Selection with Zero Domain Knowledge via Text Embeddings

L'article propose ZeroFolio, une méthode de sélection d'algorithmes sans fonctionnalités qui utilise des embeddings de texte pré-entraînés à partir de fichiers d'instances bruts. Cette approche, ne nécessitant aucune connaissance du domaine, surpasse les méthodes traditionnelles avec des fonctionnalités conçues manuellement dans la plupart des scénarios évalués à travers divers domaines problématiques.

machine learning Natural Language Processing algorithm selection zero-shot learning

RESEARCHarXiv CS.AI·23/04/2026

Automated Detection of Dosing Errors in Clinical Trial Narratives: A Multi-Modal Feature Engineering Approach with LightGBM

Cette recherche présente un système automatisé pour détecter les erreurs de dosage dans les récits d'essais cliniques, en utilisant LightGBM avec une ingénierie de fonctionnalités multimodale. L'approche combine le PNL traditionnel, les embeddings sémantiques, les motifs médicaux et les scores de transformateurs pour atteindre une ROC-AUC élevée sur un ensemble de données déséquilibré.

machine learning Natural Language Processing healthcare AI

RESEARCHarXiv CS.AI·23/04/2026

Exploring Data Augmentation and Resampling Strategies for Transformer-Based Models to Address Class Imbalance in AI Scoring of Scientific Explanations in NGSS Classroom

Cette étude explore des stratégies d'augmentation de données pour améliorer la classification de texte basée sur des transformeurs dans l'évaluation automatique d'explications scientifiques d'élèves, s'attaquant au déséquilibre des classes. Elle évalue des méthodes telles que les réponses générées par GPT-4, EASE et ALP par rapport à une base de référence SciBERT, utilisant un ensemble de données de 1 466 réponses de lycéens.

machine learning Natural Language Processing education technology Data Augmentation

RESEARCHarXiv CS.CL·06/05/2026

MedStruct-S: A Benchmark for Key Discovery, Key-Conditioned QA and Semi-Structured Extraction from OCR Clinical Reports

MedStruct-S est un nouveau benchmark pour l'extraction d'informations semi-structurées à partir de rapports cliniques dérivés de l'OCR, s'attaquant aux défis des représentations de clés hétérogènes et du bruit de l'OCR. Il vise à évaluer la robustesse des modèles dans des scénarios réels pour la découverte de clés, le QA conditionné par les clés et l'extraction de paires clé-valeur.

Information Extraction clinical reports Benchmarking Natural Language Processing

RESEARCHarXiv CS.CL·06/05/2026

Geometric Deviation as an Unsupervised Pre-Generation Reliability Signal: Probing LLM Representations for Answerability

Cette recherche étudie l'utilisation de la déviation géométrique des états cachés des LLM comme signal de pré-génération pour indiquer quand une requête dépasse les connaissances du modèle. Il a été constaté que ce signal fonctionne bien pour les requêtes mathématiques non répondables, mais pas pour les requêtes factuelles.

LLMs research Model Evaluation Reliability

RESEARCHarXiv CS.CL·06/05/2026

How Language Models Process Negation

Cette étude examine comment les grands modèles de langage (LLM) traitent mécaniquement la négation, révélant que même les modèles open-source possèdent des composants internes pour un traitement correct de la négation, malgré leurs erreurs fréquentes. Leur faible précision est attribuée à une attention des couches tardives qui favorise des raccourcis simples, et les modèles mettent en œuvre à la fois l'attention aux phrases niées et la construction directe de représentations de phrases négatives.

LLMs Mechanistic Interpretability attention mechanisms Natural Language Processing

RESEARCHarXiv CS.CL·06/05/2026

S^2tory: Story Spine Distillation for Movie Script Summarization

S^2tory est un cadre d'IA basé sur la narratologie conçu pour la synthèse de scénarios de films, qui aborde la complexité des récits non linéaires en identifiant les "noyaux de l'intrigue" grâce aux trajectoires de développement des personnages. Il utilise un Agent Expert Narratif pour distiller des connaissances, qui conditionne ensuite un modèle pour identifier les points essentiels de l'intrigue afin de générer le résumé.

machine learning narrative AI Natural Language Processing summarization

DOCAndrej Karpathy (YouTube)·20/02/2024

Let's build the GPT Tokenizer

Ce contenu propose un guide pratique pour construire un tokeniseur GPT, détaillant les étapes et les concepts fondamentaux impliqués. Il explore comment les modèles GPT traitent le texte, le convertissant en unités plus petites pour l'analyse.

GPT learning Natural Language Processing tokenizer

DOCfast.ai Blog·20/01/2026

How To Use AI for the Ancient Art of Close Reading

Ce contenu explore comment utiliser l'intelligence artificielle, en particulier les Large Language Models (LLMs), pour la pratique ancienne de la lecture attentive. Il détaille des expériences et des approches pour appliquer l'IA à cette forme d'art traditionnelle.

text analysis LLMs learning Natural Language Processing

How To Use AI for the Ancient Art of Close Reading

RESEARCHarXiv CS.AI·09/04/2026

BDI-Kit Demo: A Toolkit for Programmable and Conversational Data Harmonization

O BDI-Kit é uma ferramenta que aborda a harmonização de dados, superando a heterogeneidade em esquemas e valores. Ele oferece uma API Python para pipelines programáticos e uma interface de chat assistida por IA para especialistas, permitindo explorar, validar e refinar correspondências de dados de forma iterativa.

Data Harmonization Natural Language Processing AI

ARTICLEDEV.to AI·02/05/2026

The Aunty Test - what Bengali-speaking patients see when they ask Health AI in their own language

L'IA de santé conçue principalement en anglais échoue à traiter les requêtes médicales en langues comme le bengali, offrant des conseils inappropriés. En revanche, GoDavaii raisonne nativement dans 22 langues indiennes, fournissant des conseils médicaux précis et culturellement pertinents.

Multilingual AI Healthcare technology AI bias Natural Language Processing

ARTICLEDEV.to AI·02/05/2026

Advances in Multimodal AI: Researchers Develop New Framework for Fusion of Vision and Language

L'IA multimodale, intégrant diverses sources de données telles que la vision et le langage, gagne du terrain grâce à la numérisation croissante et à ses applications variées dans plusieurs secteurs. Cependant, un défi majeur demeure la fusion efficace de types de données disparates avec des exigences de traitement distinctes.

multimodal AI computer vision Natural Language Processing