natural language processing

167 items

RESEARCHarXiv CS.CL·il y a 7j

DraDDP: A Multimodal Multi-Party Dialogue Discourse Parsing Dataset

Cet article introduit DraDDP, le premier ensemble de données multimodal anglais publiquement disponible pour l'analyse du discours de dialogue multipartite, basé sur des drames télévisés américains. Il contient 495 segments de dialogue et démontre la valeur des informations multimodales pour capturer les structures de dialogue et les types de relations.

Dataset Dialogue Parsing multimodal AI natural language processing

RESEARCHarXiv CS.CL·06/04/2026

Dependency-Guided Parallel Decoding in Discrete Diffusion Language Models

Modelos de linguagem de difusão discreta (dLLMs) aceleram a geração de texto, mas a decodificação paralela degrada a qualidade ao desconsiderar a dependência entre tokens. DEMASK propõe um preditor leve que estima influências condicionais para guiar o desmascaramento simultâneo, comprovadamente melhorando a qualidade. A técnica resulta em um ganho de velocidade de 1.7 a 2.2x, mantendo ou superando o desempenho.

Dependency Prediction DEMASK Parallel Decoding machine learning

RESEARCHarXiv CS.CL·il y a 4j

Multi-Granularity Reasoning for Natural Language Inference

L'article propose un nouveau Réseau de Raisonnement Multi-Granularité (MGRN) pour l'Inférence en Langage Naturel (NLI). Il aborde les limites des modèles existants basés sur des transformateurs en exploitant des caractéristiques sémantiques hiérarchiques pour capturer des interactions complexes et un raisonnement efficace.

deep learning Natural Language Inference machine learning natural language processing

RESEARCHarXiv CS.CL·il y a 4j

Efficient Punctuation Restoration via Weighted Lookahead Scoring Method for Streaming ASR Systems

Cet article propose une méthode de notation non autorégressive pour la restauration efficace de la ponctuation dans les systèmes de Reconnaissance Automatique de la Parole (ASR) en streaming. Elle compare les hypothèses d'insertion de ponctuation à une référence sans insertion, en utilisant une anticipation limitée, et surpasse les méthodes basées sur des invites.

machine learning natural language processing Automatic Speech Recognition

RESEARCHDEV.to AI·il y a 22j

Solving Math Word Problems by Combining Language Models With Symbolic Solvers

Cette recherche explore une approche novatrice pour résoudre les problèmes mathématiques textuels en combinant la puissance des modèles de langage avec la précision des solveurs symboliques. La méthode vise à tirer parti de la compréhension du langage naturel et du raisonnement mathématique formel pour obtenir des solutions robustes.

mathematical reasoning Symbolic AI natural language processing problem-solving

DOCDEV.to AI·02/05/2026

Automating Your Literature Review: A Practical AI Approach

Ce contenu explique comment l'automatisation par l'IA peut rationaliser les revues de littérature, transformant l'extraction de données de PDF en un processus simplifié et moins sujet aux erreurs. Il souligne l'importance d'une boucle de raffinage itérative et présente la bibliothèque open-source GROBID pour l'extraction structurée de données académiques.

research Data Extraction natural language processing AI

ARTICLEDEV.to AI·23/04/2026

How to Cross-Examination in a Click: Finding Inconsistencies Across Witness Statements

Ce contenu explique comment l'IA peut automatiser la recherche d'incohérences entre plusieurs déclarations de témoins pour le contre-interrogatoire juridique. La méthode consiste à passer de la seule résumé de documents à une analyse comparative unifiée par l'alignement d'entités et d'événements.

AI applications Document analysis natural language processing legal tech

DOCAWS Machine Learning Blog·il y a 19j

Integrating AWS API MCP Server with Amazon Quick using Amazon Bedrock AgentCore Runtime

Cet article explique comment intégrer Amazon Quick aux services AWS en utilisant le support du protocole de contexte de modèle (MCP) d'Amazon Bedrock AgentCore Runtime. Il montre comment créer un assistant IA conversationnel qui traduit le langage naturel en commandes AWS CLI, rationalisant ainsi les opérations.

integration natural language processing Amazon Bedrock AWS

RESEARCHarXiv CS.AI·15/04/2026

Narrative-Driven Paper-to-Slide Generation via ArcDeck

ArcDeck est un framework d'IA multi-agent qui génère des diapositives à partir d'articles académiques en modélisant explicitement le flux logique et la structure narrative du texte. Il utilise un arbre de discours et un processus de raffinement itératif basé sur des agents pour assurer la cohérence, montrant des améliorations significatives dans les présentations générées.

paper-to-slide generation natural language processing academic presentations AI

RESEARCHarXiv CS.CL·23/04/2026

OThink-SRR1: Search, Refine and Reasoning with Reinforced Learning for Large Language Models

OThink-SRR1 est un cadre qui améliore les LLMs avec un processus itératif de Recherche-Affinement-Raisonnement entraîné par apprentissage par renforcement. Il résout les défis du RAG en distillant des faits pertinents à partir de documents récupérés, améliorant l'efficacité et la précision du QA multi-saut complexe.

multi-hop-qa LLMs reinforcement learning RAG

RESEARCHarXiv CS.CL·il y a 19j

Long-Context Reasoning Through Proxy-Based Chain-of-Thought Tuning

Malgré la prise en charge d'entrées étendues, les grands modèles linguistiques ont des performances médiocres sur les tâches de raisonnement à contexte long. ProxyCoT est un nouveau cadre d'entraînement qui transfère les capacités de raisonnement des contextes proxy courts aux contextes longs complets, surpassant les références solides.

machine learning natural language processing Reasoning large language models

RESEARCHarXiv CS.CL·il y a 6j

Fixing FOLIO and MALLS: Verified Annotations and an LLM-assisted Framework to Focus Human Relabeling

Une inspection systématique des divisions de validation de extsf{FOLIO} et extsf{MALLS} a révélé des taux élevés de formalisations FOL incorrectes et de phrases NL ambiguës, faussant l'évaluation des modèles d'IA. Les auteurs ont développé et publié des vérités fondamentales corrigées pour ces ensembles de données, démontrant l'impact des erreurs d'annotation sur l'évaluation des LLM de pointe.

LLMs Neurosymbolic AI natural language processing Benchmarks

ARTICLEDEV.to AI·il y a 15j

Origin Part 12: The Adapter

Cet article décrit un problème rencontré lors du déploiement d'un nouvel encodeur d'IA qui, malgré une amélioration significative de l'identification des concepts, a rompu toutes les réponses. Il détaille le rôle du "Dispatcher" dans le système Origin, agissant comme intermédiaire entre l'encodeur et la réponse, traitant les activations de concepts pour déterminer les actions appropriées.

natural language processing Debugging system architecture AI development

DOCDEV.to AI·il y a 6j

Email Spam Classifier with Streamlit and Docker

Ce guide décrit un pipeline complet d'apprentissage automatique pour la classification des spams par e-mail. Il compare les modèles Naive Bayes et RoBERTa, visualise avec Streamlit et déploie avec Docker.

Docker Streamlit machine learning natural language processing

RESEARCHarXiv CS.CL·01/05/2026

Targeted Linguistic Analysis of Sign Language Models with Minimal Translation Pairs

L'article introduit ASL-MTP, un nouveau jeu de données de référence pour analyser comment les modèles de langue des signes saisissent les phénomènes linguistiques et utilisent des indices multi-articulatoires. Il utilise ce jeu de données pour une analyse linguistique ciblée d'un modèle de traduction ASL-vers-anglais de pointe.

machine learning Sign Language AI Benchmarking natural language processing

RESEARCHarXiv CS.CL·il y a 22j

Greedy or not, here I come: Language production under vocabulary constraints in humans and resource-rational models

Cette recherche explore comment les humains communiquent avec des vocabulaires limités, comparant leurs stratégies à des algorithmes d'échantillonnage computationnel alimentés par de grands modèles linguistiques. L'étude révèle que la production linguistique humaine sous contrainte reflète souvent l'échantillonnage glouton, bien que les individus plus compétents présentent des comportements de révision non gloutons.

cognitive science human behavior language production natural language processing

RESEARCHarXiv CS.CL·il y a 22j

Fluency and Faithfulness in Human and Machine Literary Translation

Cette étude analyse l'équilibre entre fluidité et fidélité dans la traduction littéraire, comparant les traductions humaines, Google Translate et TranslateGemma de 106 romans dans 16 langues. Elle révèle une corrélation négative constante entre fluidité et fidélité, notée pour les traductions humaines et Google Translate, et indique que la longueur des segments influence l'évaluation automatique.

Literary Translation Translation Evaluation natural language processing machine translation

RESEARCHarXiv CS.CL·il y a 15j

Learnability-Informed Fine-Tuning of Diffusion Language Models

Cette recherche présente LIFT, un algorithme de "fine-tuning" informé par l'apprenabilité, conçu pour améliorer les capacités de raisonnement des modèles de langage de diffusion. LIFT corrige les lacunes du SFT standard en apprenant les tokens de manière adaptative en fonction de leur difficulté et du contexte disponible à différentes étapes temporelles de diffusion, démontrant une performance améliorée.

Diffusion Models learning machine learning natural language processing

ARTICLEDEV.to AI·01/05/2026

From Mumbles to Memos: Teaching AI to Decipher Technician Voice Notes

Cet article aborde le goulot d'étranglement de productivité causé par le déchiffrage manuel des notes vocales des techniciens, proposant l'IA comme solution pour transformer les enregistrements de terrain en résumés professionnels. Il décrit une méthodologie, le 'Actionable Framework: The 3-Part Jargon List', pour entraîner l'IA à catégoriser des informations spécifiques à partir d'audio non structuré.

workflow automation AI training productivity natural language processing

RESEARCHarXiv CS.AI·06/04/2026

Competency Questions as Executable Plans: a Controlled RAG Architecture for Cultural Heritage Storytelling

Este conteúdo apresenta uma arquitetura RAG (Retrieval Augmented Generation) controlada que utiliza perguntas de competência como planos executáveis. O objetivo é aplicar essa metodologia para a criação de narrativas no campo do patrimônio cultural.

cultural heritage storytelling natural language processing AI