← heapsort-ai

natural language processing

167 items

RESEARCHarXiv CS.CL·il y a 7j

DraDDP: A Multimodal Multi-Party Dialogue Discourse Parsing Dataset

Cet article introduit DraDDP, le premier ensemble de données multimodal anglais publiquement disponible pour l'analyse du discours de dialogue multipartite, basé sur des drames télévisés américains. Il contient 495 segments de dialogue et démontre la valeur des informations multimodales pour capturer les structures de dialogue et les types de relations.

29
RESEARCHarXiv CS.CL·06/04/2026

Dependency-Guided Parallel Decoding in Discrete Diffusion Language Models

Modelos de linguagem de difusão discreta (dLLMs) aceleram a geração de texto, mas a decodificação paralela degrada a qualidade ao desconsiderar a dependência entre tokens. DEMASK propõe um preditor leve que estima influências condicionais para guiar o desmascaramento simultâneo, comprovadamente melhorando a qualidade. A técnica resulta em um ganho de velocidade de 1.7 a 2.2x, mantendo ou superando o desempenho.

29
RESEARCHarXiv CS.CL·il y a 4j

Multi-Granularity Reasoning for Natural Language Inference

L'article propose un nouveau Réseau de Raisonnement Multi-Granularité (MGRN) pour l'Inférence en Langage Naturel (NLI). Il aborde les limites des modèles existants basés sur des transformateurs en exploitant des caractéristiques sémantiques hiérarchiques pour capturer des interactions complexes et un raisonnement efficace.

28
RESEARCHarXiv CS.CL·il y a 4j

Efficient Punctuation Restoration via Weighted Lookahead Scoring Method for Streaming ASR Systems

Cet article propose une méthode de notation non autorégressive pour la restauration efficace de la ponctuation dans les systèmes de Reconnaissance Automatique de la Parole (ASR) en streaming. Elle compare les hypothèses d'insertion de ponctuation à une référence sans insertion, en utilisant une anticipation limitée, et surpasse les méthodes basées sur des invites.

28
RESEARCHDEV.to AI·il y a 22j

Solving Math Word Problems by Combining Language Models With Symbolic Solvers

Cette recherche explore une approche novatrice pour résoudre les problèmes mathématiques textuels en combinant la puissance des modèles de langage avec la précision des solveurs symboliques. La méthode vise à tirer parti de la compréhension du langage naturel et du raisonnement mathématique formel pour obtenir des solutions robustes.

28
DOCDEV.to AI·02/05/2026

Automating Your Literature Review: A Practical AI Approach

Ce contenu explique comment l'automatisation par l'IA peut rationaliser les revues de littérature, transformant l'extraction de données de PDF en un processus simplifié et moins sujet aux erreurs. Il souligne l'importance d'une boucle de raffinage itérative et présente la bibliothèque open-source GROBID pour l'extraction structurée de données académiques.

28
DOCAWS Machine Learning Blog·il y a 19j

Integrating AWS API MCP Server with Amazon Quick using Amazon Bedrock AgentCore Runtime

Cet article explique comment intégrer Amazon Quick aux services AWS en utilisant le support du protocole de contexte de modèle (MCP) d'Amazon Bedrock AgentCore Runtime. Il montre comment créer un assistant IA conversationnel qui traduit le langage naturel en commandes AWS CLI, rationalisant ainsi les opérations.

28
RESEARCHarXiv CS.AI·15/04/2026

Narrative-Driven Paper-to-Slide Generation via ArcDeck

ArcDeck est un framework d'IA multi-agent qui génère des diapositives à partir d'articles académiques en modélisant explicitement le flux logique et la structure narrative du texte. Il utilise un arbre de discours et un processus de raffinement itératif basé sur des agents pour assurer la cohérence, montrant des améliorations significatives dans les présentations générées.

28
RESEARCHarXiv CS.CL·il y a 19j

Long-Context Reasoning Through Proxy-Based Chain-of-Thought Tuning

Malgré la prise en charge d'entrées étendues, les grands modèles linguistiques ont des performances médiocres sur les tâches de raisonnement à contexte long. ProxyCoT est un nouveau cadre d'entraînement qui transfère les capacités de raisonnement des contextes proxy courts aux contextes longs complets, surpassant les références solides.

28
RESEARCHarXiv CS.CL·il y a 6j

Fixing FOLIO and MALLS: Verified Annotations and an LLM-assisted Framework to Focus Human Relabeling

Une inspection systématique des divisions de validation de extsf{FOLIO} et extsf{MALLS} a révélé des taux élevés de formalisations FOL incorrectes et de phrases NL ambiguës, faussant l'évaluation des modèles d'IA. Les auteurs ont développé et publié des vérités fondamentales corrigées pour ces ensembles de données, démontrant l'impact des erreurs d'annotation sur l'évaluation des LLM de pointe.

28
ARTICLEDEV.to AI·il y a 15j

Origin Part 12: The Adapter

Cet article décrit un problème rencontré lors du déploiement d'un nouvel encodeur d'IA qui, malgré une amélioration significative de l'identification des concepts, a rompu toutes les réponses. Il détaille le rôle du "Dispatcher" dans le système Origin, agissant comme intermédiaire entre l'encodeur et la réponse, traitant les activations de concepts pour déterminer les actions appropriées.

28
RESEARCHarXiv CS.CL·01/05/2026

Targeted Linguistic Analysis of Sign Language Models with Minimal Translation Pairs

L'article introduit ASL-MTP, un nouveau jeu de données de référence pour analyser comment les modèles de langue des signes saisissent les phénomènes linguistiques et utilisent des indices multi-articulatoires. Il utilise ce jeu de données pour une analyse linguistique ciblée d'un modèle de traduction ASL-vers-anglais de pointe.

28
RESEARCHarXiv CS.CL·il y a 22j

Greedy or not, here I come: Language production under vocabulary constraints in humans and resource-rational models

Cette recherche explore comment les humains communiquent avec des vocabulaires limités, comparant leurs stratégies à des algorithmes d'échantillonnage computationnel alimentés par de grands modèles linguistiques. L'étude révèle que la production linguistique humaine sous contrainte reflète souvent l'échantillonnage glouton, bien que les individus plus compétents présentent des comportements de révision non gloutons.

28
RESEARCHarXiv CS.CL·il y a 22j

Fluency and Faithfulness in Human and Machine Literary Translation

Cette étude analyse l'équilibre entre fluidité et fidélité dans la traduction littéraire, comparant les traductions humaines, Google Translate et TranslateGemma de 106 romans dans 16 langues. Elle révèle une corrélation négative constante entre fluidité et fidélité, notée pour les traductions humaines et Google Translate, et indique que la longueur des segments influence l'évaluation automatique.

28
RESEARCHarXiv CS.CL·il y a 15j

Learnability-Informed Fine-Tuning of Diffusion Language Models

Cette recherche présente LIFT, un algorithme de "fine-tuning" informé par l'apprenabilité, conçu pour améliorer les capacités de raisonnement des modèles de langage de diffusion. LIFT corrige les lacunes du SFT standard en apprenant les tokens de manière adaptative en fonction de leur difficulté et du contexte disponible à différentes étapes temporelles de diffusion, démontrant une performance améliorée.

28
ARTICLEDEV.to AI·01/05/2026

From Mumbles to Memos: Teaching AI to Decipher Technician Voice Notes

Cet article aborde le goulot d'étranglement de productivité causé par le déchiffrage manuel des notes vocales des techniciens, proposant l'IA comme solution pour transformer les enregistrements de terrain en résumés professionnels. Il décrit une méthodologie, le 'Actionable Framework: The 3-Part Jargon List', pour entraîner l'IA à catégoriser des informations spécifiques à partir d'audio non structuré.

27