Natural Language Processing

168 items

RESEARCHarXiv CS.CL·20/04/2026

DALM: A Domain-Algebraic Language Model via Three-Phase Structured Generation

DALM (Domain-Algebraic Language Model) est proposé pour résoudre l'interférence de connaissances dans les LLM en remplaçant la génération de jetons non contrainte par un dénoisement structuré sur un treillis de domaines. Il suit un chemin de génération en trois phases (incertitude de domaine, de relation et de concept) sous des contraintes algébriques explicites, empêchant la contamination inter-domaine.

language models machine learning Natural Language Processing AI Research

RESEARCHarXiv CS.CL·17/04/2026

Hierarchical Retrieval Augmented Generation for Adversarial Technique Annotation in Cyber Threat Intelligence Text

Cet article présente H-TechniqueRAG, un nouveau cadre hiérarchique de Génération Augmentée par Récupération (RAG) pour l'annotation des techniques adverses dans le texte de Cyber Threat Intelligence (CTI). Il corrige la limitation des approches RAG plates en injectant la taxonomie inhérente tactique-technique du MITRE ATT&CK via un mécanisme de récupération en deux étapes.

cybersecurity RAG Natural Language Processing MITRE ATT&CK

RESEARCHarXiv CS.CL·22/04/2026

Syntax as a Rosetta Stone: Universal Dependencies for In-Context Coptic Translation

Cet article propose une nouvelle approche d'apprentissage en contexte pour la traduction automatique du copte vers l'anglais à faibles ressources, en augmentant les entrées avec des informations syntaxiques issues des analyses de Dépendances Universelles. La combinaison de ces données syntaxiques avec des glossaires basés sur des dictionnaires permet des gains significatifs et établit un nouvel état de l'art.

universal-dependencies Natural Language Processing machine translation in-context learning

RESEARCHarXiv CS.CL·22/04/2026

Probing for Reading Times

Cette recherche examine les représentations des modèles de langage pour les temps de lecture humains à travers cinq langues, en les comparant à des prédicteurs scalaires. Les couches initiales des modèles surpassent le facteur de surprise dans la prédiction des mesures de lecture de premier passage, suggérant un alignement fonctionnel entre la profondeur du modèle et les étapes temporelles de la lecture humaine.

language models human-computer interaction cognitive science Natural Language Processing

RESEARCHDEV.to AI·21/04/2026

Improving Video-Text Retrieval by Multi-Stream Corpus Alignment and Dual SoftmaxLoss

Cette recherche propose une méthode innovante pour améliorer la récupération vidéo-texte en intégrant l'alignement de corpus multi-flux. Elle introduit également une fonction Dual SoftmaxLoss pour optimiser davantage la précision et l'efficacité de la correspondance entre le contenu vidéo et les descriptions textuelles.

machine learning computer vision Natural Language Processing Information Retrieval

DOCDEV.to AI·il y a 6j

Email Spam Classifier with Streamlit and Docker

Ce guide décrit un pipeline complet d'apprentissage automatique pour la classification des spams par e-mail. Il compare les modèles Naive Bayes et RoBERTa, visualise avec Streamlit et déploie avec Docker.

Docker Streamlit machine learning Natural Language Processing

NEWSDEV.to AI·il y a 29j

We gave actual claws to Openclaw agent and it flies a drone now

Un agent Openclaw, récemment devenu viral pour avoir contrôlé un drone avec une invite en langage naturel, peut désormais piloter des drones de manière autonome via Mavlink sur Dimensional. Ce développement open source permet à l'agent de gérer la perception, le suivi et le contrôle de vol à partir d'une seule requête en langage naturel.

Open Source Autonomous systems Natural Language Processing robotics

RESEARCHarXiv CS.CL·13/04/2026

Uncertainty Estimation for the Open-Set Text Classification systems

Cet article porte sur l'estimation précise de l'incertitude pour les systèmes de classification de texte en ensemble ouvert (OSTC), où les échantillons de texte peuvent être classés dans des catégories existantes ou rejetés comme inconnus. Il adapte la méthode Holistic Uncertainty Estimation (HolUE) au domaine du texte pour capturer les incertitudes textuelles et de la galerie, et propose un nouveau benchmark OSTC.

machine learning Natural Language Processing trustworthy AI Uncertainty Estimation

RESEARCHarXiv CS.AI·il y a 29j

More Thinking, More Bias: Length-Driven Position Bias in Reasoning Models

Une nouvelle recherche indique que le biais de position dans les modèles de raisonnement, tels que Chain-of-thought, augmente avec la longueur de la trajectoire de raisonnement. Cet effet a été observé dans diverses configurations de modèles et benchmarks, suggérant que « penser davantage » peut exacerber certains biais.

AI bias Natural Language Processing reasoning models Machine learning research

RESEARCHarXiv CS.CL·il y a 21j

SKG-Eval: Stateful Evaluation of Multi-Turn Dialogue via Incremental Semantic Knowledge Graphs

SKG-Eval s'attaque au défi de l'évaluation des systèmes de dialogue multi-tour en modélisant le dialogue comme un Graphe de Connaissance Sémantique (SKG) évolutif. Ce cadre met à jour le graphe de manière incrémentale par l'extraction de triplets structurés pour détecter des problèmes à long terme tels que la contradiction et l'incohérence, offrant une évaluation améliorée au-delà des représentations isolées par tour.

Knowledge Graphs Natural Language Processing Evaluation Metrics dialogue systems

RESEARCHarXiv CS.CL·il y a 7j

Cognitive-Linguistic Indicators of Depression in Online Communities: Analysed by DistilBERT and Holographic Reduced Representation

Cet article étudie si la combinaison de caractéristiques linguistiques fondées sur la cognition avec des embeddings basés sur des transformeurs améliore la détection automatisée de la dépression dans les textes en ligne. L'étude compare un modèle de référence TF-IDF avec un modèle hybride DistilBERT HRR, montrant que ce dernier atteint un score F1 macro significativement plus élevé de 0.94.

online-communities depression detection machine learning Natural Language Processing

ARTICLEDEV.to AI·07/05/2026

The Transformer: The Architecture Behind Modern AI

L'architecture Transformer, introduite par Vaswani en 2017, a marqué un changement pivot dans l'IA, passant du traitement séquentiel à la compréhension parallèle grâce à son mécanisme d'attention. Cette innovation permet aux modèles de traiter le sens et le contexte simultanément, similaire à penser directement dans une langue.

AI architecture Attention Mechanism Transformer machine learning

RESEARCHDEV.to AI·il y a 25j

A Survey on Gender Bias in Natural Language Processing

Une étude sur le biais de genre en traitement du langage naturel analyse comment les stéréotypes de genre sont perpétués dans les modèles d'IA. L'étude discute des méthodes pour atténuer ces biais et explore les défis liés à la création de systèmes de PNL plus équitables.

AI bias Natural Language Processing AI ethics gender bias

ARTICLEDEV.to AI·il y a 23j

Understanding How ChatGPT Generates Images: A Deep Dive into AI Creativity

Cet article explore comment ChatGPT contribue à la génération d'images, les technologies sous-jacentes et les implications pour les développeurs, artistes et entreprises. La capacité de créer des visuels à partir de descriptions textuelles rationalise les processus et démocratise l'art, améliorant la productivité.

AI Creativity ChatGPT image generation Natural Language Processing

RESEARCHDEV.to AI·01/05/2026

Deep Dyna-Q: Integrating Planning for Task-Completion Dialogue Policy Learning

Ce contenu présente Deep Dyna-Q, une approche qui intègre la planification pour l'apprentissage des politiques de dialogue dans les systèmes de conversation basés sur l'IA. L'objectif est d'optimiser le processus d'achèvement des tâches via l'interaction dialoguée avec l'IA.

reinforcement learning Natural Language Processing AI algorithms dialogue systems

RESEARCHDEV.to AI·27/04/2026

Using WordNet to Complement Training Information in Text Categorization

Ce contenu examine l'application de WordNet pour compléter les informations d'entraînement dans la catégorisation de texte. Il vise à exploiter les données sémantiques de WordNet pour améliorer la performance et la précision des modèles de classification textuelle.

Text Categorization machine learning Natural Language Processing WordNet

RESEARCHDEV.to AI·il y a 26j

Generative Simulation Benchmarking for heritage language revitalization programs for extreme data sparsity scenarios

Le texte aborde le défi de construire des modèles linguistiques pour des langues patrimoniales en danger critique avec une extrême rareté de données. L'auteur relate son expérience personnelle avec un ensemble de données minuscule pour une langue comme le Halkomelem, soulignant la nécessité de nouvelles approches pour de tels scénarios.

language models Natural Language Processing Data Sparsity endangered languages

CASEAWS Machine Learning Blog·il y a 12j

Training Azerbaijani language models on Amazon SageMaker AI

Azercell Telecom s'est associée à l'AWS Generative AI Innovation Center pour développer un grand modèle linguistique (LLM) azéri sur Amazon SageMaker AI. Cette collaboration de six semaines a permis d'établir un cadre prêt pour la production pour des cas d'utilisation en télécommunications et un chatbot, surmontant les défis de la rareté des données et de la complexité linguistique.

Telecommunications Natural Language Processing Amazon SageMaker Generative AI

RESEARCHDEV.to AI·25/04/2026

JSUT corpus: free large-scale Japanese speech corpus for end-to-end speechsynthesis

Le corpus JSUT est un ensemble de données de parole japonais gratuit et à grande échelle, conçu pour la recherche en synthèse vocale de bout en bout. Il fournit des ressources précieuses pour le développement de modèles d'IA avancés dans la technologie de la parole pour la langue japonaise.

japanese language speech synthesis machine learning Natural Language Processing

NEWSDEV.to AI·19/04/2026

Claude Code's Playwright MCP Server: Generate Web Tests from Natural Language

Claude Code s'intègre désormais à Playwright via un serveur MCP dédié, permettant de générer une automatisation complète des tests à partir d'invites en langage naturel. Ce pont direct permet aux développeurs de décrire des scénarios de test, que Claude écrive et exécute le code Playwright, et rapporte les résultats, le tout dans le terminal.

Claude Code Natural Language Processing Playwright AI