← heapsort-ai

Natural Language Processing

168 items

RESEARCHarXiv CS.CL·20/04/2026

DALM: A Domain-Algebraic Language Model via Three-Phase Structured Generation

DALM (Domain-Algebraic Language Model) est proposé pour résoudre l'interférence de connaissances dans les LLM en remplaçant la génération de jetons non contrainte par un dénoisement structuré sur un treillis de domaines. Il suit un chemin de génération en trois phases (incertitude de domaine, de relation et de concept) sous des contraintes algébriques explicites, empêchant la contamination inter-domaine.

27
RESEARCHarXiv CS.CL·17/04/2026

Hierarchical Retrieval Augmented Generation for Adversarial Technique Annotation in Cyber Threat Intelligence Text

Cet article présente H-TechniqueRAG, un nouveau cadre hiérarchique de Génération Augmentée par Récupération (RAG) pour l'annotation des techniques adverses dans le texte de Cyber Threat Intelligence (CTI). Il corrige la limitation des approches RAG plates en injectant la taxonomie inhérente tactique-technique du MITRE ATT&CK via un mécanisme de récupération en deux étapes.

27
RESEARCHarXiv CS.CL·22/04/2026

Syntax as a Rosetta Stone: Universal Dependencies for In-Context Coptic Translation

Cet article propose une nouvelle approche d'apprentissage en contexte pour la traduction automatique du copte vers l'anglais à faibles ressources, en augmentant les entrées avec des informations syntaxiques issues des analyses de Dépendances Universelles. La combinaison de ces données syntaxiques avec des glossaires basés sur des dictionnaires permet des gains significatifs et établit un nouvel état de l'art.

27
RESEARCHarXiv CS.CL·22/04/2026

Probing for Reading Times

Cette recherche examine les représentations des modèles de langage pour les temps de lecture humains à travers cinq langues, en les comparant à des prédicteurs scalaires. Les couches initiales des modèles surpassent le facteur de surprise dans la prédiction des mesures de lecture de premier passage, suggérant un alignement fonctionnel entre la profondeur du modèle et les étapes temporelles de la lecture humaine.

27
RESEARCHDEV.to AI·21/04/2026

Improving Video-Text Retrieval by Multi-Stream Corpus Alignment and Dual SoftmaxLoss

Cette recherche propose une méthode innovante pour améliorer la récupération vidéo-texte en intégrant l'alignement de corpus multi-flux. Elle introduit également une fonction Dual SoftmaxLoss pour optimiser davantage la précision et l'efficacité de la correspondance entre le contenu vidéo et les descriptions textuelles.

27
NEWSDEV.to AI·il y a 29j

We gave actual claws to Openclaw agent and it flies a drone now

Un agent Openclaw, récemment devenu viral pour avoir contrôlé un drone avec une invite en langage naturel, peut désormais piloter des drones de manière autonome via Mavlink sur Dimensional. Ce développement open source permet à l'agent de gérer la perception, le suivi et le contrôle de vol à partir d'une seule requête en langage naturel.

27
RESEARCHarXiv CS.CL·13/04/2026

Uncertainty Estimation for the Open-Set Text Classification systems

Cet article porte sur l'estimation précise de l'incertitude pour les systèmes de classification de texte en ensemble ouvert (OSTC), où les échantillons de texte peuvent être classés dans des catégories existantes ou rejetés comme inconnus. Il adapte la méthode Holistic Uncertainty Estimation (HolUE) au domaine du texte pour capturer les incertitudes textuelles et de la galerie, et propose un nouveau benchmark OSTC.

27
RESEARCHarXiv CS.AI·il y a 29j

More Thinking, More Bias: Length-Driven Position Bias in Reasoning Models

Une nouvelle recherche indique que le biais de position dans les modèles de raisonnement, tels que Chain-of-thought, augmente avec la longueur de la trajectoire de raisonnement. Cet effet a été observé dans diverses configurations de modèles et benchmarks, suggérant que « penser davantage » peut exacerber certains biais.

27
RESEARCHarXiv CS.CL·il y a 21j

SKG-Eval: Stateful Evaluation of Multi-Turn Dialogue via Incremental Semantic Knowledge Graphs

SKG-Eval s'attaque au défi de l'évaluation des systèmes de dialogue multi-tour en modélisant le dialogue comme un Graphe de Connaissance Sémantique (SKG) évolutif. Ce cadre met à jour le graphe de manière incrémentale par l'extraction de triplets structurés pour détecter des problèmes à long terme tels que la contradiction et l'incohérence, offrant une évaluation améliorée au-delà des représentations isolées par tour.

27
RESEARCHarXiv CS.CL·il y a 7j

Cognitive-Linguistic Indicators of Depression in Online Communities: Analysed by DistilBERT and Holographic Reduced Representation

Cet article étudie si la combinaison de caractéristiques linguistiques fondées sur la cognition avec des embeddings basés sur des transformeurs améliore la détection automatisée de la dépression dans les textes en ligne. L'étude compare un modèle de référence TF-IDF avec un modèle hybride DistilBERT HRR, montrant que ce dernier atteint un score F1 macro significativement plus élevé de 0.94.

27
RESEARCHDEV.to AI·il y a 26j

Generative Simulation Benchmarking for heritage language revitalization programs for extreme data sparsity scenarios

Le texte aborde le défi de construire des modèles linguistiques pour des langues patrimoniales en danger critique avec une extrême rareté de données. L'auteur relate son expérience personnelle avec un ensemble de données minuscule pour une langue comme le Halkomelem, soulignant la nécessité de nouvelles approches pour de tels scénarios.

27
CASEAWS Machine Learning Blog·il y a 12j

Training Azerbaijani language models on Amazon SageMaker AI

Azercell Telecom s'est associée à l'AWS Generative AI Innovation Center pour développer un grand modèle linguistique (LLM) azéri sur Amazon SageMaker AI. Cette collaboration de six semaines a permis d'établir un cadre prêt pour la production pour des cas d'utilisation en télécommunications et un chatbot, surmontant les défis de la rareté des données et de la complexité linguistique.

27
NEWSDEV.to AI·19/04/2026

Claude Code's Playwright MCP Server: Generate Web Tests from Natural Language

Claude Code s'intègre désormais à Playwright via un serveur MCP dédié, permettant de générer une automatisation complète des tests à partir d'invites en langage naturel. Ce pont direct permet aux développeurs de décrire des scénarios de test, que Claude écrive et exécute le code Playwright, et rapporte les résultats, le tout dans le terminal.

27