NLP

124 items

ARTICLEDEV.to AI·25/04/2026

The hidden engine behind the AI Revolution: The Transformer

Le véritable moteur derrière la révolution de l'IA n'est pas ChatGPT, mais l'architecture Transformer, introduite par l'article « Attention Is All You Need ». Cette innovation a permis le traitement parallèle massif du langage, utilisant les GPU et changeant fondamentalement la compréhension des machines.

AI history deep learning Transformer NLP

RESEARCHarXiv CS.AI·15/04/2026

GoodPoint: Learning Constructive Scientific Paper Feedback from Author Responses

Cette recherche présente GoodPoint, une méthode utilisant les LLM et les réponses des auteurs pour générer des retours constructifs pour les articles scientifiques. Elle développe GoodPoint-ICLR, un ensemble de données d'articles ICLR, et une recette d'entraînement utilisant le fine-tuning et l'optimisation des préférences pour des retours valides et exploitables.

LLMs Feedback Generation machine learning NLP

RESEARCHarXiv CS.CL·22/04/2026

Scripts Through Time: A Survey of the Evolving Role of Transliteration in NLP

Cet article explore le rôle de la translittération en PNL, une technique essentielle pour surmonter la "barrière d'écriture" dans le transfert interlinguistique. Il présente une taxonomie des motivations et approches, analysant leur efficacité et leur pertinence pour les LLM modernes dans divers contextes.

Cross-lingual AI language models LLMs NLP

RESEARCHarXiv CS.CL·il y a 29j

TajPersLexon: A Tajik-Persian Lexical Resource and Hybrid Model for Cross-Script Low-Resource NLP

Cette recherche présente TajPersLexon, une ressource lexicale parallèle tadjik-persan de 40 112 paires de mots pour le PNL inter-scripts dans des environnements à faibles ressources. Elle évalue des modèles hybrides, neuronaux et de récupération, démontrant une haute précision pour les bases neuronales et de récupération (98-99%) et un compromis favorable précision-efficacité pour le modèle hybride (96,4%) dans la post-correction OCR.

Lexical resource Cross-script NLP Hybrid model

RESEARCHarXiv CS.CL·il y a 22j

Why are language models less surprised than humans? Testing the Parse Multiplicity Mismatch Hypothesis

Cet article examine pourquoi les modèles linguistiques sont moins « surpris » que les humains lors du traitement de phrases syntaxiquement ambiguës. Il teste l'hypothèse selon laquelle les modèles de langage peuvent considérer simultanément un plus grand nombre d'interprétations de phrases en utilisant les Grammaires de Réseaux Neuronaux Récurrents.

syntactic-ambiguity language models cognitive science NLP

RESEARCHarXiv CS.LG·21/04/2026

Annotation Entropy Predicts Per-Example Learning Dynamics in LoRA Fine-Tuning

Cette recherche révèle que le réglage fin LoRA entraîne un 'désapprentissage' sur des exemples contestés, où un désaccord élevé des annotateurs est corrélé à une perte croissante pendant l'entraînement. Ce phénomène se distingue du réglage fin complet et est observé de manière constante sur divers modèles et ensembles de données.

model training machine learning NLP Fine-tuning

RESEARCHarXiv CS.CL·07/05/2026

The Impact of Vocabulary Overlaps on Knowledge Transfer in Multilingual Machine Translation

Cet article étudie systématiquement l'impact des vocabulaires conjoints et disjoints sur le transfert de connaissances en traduction automatique neuronale multilingue (MNMT). Les expériences montrent que des chevauchements de vocabulaire étendus, la parenté linguistique et la correspondance de domaine entraînent de meilleures performances, même dans des configurations hors domaine.

neural networks knowledge transfer NLP machine translation

RESEARCHarXiv CS.CL·il y a 26j

Differences in Text Generated by Diffusion and Autoregressive Language Models

Cette recherche explore les différences intrinsèques dans le texte généré par les Modèles de Langage à Diffusion (DLM) et les Modèles de Langage Autorégressifs (ARM), constatant que les DLM présentent une entropie n-gramme inférieure mais une cohérence et une diversité sémantiques plus élevées. Des expériences contrôlées révèlent que les objectifs d'entraînement des DLM améliorent la cohérence et la diversité grâce au contexte bidirectionnel, tandis que les algorithmes de décodage sont responsables de la réduction de l'entropie.

Diffusion Models language models NLP text generation

RESEARCHarXiv CS.CL·il y a 6j

On the Persistent Effects of Lexicality in Large Language Mod

Ce travail étudie l'effet persistant du chevauchement lexical, plutôt que du contenu sémantique, sur les représentations extraites des grands modèles linguistiques (LLM) et ses implications. Les auteurs constatent que l'influence lexicale s'étend sur la profondeur des modèles, les architectures et les régimes d'entraînement, y compris pour les modèles entraînés à la similarité sémantique.

LLMs lexicality NLP semantic analysis

RESEARCHarXiv CS.CL·il y a 13j

CroCo: Cross-Lingual Contrastive Preference Tuning on Self-Generations

Ce travail présente CroCo, une méthode de réglage de préférence contrastif interlingue sur les auto-générations de LLM, démontrant un transfert efficace sur 14 langues sans annotation de préférence spécifique. Un modèle de récompense entraîné en anglais produit des classements utiles dans la plupart des langues, améliorant les modèles existants et empêchant l'oubli catastrophique, à condition d'utiliser des données on-policy.

research machine learning NLP multilingual

RESEARCHarXiv CS.CL·il y a 12j

BioELX: Cross-lingual Biomedical Entity Linking via Alias-based Retrieval and LLM Ranking

BioELX est un cadre de liaison d'entités biomédicales translingues en deux étapes qui ne nécessite pas de données d'entraînement annotées spécifiques à la tâche. Il améliore la récupération de candidats à l'aide d'alias multilingues de Wikidata et effectue une désambiguïsation sensible au contexte avec un classificateur LLM pré-entraîné.

Cross-lingual AI Entity Linking NLP Biomedical AI

DOCDEV.to AI·il y a 16j

RAG 시스템 실전 구축 (v18)

Ce document détaille la mise en œuvre pratique des systèmes RAG (Retrieval-Augmented Generation), expliquant leurs concepts fondamentaux et leur boucle de fonctionnement. Il couvre les étapes de récupération, d'augmentation et de génération de contexte pour améliorer les réponses des LLM, y compris le découpage sémantique de documents.

RAG NLP Information Retrieval Generative AI

ARTICLEDEV.to AI·24/04/2026

Layer Normalization — Deep Dive + Problem: Largest Connected Region

Ce contenu propose une exploration approfondie de la Normalisation de Couche, un composant essentiel de l'Architecture Transformer. Il détaille son importance pour stabiliser l'entraînement et améliorer les performances des grands modèles linguistiques (LLM), tirant son origine du document "Attention is All You Need".

Transformer Architecture LLMs deep learning NLP

ARTICLEDEV.to AI·il y a 8j

AI debt sales reshape global corporate bond markets

L'intégration de l'IA dans les ventes de dettes est sur le point de modifier considérablement les marchés mondiaux des obligations d'entreprise, grâce à la capacité des systèmes d'IA à analyser de vastes quantités de données et à faire des prévisions précises. Les plateformes de vente de dettes basées sur l'IA exploitent des algorithmes d'apprentissage automatique et le traitement du langage naturel pour évaluer la solvabilité et identifier les risques et les opportunités.

Finance Debt Markets machine learning NLP

ARTICLEDEV.to AI·27/04/2026

Epismo Agent Package

L'analyse technique du package d'agents Epismo détaille une solution innovante pour créer des humains numériques alimentés par l'IA, destinés au service client, au divertissement et à l'éducation. Son architecture de microservices intègre le traitement du langage naturel, l'apprentissage automatique et la vision par ordinateur, gérés par un Cœur d'Agent et un Graphe de Connaissance.

digital humans computer vision NLP ML

RESEARCHarXiv CS.CL·21/04/2026

QU-NLP at QIAS 2026: Multi-Stage QLoRA Fine-Tuning for Arabic Islamic Inheritance Reasoning

L'article décrit la stratégie de fine-tuning QLoRA multi-étapes de QU-NLP pour le raisonnement d'héritage islamique en arabe, en utilisant Qwen3-4B. Le modèle a atteint un score MIR-E de 90%, montrant des performances compétitives avec des ressources informatiques minimales.

LLMs Legal AI Arabic AI NLP

DOCDEV.to AI·il y a 20j

92. BERT: The Model That Reads in Both Directions

BERT se distingue de GPT par sa capacité de lecture bidirectionnelle, prédisant des mots masqués plutôt que séquentiels. Cette compréhension contextuelle complète l'a rendu dominant dans les benchmarks PNL et une pierre angulaire pour les tâches de compréhension. Le contenu détaille les mécanismes de pré-entraînement et les techniques de réglage fin de BERT.

BERT GPT machine learning NLP

ARTICLEDEV.to AI·il y a 26j

NLP Video Editing Copilot

Cutting Room AI est une application de bureau Windows autonome qui permet aux utilisateurs de DaVinci Resolve Studio de contrôler leur timeline avec un langage simple. Elle traduit des commandes en anglais clair en appels API de script, permettant de modifier les propriétés des clips et d'effectuer des opérations de piste sans connaissance en scripting.

desktop app NLP DaVinci Resolve AI tools

DOCDEV.to AI·il y a 26j

Spellar 3.0

Spellar 3.0 est une plateforme d'apprentissage des langues pilotée par l'IA, offrant des instructions et des retours personnalisés. Son architecture technique comprend un frontend React, un backend Node.js avec PostgreSQL et un moteur PNL capable d'analyser les saisies utilisateur multilingues.

gamification learning language learning AI platform

ARTICLEDEV.to AI·27/04/2026

Building Smart Fairness Analyzer: An AI-Powered Bias Detection App with MongoDB & NLP

Ce projet présente le Smart Fairness Analyzer, une plateforme développée pour détecter et auditer en temps réel les biais de genre, raciaux, d'âge et socioéconomiques dans les réponses de l'IA. L'outil utilise des métriques académiques d'équité en ML et stocke les pistes d'audit complètes dans MongoDB pour analyse.

ethics bias detection machine learning AI fairness