← heapsort-ai

NLP

124 items

RESEARCHarXiv CS.AI·15/04/2026

GoodPoint: Learning Constructive Scientific Paper Feedback from Author Responses

Cette recherche présente GoodPoint, une méthode utilisant les LLM et les réponses des auteurs pour générer des retours constructifs pour les articles scientifiques. Elle développe GoodPoint-ICLR, un ensemble de données d'articles ICLR, et une recette d'entraînement utilisant le fine-tuning et l'optimisation des préférences pour des retours valides et exploitables.

27
RESEARCHarXiv CS.CL·il y a 29j

TajPersLexon: A Tajik-Persian Lexical Resource and Hybrid Model for Cross-Script Low-Resource NLP

Cette recherche présente TajPersLexon, une ressource lexicale parallèle tadjik-persan de 40 112 paires de mots pour le PNL inter-scripts dans des environnements à faibles ressources. Elle évalue des modèles hybrides, neuronaux et de récupération, démontrant une haute précision pour les bases neuronales et de récupération (98-99%) et un compromis favorable précision-efficacité pour le modèle hybride (96,4%) dans la post-correction OCR.

27
RESEARCHarXiv CS.CL·il y a 22j

Why are language models less surprised than humans? Testing the Parse Multiplicity Mismatch Hypothesis

Cet article examine pourquoi les modèles linguistiques sont moins « surpris » que les humains lors du traitement de phrases syntaxiquement ambiguës. Il teste l'hypothèse selon laquelle les modèles de langage peuvent considérer simultanément un plus grand nombre d'interprétations de phrases en utilisant les Grammaires de Réseaux Neuronaux Récurrents.

27
RESEARCHarXiv CS.LG·21/04/2026

Annotation Entropy Predicts Per-Example Learning Dynamics in LoRA Fine-Tuning

Cette recherche révèle que le réglage fin LoRA entraîne un 'désapprentissage' sur des exemples contestés, où un désaccord élevé des annotateurs est corrélé à une perte croissante pendant l'entraînement. Ce phénomène se distingue du réglage fin complet et est observé de manière constante sur divers modèles et ensembles de données.

27
RESEARCHarXiv CS.CL·07/05/2026

The Impact of Vocabulary Overlaps on Knowledge Transfer in Multilingual Machine Translation

Cet article étudie systématiquement l'impact des vocabulaires conjoints et disjoints sur le transfert de connaissances en traduction automatique neuronale multilingue (MNMT). Les expériences montrent que des chevauchements de vocabulaire étendus, la parenté linguistique et la correspondance de domaine entraînent de meilleures performances, même dans des configurations hors domaine.

27
RESEARCHarXiv CS.CL·il y a 26j

Differences in Text Generated by Diffusion and Autoregressive Language Models

Cette recherche explore les différences intrinsèques dans le texte généré par les Modèles de Langage à Diffusion (DLM) et les Modèles de Langage Autorégressifs (ARM), constatant que les DLM présentent une entropie n-gramme inférieure mais une cohérence et une diversité sémantiques plus élevées. Des expériences contrôlées révèlent que les objectifs d'entraînement des DLM améliorent la cohérence et la diversité grâce au contexte bidirectionnel, tandis que les algorithmes de décodage sont responsables de la réduction de l'entropie.

27
RESEARCHarXiv CS.CL·il y a 6j

On the Persistent Effects of Lexicality in Large Language Mod

Ce travail étudie l'effet persistant du chevauchement lexical, plutôt que du contenu sémantique, sur les représentations extraites des grands modèles linguistiques (LLM) et ses implications. Les auteurs constatent que l'influence lexicale s'étend sur la profondeur des modèles, les architectures et les régimes d'entraînement, y compris pour les modèles entraînés à la similarité sémantique.

27
RESEARCHarXiv CS.CL·il y a 13j

CroCo: Cross-Lingual Contrastive Preference Tuning on Self-Generations

Ce travail présente CroCo, une méthode de réglage de préférence contrastif interlingue sur les auto-générations de LLM, démontrant un transfert efficace sur 14 langues sans annotation de préférence spécifique. Un modèle de récompense entraîné en anglais produit des classements utiles dans la plupart des langues, améliorant les modèles existants et empêchant l'oubli catastrophique, à condition d'utiliser des données on-policy.

27
RESEARCHarXiv CS.CL·il y a 12j

BioELX: Cross-lingual Biomedical Entity Linking via Alias-based Retrieval and LLM Ranking

BioELX est un cadre de liaison d'entités biomédicales translingues en deux étapes qui ne nécessite pas de données d'entraînement annotées spécifiques à la tâche. Il améliore la récupération de candidats à l'aide d'alias multilingues de Wikidata et effectue une désambiguïsation sensible au contexte avec un classificateur LLM pré-entraîné.

27
DOCDEV.to AI·il y a 16j

RAG 시스템 실전 구축 (v18)

Ce document détaille la mise en œuvre pratique des systèmes RAG (Retrieval-Augmented Generation), expliquant leurs concepts fondamentaux et leur boucle de fonctionnement. Il couvre les étapes de récupération, d'augmentation et de génération de contexte pour améliorer les réponses des LLM, y compris le découpage sémantique de documents.

27
ARTICLEDEV.to AI·il y a 8j

AI debt sales reshape global corporate bond markets

L'intégration de l'IA dans les ventes de dettes est sur le point de modifier considérablement les marchés mondiaux des obligations d'entreprise, grâce à la capacité des systèmes d'IA à analyser de vastes quantités de données et à faire des prévisions précises. Les plateformes de vente de dettes basées sur l'IA exploitent des algorithmes d'apprentissage automatique et le traitement du langage naturel pour évaluer la solvabilité et identifier les risques et les opportunités.

27
ARTICLEDEV.to AI·27/04/2026

Epismo Agent Package

L'analyse technique du package d'agents Epismo détaille une solution innovante pour créer des humains numériques alimentés par l'IA, destinés au service client, au divertissement et à l'éducation. Son architecture de microservices intègre le traitement du langage naturel, l'apprentissage automatique et la vision par ordinateur, gérés par un Cœur d'Agent et un Graphe de Connaissance.

27
DOCDEV.to AI·il y a 20j

92. BERT: The Model That Reads in Both Directions

BERT se distingue de GPT par sa capacité de lecture bidirectionnelle, prédisant des mots masqués plutôt que séquentiels. Cette compréhension contextuelle complète l'a rendu dominant dans les benchmarks PNL et une pierre angulaire pour les tâches de compréhension. Le contenu détaille les mécanismes de pré-entraînement et les techniques de réglage fin de BERT.

27
ARTICLEDEV.to AI·il y a 26j

NLP Video Editing Copilot

Cutting Room AI est une application de bureau Windows autonome qui permet aux utilisateurs de DaVinci Resolve Studio de contrôler leur timeline avec un langage simple. Elle traduit des commandes en anglais clair en appels API de script, permettant de modifier les propriétés des clips et d'effectuer des opérations de piste sans connaissance en scripting.

27
DOCDEV.to AI·il y a 26j

Spellar 3.0

Spellar 3.0 est une plateforme d'apprentissage des langues pilotée par l'IA, offrant des instructions et des retours personnalisés. Son architecture technique comprend un frontend React, un backend Node.js avec PostgreSQL et un moteur PNL capable d'analyser les saisies utilisateur multilingues.

27