Large Language Models (LLMs)

3 items

RESEARCHarXiv CS.CL·15/04/2026

Robust Explanations for User Trust in Enterprise NLP Systems

Cette recherche propose un cadre unifié d'évaluation de la robustesse en boîte noire pour les explications au niveau des jetons, visant à renforcer la confiance des utilisateurs dans les systèmes PNL d'entreprise, notamment lors de la migration vers les LLM. Elle opérationnalise la robustesse par le taux de basculement des jetons supérieurs sous des perturbations réalistes, comparant les architectures d'encodeur et de décodeur telles que BERT, RoBERTa, Qwen et Llama.

model robustness Explainable AI (XAI)User Trust Large Language Models (LLMs)

ARTICLEDEV.to AI·19/04/2026

Gemma-4 Deployment Woes, `easyaligner` for Audio, & Claude Enterprise Privacy

Ce contenu traite des défis pratiques lors du déploiement du modèle Gemma-4 de Google, présente un nouvel outil open source pour l'alignement parole-texte et aborde les considérations critiques de confidentialité des données pour les utilisateurs de Claude Enterprise.

Open Source MLOps data privacy Large Language Models (LLMs)

RESEARCHarXiv CS.CL·27/04/2026

Outcome Rewards Do Not Guarantee Verifiable or Causally Important Reasoning

Cet article examine si les récompenses de résultat dans l'apprentissage par renforcement pour le raisonnement en chaîne de pensée garantissent un raisonnement vérifiable ou causalement important dans les LLM. Introduisant les métriques CIR et SR, les auteurs constatent que le RLVR améliore la précision, mais pas toujours le CIR ou le SR, et qu'un léger SFT peut y remédier.

reinforcement learning AI training Large Language Models (LLMs)Model Evaluation