← heapsort-ai

Large Language Models (LLMs)

3 items

RESEARCHarXiv CS.CL·15/04/2026

Robust Explanations for User Trust in Enterprise NLP Systems

Cette recherche propose un cadre unifié d'évaluation de la robustesse en boîte noire pour les explications au niveau des jetons, visant à renforcer la confiance des utilisateurs dans les systèmes PNL d'entreprise, notamment lors de la migration vers les LLM. Elle opérationnalise la robustesse par le taux de basculement des jetons supérieurs sous des perturbations réalistes, comparant les architectures d'encodeur et de décodeur telles que BERT, RoBERTa, Qwen et Llama.

28
RESEARCHarXiv CS.CL·27/04/2026

Outcome Rewards Do Not Guarantee Verifiable or Causally Important Reasoning

Cet article examine si les récompenses de résultat dans l'apprentissage par renforcement pour le raisonnement en chaîne de pensée garantissent un raisonnement vérifiable ou causalement important dans les LLM. Introduisant les métriques CIR et SR, les auteurs constatent que le RLVR améliore la précision, mais pas toujours le CIR ou le SR, et qu'un léger SFT peut y remédier.

27