← heapsort-ai

Large Language Models (LLMs)

3 items

RESEARCHarXiv CS.CL·4/15/2026

Robust Explanations for User Trust in Enterprise NLP Systems

Diese Forschung schlägt ein vereinheitlichtes Black-Box-Robustheitsbewertungsrahmenwerk für Token-Level-Erklärungen vor, um das Benutzervertrauen in Unternehmens-NLP-Systeme zu verbessern, insbesondere bei der Migration zu LLMs. Es operationalisiert Robustheit über die Top-Token-Flip-Rate unter realistischen Störungen und führt einen systematischen Vergleich über verschiedene Encoder- und Decoder-Architekturen wie BERT, RoBERTa, Qwen und Llama durch.

28
RESEARCHarXiv CS.CL·4/27/2026

Outcome Rewards Do Not Guarantee Verifiable or Causally Important Reasoning

Diese Arbeit untersucht, ob Ergebnisbelohnungen beim Reinforcement Learning für Chain-of-Thought-Reasoning eine überprüfbare oder kausal wichtige Argumentation in LLMs garantieren. Unter Einführung der Metriken CIR und SR stellen die Autoren fest, dass RLVR zwar die Genauigkeit verbessert, aber CIR oder SR nicht zuverlässig steigert, und eine geringe Menge SFT dies beheben kann.

27