Large Language Models (LLMs)

3 items

RESEARCHarXiv CS.CL·4/15/2026

Robust Explanations for User Trust in Enterprise NLP Systems

Diese Forschung schlägt ein vereinheitlichtes Black-Box-Robustheitsbewertungsrahmenwerk für Token-Level-Erklärungen vor, um das Benutzervertrauen in Unternehmens-NLP-Systeme zu verbessern, insbesondere bei der Migration zu LLMs. Es operationalisiert Robustheit über die Top-Token-Flip-Rate unter realistischen Störungen und führt einen systematischen Vergleich über verschiedene Encoder- und Decoder-Architekturen wie BERT, RoBERTa, Qwen und Llama durch.

model robustness Explainable AI (XAI)User Trust Large Language Models (LLMs)

ARTICLEDEV.to AI·4/19/2026

Gemma-4 Deployment Woes, `easyaligner` for Audio, & Claude Enterprise Privacy

Dieser Inhalt behandelt praktische Herausforderungen beim Einsatz von Googles Gemma-4-Modell, stellt ein neues Open-Source-Tool zur Sprach-Text-Ausrichtung vor und erörtert wichtige Datenschutzaspekte für Claude Enterprise-Nutzer.

Open Source MLOps data privacy Large Language Models (LLMs)

RESEARCHarXiv CS.CL·4/27/2026

Outcome Rewards Do Not Guarantee Verifiable or Causally Important Reasoning

Diese Arbeit untersucht, ob Ergebnisbelohnungen beim Reinforcement Learning für Chain-of-Thought-Reasoning eine überprüfbare oder kausal wichtige Argumentation in LLMs garantieren. Unter Einführung der Metriken CIR und SR stellen die Autoren fest, dass RLVR zwar die Genauigkeit verbessert, aber CIR oder SR nicht zuverlässig steigert, und eine geringe Menge SFT dies beheben kann.

reinforcement learning AI training Large Language Models (LLMs)Model Evaluation