RESEARCH27

Applied Explainability for Large Language Models: A Comparative Study

arXiv CS.CL·20 avril 2026

Cet article présente une étude comparative de trois techniques d'explicabilité (Integrated Gradients, Attention Rollout et SHAP) appliquées à un modèle DistilBERT pour la classification de sentiments. L'étude conclut que les méthodes basées sur le gradient offrent des explications plus stables et intuitives, tandis que celles basées sur l'attention sont efficaces mais moins alignées avec les caractéristiques prédictives.

Comparative Study Natural Language Processing Explainable AI large language models

Lire l'original ↗