heapsort
RESEARCH27

Evaluation Revisited: A Taxonomy of Evaluation Concerns in Natural Language Processing

arXiv CS.CL·30 avril 2026

Motivé par les récentes avancées des LLM, cet article réalise une revue de la littérature sur l'historique des réflexions méthodologiques en PNL concernant les pratiques d'évaluation. Il développe une taxonomie synthétisant les positions récurrentes et les compromis, et propose une liste de contrôle structurée pour une conception et une interprétation plus délibérées de l'évaluation.

Lire l'original