heapsort
RESEARCH27

Evaluation Revisited: A Taxonomy of Evaluation Concerns in Natural Language Processing

arXiv CS.CL·30 de abril de 2026

Impulsionado pelos avanços recentes em LLMs, este artigo realiza uma revisão abrangente da longa história de reflexão metodológica do PNL sobre preocupações de avaliação. Ele desenvolve uma taxonomia, sintetizando posições e trade-offs recorrentes, e fornece uma lista de verificação estruturada para apoiar o design e a interpretação deliberados da avaliação.

Ler original