RESEARCH27
Evaluation Revisited: A Taxonomy of Evaluation Concerns in Natural Language Processing
arXiv CS.CL·30 de abril de 2026
Impulsionado pelos avanços recentes em LLMs, este artigo realiza uma revisão abrangente da longa história de reflexão metodológica do PNL sobre preocupações de avaliação. Ele desenvolve uma taxonomia, sintetizando posições e trade-offs recorrentes, e fornece uma lista de verificação estruturada para apoiar o design e a interpretação deliberados da avaliação.
Ler original ↗