RESEARCH27
Evaluation Revisited: A Taxonomy of Evaluation Concerns in Natural Language Processing
arXiv CS.CL·30 de abril de 2026
Impulsado por los avances recientes en LLMs, este trabajo realiza una revisión exploratoria de la larga historia de reflexión metodológica en PNL sobre las preocupaciones de evaluación. Desarrolla una taxonomía, sintetizando posiciones y compensaciones recurrentes, y ofrece una lista de verificación estructurada para apoyar un diseño e interpretación de evaluación más deliberados.
Leer original ↗