heapsort
RESEARCH27

Evaluation Revisited: A Taxonomy of Evaluation Concerns in Natural Language Processing

arXiv CS.CL·30 de abril de 2026

Impulsado por los avances recientes en LLMs, este trabajo realiza una revisión exploratoria de la larga historia de reflexión metodológica en PNL sobre las preocupaciones de evaluación. Desarrolla una taxonomía, sintetizando posiciones y compensaciones recurrentes, y ofrece una lista de verificación estructurada para apoyar un diseño e interpretación de evaluación más deliberados.

Leer original