RESEARCH27
CanLegalRAGBench: Evaluating Retrieval-Augmented Generation on Canadian Case Law
arXiv CS.CL·1 de junio de 2026
Este estudio presenta CanLegalRAGBench, un nuevo benchmark canadiense para evaluar sistemas de Generación Aumentada por Recuperación (RAG) en derecho, utilizando consultas realistas y respuestas anotadas por expertos. La investigación revela la sensibilidad del rendimiento de recuperación, la competitividad de los modelos de incrustación de código abierto y las limitaciones de las evaluaciones automáticas y las alucinaciones de los LLM.
Leer original ↗