heapsort
RESEARCH27

CanLegalRAGBench: Evaluating Retrieval-Augmented Generation on Canadian Case Law

arXiv CS.CL·1 de junio de 2026

Este estudio presenta CanLegalRAGBench, un nuevo benchmark canadiense para evaluar sistemas de Generación Aumentada por Recuperación (RAG) en derecho, utilizando consultas realistas y respuestas anotadas por expertos. La investigación revela la sensibilidad del rendimiento de recuperación, la competitividad de los modelos de incrustación de código abierto y las limitaciones de las evaluaciones automáticas y las alucinaciones de los LLM.

Leer original