heapsort
RESEARCH27

CanLegalRAGBench: Evaluating Retrieval-Augmented Generation on Canadian Case Law

arXiv CS.CL·1 juin 2026

Cette recherche introduit CanLegalRAGBench, un nouveau benchmark canadien pour l'évaluation des systèmes de Génération Augmentée par Récupération (RAG) sur des questions juridiques, avec des requêtes réalistes et des réponses annotées par des experts. L'étude révèle la sensibilité de la performance de récupération, la compétitivité des modèles d'embedding open-source et les limites des évaluations automatiques et des hallucinations des LLM.

Lire l'original