RESEARCH27
CanLegalRAGBench: Evaluating Retrieval-Augmented Generation on Canadian Case Law
arXiv CS.CL·1 juin 2026
Cette recherche introduit CanLegalRAGBench, un nouveau benchmark canadien pour l'évaluation des systèmes de Génération Augmentée par Récupération (RAG) sur des questions juridiques, avec des requêtes réalistes et des réponses annotées par des experts. L'étude révèle la sensibilité de la performance de récupération, la compétitivité des modèles d'embedding open-source et les limites des évaluations automatiques et des hallucinations des LLM.
Lire l'original ↗