RESEARCH27

ViLegalNLI: Natural Language Inference for Vietnamese Legal Texts

arXiv CS.CL·4 mai 2026

Cet article présente ViLegalNLI, le premier ensemble de données d'inférence en langage naturel (NLI) à grande échelle pour les textes juridiques vietnamiens. Il se compose de 42 012 paires prémisse-hypothèse provenant de documents statutaires officiels, construit à l'aide d'un cadre semi-automatique intégrant de grands modèles linguistiques pour la génération et la validation.

Dataset Legal AI Natural Language Inference Vietnamese NLI large language models

Lire l'original ↗