RESEARCHarXiv CS.CL·4/5/2026
ViLegalNLI: Natural Language Inference for Vietnamese Legal Texts
Este artículo presenta ViLegalNLI, el primer conjunto de datos a gran escala de Inferencia de Lenguaje Natural (NLI) en vietnamita, construido específicamente para el dominio legal. El conjunto de datos incluye 42.012 pares de premisa-hipótesis derivados de documentos estatutarios oficiales, desarrollado con un marco semi-automático que integra grandes modelos de lenguaje.
27