RESEARCHarXiv CS.CL·04/05/2026
ViLegalNLI: Natural Language Inference for Vietnamese Legal Texts
Este artigo apresenta o ViLegalNLI, o primeiro conjunto de dados em larga escala de Inferência de Linguagem Natural (NLI) para textos jurídicos vietnamitas. O conjunto de dados contém 42.012 pares de premissa-hipótese derivados de documentos estatutários oficiais, construído com um framework semi-automático que integra modelos de linguagem grandes para geração e validação de hipóteses.
27