RESEARCH27
MATH-PT: A Math Reasoning Benchmark for European and Brazilian Portuguese
arXiv CS.CL·30 avril 2026
Cet article présente MATH-PT, un nouvel ensemble de données de 1 729 problèmes mathématiques en portugais européen et brésilien, pour corriger le biais linguistique dans l'évaluation du raisonnement mathématique des LLM. Le benchmark révèle que les modèles de pointe obtiennent de bons résultats sur les questions à choix multiples, mais que leurs performances diminuent pour les questions ouvertes.
Lire l'original ↗