RESEARCH29
VAMPS: Visual-Assisted Mathematical Problem Solving Benchmark
arXiv CS.AI·4 juin 2026
Nous introduisons VAMPS, un nouveau benchmark pour les grands modèles de langage multimodaux (MLLM) axé sur la résolution de problèmes mathématiques assistée visuellement. Il contient 1 168 paires de questions-réponses bilingues à choix multiples, issues d'examens d'entrée universitaires iraniens, où le traçage fournit une stratégie de solution naturelle.
Lire l'original ↗