heapsort
RESEARCH29

VAMPS: Visual-Assisted Mathematical Problem Solving Benchmark

arXiv CS.AI·4 juin 2026

Nous introduisons VAMPS, un nouveau benchmark pour les grands modèles de langage multimodaux (MLLM) axé sur la résolution de problèmes mathématiques assistée visuellement. Il contient 1 168 paires de questions-réponses bilingues à choix multiples, issues d'examens d'entrée universitaires iraniens, où le traçage fournit une stratégie de solution naturelle.

Lire l'original