RESEARCH29

VAMPS: Visual-Assisted Mathematical Problem Solving Benchmark

arXiv CS.AI·4 de junio de 2026

Presentamos VAMPS, un nuevo benchmark para modelos de lenguaje grandes multimodales (MLLM) centrado en la resolución de problemas matemáticos asistidos visualmente. Contiene 1.168 pares bilingües de preguntas y respuestas de opción múltiple de exámenes de acceso a universidades iraníes, donde la representación gráfica ofrece una estrategia de solución natural.

multimodal AI LLMs Benchmarking mathematics

Leer original ↗