heapsort
RESEARCH27

Math Takes Two: A test for emergent mathematical reasoning in communication

arXiv CS.AI·27 avril 2026

Cet article propose Math Takes Two, un nouveau benchmark pour évaluer l'émergence du raisonnement mathématique chez les modèles linguistiques par la communication. Il teste la capacité de deux agents, sans connaissances mathématiques préalables, à développer un protocole symbolique partagé pour résoudre une tâche visuelle facilitant l'extrapolation numérique.

Lire l'original