RESEARCH27
Math Takes Two: A test for emergent mathematical reasoning in communication
arXiv CS.AI·27 avril 2026
Cet article propose Math Takes Two, un nouveau benchmark pour évaluer l'émergence du raisonnement mathématique chez les modèles linguistiques par la communication. Il teste la capacité de deux agents, sans connaissances mathématiques préalables, à développer un protocole symbolique partagé pour résoudre une tâche visuelle facilitant l'extrapolation numérique.
Lire l'original ↗