heapsort
RESEARCH27

Math Takes Two: A test for emergent mathematical reasoning in communication

arXiv CS.AI·27 de abril de 2026

Este artículo propone Math Takes Two, un nuevo benchmark diseñado para evaluar el razonamiento matemático emergente en modelos de lenguaje a través de la comunicación. Prueba si dos agentes, sin conocimiento matemático previo, pueden desarrollar un protocolo simbólico compartido para resolver una tarea visualmente fundamentada que facilita la extrapolación numérica.

Leer original