RESEARCHarXiv CS.AI·27/04/2026
Math Takes Two: A test for emergent mathematical reasoning in communication
Este artigo propõe o Math Takes Two, um novo benchmark para avaliar o raciocínio matemático emergente em modelos de linguagem através da comunicação. Ele testa a capacidade de dois agentes sem conhecimento matemático prévio de desenvolver um protocolo simbólico compartilhado para resolver uma tarefa visualmente fundamentada, facilitando a extrapolação numérica.
27