RESEARCH40
CrowdMath: A Dataset of Crowdsourced Mathematical Research Discussions
arXiv CS.AI·8 de junho de 2026
Este artigo apresenta CrowdMath, um conjunto de dados de 164 cadeias de progresso anotadas por especialistas do programa CrowdMath do MIT PRIMES--Art of Problem Solving. Ele visa avaliar modelos de linguagem grandes na resolução colaborativa de problemas matemáticos abertos, diferenciando-se das avaliações que focam apenas em respostas finais ou provas completas.
Ler original ↗