RESEARCH27
MAVEN: Improving Generalization in Agentic Tool Calling
arXiv CS.AI·1 de junho de 2026
MAVEN (Modular Agentic Verification and Execution Network) é um sistema de raciocínio simbólico leve que melhora a generalização em ambientes de chamada de ferramentas agenticas. Ele foi avaliado em vários benchmarks e introduz o MAVEN-Bench, um novo benchmark de estresse para raciocínio matemático e físico multi-etapa.
Ler original ↗