heapsort
RESEARCH27

MAVEN: Improving Generalization in Agentic Tool Calling

arXiv CS.AI·1 de junho de 2026

MAVEN (Modular Agentic Verification and Execution Network) é um sistema de raciocínio simbólico leve que melhora a generalização em ambientes de chamada de ferramentas agenticas. Ele foi avaliado em vários benchmarks e introduz o MAVEN-Bench, um novo benchmark de estresse para raciocínio matemático e físico multi-etapa.

Ler original