RESEARCH27
MAVEN: Improving Generalization in Agentic Tool Calling
arXiv CS.AI·1. Juni 2026
MAVEN (Modular Agentic Verification and Execution Network) ist ein leichtes symbolisches Reasoning-Gerüst zur Verbesserung der Generalisierung in agentischen Tool-Calling-Umgebungen. Es wurde auf etablierten Benchmarks evaluiert und führt MAVEN-Bench ein, einen neuen Stresstest-Benchmark für mehrstufiges mathematisches und physikalisches Reasoning.
Original lesen ↗