RESEARCH27
CreativityBench: Evaluating Agent Creative Reasoning via Affordance-Based Tool Repurposing
arXiv CS.AI·6. Mai 2026
Dieses Papier stellt CreativityBench vor, einen neuen Benchmark zur Bewertung der kreativen Denkfähigkeiten von LLMs durch affordance-basiertes Werkzeug-Repurposing. Es beschreibt den Aufbau einer umfangreichen Affordanz-Wissensbasis und die Generierung von 14 Tausend Aufgaben, die nicht-offensichtliche, aber physikalisch plausible Lösungen erfordern.
Original lesen ↗