heapsort
RESEARCH27

JobBench: Aligning Agent Work With Human Will

arXiv CS.AI·27. Mai 2026

JobBench ist ein neuer Benchmark, der KI-Agenten anhand von Experten als hochprioritär für die Delegation identifizierten Arbeitsabläufen bewertet, der 130 Aufgaben in 35 Berufen abdeckt. Ziel ist es, den Arbeitsmarkteffekt von Substitution auf Verbesserung zu verlagern, indem Agenten entwickelt werden, die das tun, was Menschen tatsächlich delegieren möchten.

Original lesen