← heapsort-ai

job delegation

1 items

RESEARCHarXiv CS.AI·hace 14d

JobBench: Aligning Agent Work With Human Will

JobBench es un nuevo benchmark que evalúa a los agentes de IA en flujos de trabajo identificados por expertos como de alta prioridad para la delegación, cubriendo 130 tareas en 35 ocupaciones. Su objetivo es cambiar el efecto en el mercado laboral de la sustitución al mejoramiento, construyendo agentes que hagan lo que los humanos realmente quieren delegar.

27