RESEARCH27
JobBench: Aligning Agent Work With Human Will
arXiv CS.AI·27 de mayo de 2026
JobBench es un nuevo benchmark que evalúa a los agentes de IA en flujos de trabajo identificados por expertos como de alta prioridad para la delegación, cubriendo 130 tareas en 35 ocupaciones. Su objetivo es cambiar el efecto en el mercado laboral de la sustitución al mejoramiento, construyendo agentes que hagan lo que los humanos realmente quieren delegar.
Leer original ↗