heapsort
RESEARCH28

Can Generalist Agents Automate Data Curation?

arXiv CS.AI·4 juin 2026

Les agents de codage généralistes montrent un potentiel dans l'automatisation du processus intensif de curation des données pour le développement de l'IA, testé sur le nouveau benchmark Curation-Bench. Bien que les agents atteignent des bases solides, un "écart exécution-recherche" est observé où ils affinent principalement les politiques existantes au lieu d'explorer de nouvelles approches.

Lire l'original