← heapsort-ai

data curation

3 items

RESEARCHarXiv CS.CL·hace 8d

Exploring Autonomous Agentic Data Engineering for Model Specialization

Este artículo formaliza la 'Ingeniería de Datos Agéntica Autónoma', una tarea novedosa para evaluar LLMs como ingenieros de datos autónomos que impulsan la especialización de modelos. Los experimentos demuestran que los ingenieros de datos LLM autónomos logran ganancias sustanciales, con GPT-5.2 mejorando un modelo estudiante en un 57,29%.

29
RESEARCHarXiv CS.AI·hace 5d

Can Generalist Agents Automate Data Curation?

Los agentes de codificación generalistas muestran potencial en la automatización del proceso intensivo de curación de datos para el desarrollo de IA, probado en el nuevo benchmark Curation-Bench. Aunque los agentes alcanzan líneas de base sólidas, se observa una "brecha de ejecución-investigación" donde principalmente refinan políticas existentes en lugar de explorar enfoques novedosos.

28