RESEARCH46
A case study of evaluating AI agents on a neuroscience data-to-discovery pipeline
arXiv CS.AI·9 de junio de 2026
Este estudio evalúa empíricamente agentes de codificación de IA de propósito general en un pipeline de descubrimiento de datos neurocientíficos, analizando su capacidad para automatizar tareas científicas complejas. Concluye que los agentes pueden resolver etapas individuales del pipeline, pero tienen dificultades con el juicio científico en ausencia de criterios de iteración predefinidos.
Leer original ↗