RESEARCH46

A case study of evaluating AI agents on a neuroscience data-to-discovery pipeline

arXiv CS.AI·9 de junho de 2026

Este estudo avalia empiricamente agentes de IA de codificação de uso geral em um pipeline de descoberta de dados neurocientíficos, analisando sua capacidade de automatizar tarefas científicas complexas. Ele conclui que os agentes conseguem resolver etapas individuais do pipeline, mas têm dificuldade com o julgamento científico na ausência de critérios de iteração predefinidos.

Benchmarking Neuroscience automation AI agents scientific research

Ler original ↗