RESEARCH27
BrowseComp: A Simple Yet Challenging Benchmark for Browsing Agents
DEV.to AI·5 de maio de 2026
BrowseComp é um novo e desafiador benchmark projetado para avaliar agentes de navegação. Ele foca em tarefas complexas que exigem compreensão contextual e interação com interfaces web, oferecendo uma nova métrica para o desempenho de IA.
Ler original ↗