heapsort
RESEARCH27

BrowseComp: A Simple Yet Challenging Benchmark for Browsing Agents

DEV.to AI·5 de maio de 2026

BrowseComp é um novo e desafiador benchmark projetado para avaliar agentes de navegação. Ele foca em tarefas complexas que exigem compreensão contextual e interação com interfaces web, oferecendo uma nova métrica para o desempenho de IA.

Ler original