heapsort
RESEARCH27

PolitNuggets: Benchmarking Agentic Discovery of Long-Tail Political Facts

arXiv CS.AI·16 de maio de 2026

O artigo apresenta PolitNuggets, um benchmark multilíngue para a síntese de informações agênticas, focado na construção de biografias políticas para 400 elites globais. Ele avalia modelos de raciocínio grandes na descoberta e síntese de fatos políticos de "longa cauda", destacando desafios em detalhes finos e eficiência.

Ler original