RESEARCH27
PolitNuggets: Benchmarking Agentic Discovery of Long-Tail Political Facts
arXiv CS.AI·16 de maio de 2026
O artigo apresenta PolitNuggets, um benchmark multilíngue para a síntese de informações agênticas, focado na construção de biografias políticas para 400 elites globais. Ele avalia modelos de raciocínio grandes na descoberta e síntese de fatos políticos de "longa cauda", destacando desafios em detalhes finos e eficiência.
Ler original ↗