RESEARCH27
PolitNuggets: Benchmarking Agentic Discovery of Long-Tail Political Facts
arXiv CS.AI·16 de mayo de 2026
El artículo presenta PolitNuggets, un benchmark multilingüe para la síntesis de información agéntica, centrado en la construcción de biografías políticas para 400 élites globales. Evalúa grandes modelos de razonamiento en el descubrimiento y la síntesis de hechos políticos de "cola larga", destacando desafíos en detalles finos y eficiencia.
Leer original ↗