← heapsort-ai

political facts

1 items

RESEARCHarXiv CS.AI·il y a 24j

PolitNuggets: Benchmarking Agentic Discovery of Long-Tail Political Facts

Cet article introduit PolitNuggets, un benchmark multilingue pour la synthèse d'informations agêntiques, axé sur la construction de biographies politiques pour 400 élites mondiales. Il évalue les grands modèles de raisonnement dans la découverte et la synthèse de faits politiques de "longue traîne", soulignant les défis liés aux détails précis et à l'efficacité.

27