RESEARCH27
ARBITER: Reasoning Trajectory Basins and Majority Vote Failures in Test-Time Sampling
arXiv CS.LG·27 mai 2026
Lorsque les modèles de langage utilisent l'échantillonnage en temps de test et le vote majoritaire, les trajectoires de raisonnement se concentrent en
Lire l'original ↗