RESEARCH27
ARBITER: Reasoning Trajectory Basins and Majority Vote Failures in Test-Time Sampling
arXiv CS.LG·27 de mayo de 2026
Cuando los modelos de lenguaje usan muestreo en tiempo de prueba y voto mayoritario, las trayectorias de razonamiento se concentran en
Leer original ↗