RESEARCHarXiv CS.LG·13d atrás
ARBITER: Reasoning Trajectory Basins and Majority Vote Failures in Test-Time Sampling
Quando modelos de linguagem usam amostragem em tempo de teste e voto majoritário, as trajetórias de raciocínio se concentram em
27
Quando modelos de linguagem usam amostragem em tempo de teste e voto majoritário, as trajetórias de raciocínio se concentram em