RESEARCHarXiv CS.LG·vor 14T
ARBITER: Reasoning Trajectory Basins and Majority Vote Failures in Test-Time Sampling
Wenn Sprachmodelle Testzeit-Sampling und Mehrheitsentscheid nutzen, konzentrieren sich Denkpfade in nicht-unabhängigen
27
Wenn Sprachmodelle Testzeit-Sampling und Mehrheitsentscheid nutzen, konzentrieren sich Denkpfade in nicht-unabhängigen