RESEARCH29
When Does a Language Model Commit? A Finite-Answer Theory of Pre-Verbalization Commitment
arXiv CS.AI·11. Mai 2026
Diese Forschung führt eine Theorie der "Stabilisierung der endlichen Antwortpräferenz" ein, um zu bestimmen, wann die Antwortpräferenz eines Sprachmodells stabil wird. Es zeigt sich, dass diese Stabilisierung oft vor der verbalisierbaren Antwort erfolgt, mit einem deutlichen Vorlauf.
Original lesen ↗