RESEARCH29

When Does a Language Model Commit? A Finite-Answer Theory of Pre-Verbalization Commitment

arXiv CS.AI·11. Mai 2026

Diese Forschung führt eine Theorie der "Stabilisierung der endlichen Antwortpräferenz" ein, um zu bestimmen, wann die Antwortpräferenz eines Sprachmodells stabil wird. Es zeigt sich, dass diese Stabilisierung oft vor der verbalisierbaren Antwort erfolgt, mit einem deutlichen Vorlauf.

language models cognitive science machine learning NLP AI Research

Original lesen ↗