RESEARCH29
When Does a Language Model Commit? A Finite-Answer Theory of Pre-Verbalization Commitment
arXiv CS.AI·11 mai 2026
Cette recherche introduit une théorie de la "stabilisation de la préférence de réponse finie" pour déterminer quand la préférence de réponse d'un modèle linguistique devient stable. Elle démontre que cette stabilisation se produit souvent avant que la réponse ne soit verbalisable, avec une avance significative.
Lire l'original ↗