RESEARCH29

When Does a Language Model Commit? A Finite-Answer Theory of Pre-Verbalization Commitment

arXiv CS.AI·11 mai 2026

Cette recherche introduit une théorie de la "stabilisation de la préférence de réponse finie" pour déterminer quand la préférence de réponse d'un modèle linguistique devient stable. Elle démontre que cette stabilisation se produit souvent avant que la réponse ne soit verbalisable, avec une avance significative.

language models cognitive science machine learning NLP AI Research

Lire l'original ↗