RESEARCH29
When Does a Language Model Commit? A Finite-Answer Theory of Pre-Verbalization Commitment
arXiv CS.AI·11 de maio de 2026
Esta pesquisa introduz uma teoria de "estabilização de preferência de resposta finita" para determinar quando a preferência de resposta de um modelo de linguagem se torna estável. Ela demonstra que esta estabilização frequentemente ocorre antes que a resposta seja explicitamente verbalizada, com um tempo de antecipação considerável.
Ler original ↗