RESEARCH29

When Does a Language Model Commit? A Finite-Answer Theory of Pre-Verbalization Commitment

arXiv CS.AI·11 de maio de 2026

Esta pesquisa introduz uma teoria de "estabilização de preferência de resposta finita" para determinar quando a preferência de resposta de um modelo de linguagem se torna estável. Ela demonstra que esta estabilização frequentemente ocorre antes que a resposta seja explicitamente verbalizada, com um tempo de antecipação considerável.

language models cognitive science machine learning NLP AI Research

Ler original ↗