Why Limit the Residual Stream to Layers and Not Tokens? Persistent Memory for Continuous Latent Reasoning
Modelos de linguagem grandes (LLMs) enfrentam uma limitação chamada 'gargalo de conceito', onde perdem fatos críticos em raciocínios latentes profundos. O artigo propõe o AGCLR (Adaptive Gated Continuous Latent Reasoning) para resolver isso, adicionando um fluxo de conceito com portão para memória persistente.
