RESEARCH57
Why Limit the Residual Stream to Layers and Not Tokens? Persistent Memory for Continuous Latent Reasoning
arXiv CS.AI·9 de junho de 2026
Modelos de linguagem grandes (LLMs) enfrentam uma limitação chamada 'gargalo de conceito', onde perdem fatos críticos em raciocínios latentes profundos. O artigo propõe o AGCLR (Adaptive Gated Continuous Latent Reasoning) para resolver isso, adicionando um fluxo de conceito com portão para memória persistente.
Ler original ↗