RESEARCH57

Why Limit the Residual Stream to Layers and Not Tokens? Persistent Memory for Continuous Latent Reasoning

arXiv CS.AI·9 de junho de 2026

Modelos de linguagem grandes (LLMs) enfrentam uma limitação chamada 'gargalo de conceito', onde perdem fatos críticos em raciocínios latentes profundos. O artigo propõe o AGCLR (Adaptive Gated Continuous Latent Reasoning) para resolver isso, adicionando um fluxo de conceito com portão para memória persistente.

machine learning Latent Reasoning Reasoning AI Research LLM

Ler original ↗