Why Limit the Residual Stream to Layers and Not Tokens? Persistent Memory for Continuous Latent Reasoning
Les grands modèles linguistiques (LLM) rencontrent une limitation appelée le 'goulot d'étranglement conceptuel', où ils perdent des faits critiques lors de raisonnements latents profonds. Cet article propose l'AGCLR pour y remédier, en augmentant CoCoNuT avec un flux de concepts à porte pour une mémoire persistante.
