RESEARCH28
LPC-SM: Local Predictive Coding and Sparse Memory for Long-Context Language Modeling
arXiv CS.CL·7 de abril de 2026
Este artigo propõe LPC-SM, uma arquitetura híbrida autorregressiva para modelos de linguagem de contexto longo, que separa atenção local, memória persistente, correção preditiva e controle em tempo de execução. O modelo de 158M parâmetros é avaliado, demonstrando melhorias na perda de LM e estabilidade em sequências longas.
neural networkslanguage modelsLong Contextattention mechanismsAI architectures
Ler original ↗