RESEARCH27
Sleep Phase Cuts Transformer Costs by Consolidating Memory
DEV.to AI·29 de maio de 2026
Um novo artigo propõe uma fase de "sono" para modelos de linguagem, consolidando o contexto em memória de tamanho fixo. Isso reduz significativamente os custos de inferência e melhora o desempenho em tarefas de longo horizonte.
Ler original ↗