RESEARCH27
Sleep Phase Cuts Transformer Costs by Consolidating Memory
DEV.to AI·29. Mai 2026
Ein neues Papier schlägt eine "Schlafphase" für Sprachmodelle vor, die den Kontext in festgroßen Speicher konsolidiert. Dies reduziert die quadratischen Inferenzkosten und verbessert die Leistung bei Aufgaben mit langem Horizont.
Original lesen ↗