RESEARCH27

MemGround: Long-Term Memory Evaluation Kit for Large Language Models in Gamified Scenarios

arXiv CS.CL·17. April 2026

MemGround ist ein neuer, strenger Langzeitgedächtnis-Benchmark für LLMs, der entwickelt wurde, um die Einschränkungen statischer Bewertungen durch reichhaltige, gamifizierte interaktive Szenarien zu überwinden. Er verfügt über ein dreistufiges hierarchisches Framework zur Bewertung verschiedener Gedächtnistypen und eine mehrdimensionale Metrik-Suite zur umfassenden Quantifizierung.

evaluation gamification memory benchmark LLM

Original lesen ↗