RESEARCH27
Rethinking KV Cache Eviction via a Unified Information-Theoretic Objective
arXiv CS.LG·30. April 2026
Diese Arbeit überdenkt die KV-Cache-Eviction für LLMs mittels eines informationstheoretischen Ziels, das aus dem Informationsengpassprinzip abgeleitet wurde. Sie stellt CapKV vor, eine neue kapazitätsbewusste Methode, die Informationen bewahrt und bestehende heuristische Strategien übertrifft.
Original lesen ↗