heapsort
RESEARCH27

Rethinking KV Cache Eviction via a Unified Information-Theoretic Objective

arXiv CS.LG·30. April 2026

Diese Arbeit überdenkt die KV-Cache-Eviction für LLMs mittels eines informationstheoretischen Ziels, das aus dem Informationsengpassprinzip abgeleitet wurde. Sie stellt CapKV vor, eine neue kapazitätsbewusste Methode, die Informationen bewahrt und bestehende heuristische Strategien übertrifft.

Original lesen