RESEARCH27
Knowledge Packs: Zero-Token Knowledge Delivery via KV Cache Injection
arXiv CS.CL·7. April 2026
"Knowledge Packs" stellt eine Methode zur "Zero-Token"-Wissensbereitstellung für große Sprachmodelle (LLMs) vor, indem Informationen direkt in den KV-Cache injiziert werden. Diese Technik zielt darauf ab, die LLM-Leistung zu verbessern und Inferenzkosten zu senken, indem externes Wissen effizient ohne Kontext-Tokens integriert wird.
Original lesen ↗