RESEARCH27

Knowledge Packs: Zero-Token Knowledge Delivery via KV Cache Injection

arXiv CS.CL·7. April 2026

"Knowledge Packs" stellt eine Methode zur "Zero-Token"-Wissensbereitstellung für große Sprachmodelle (LLMs) vor, indem Informationen direkt in den KV-Cache injiziert werden. Diese Technik zielt darauf ab, die LLM-Leistung zu verbessern und Inferenzkosten zu senken, indem externes Wissen effizient ohne Kontext-Tokens integriert wird.

Knowledge Injection machine learning AI large language models KV cache

Original lesen ↗