RESEARCH27
Knowledge Packs: Zero-Token Knowledge Delivery via KV Cache Injection
arXiv CS.CL·7 avril 2026
"Knowledge Packs" propose une méthode de livraison de connaissances "sans jeton" pour les grands modèles de langage (LLM) en injectant directement des informations dans le cache KV. Cette technique vise à améliorer les performances des LLM et à réduire les coûts d'inférence en intégrant efficacement des connaissances externes sans consommer de jetons de contexte.
Lire l'original ↗