RESEARCH27

Knowledge Packs: Zero-Token Knowledge Delivery via KV Cache Injection

arXiv CS.CL·7 avril 2026

"Knowledge Packs" propose une méthode de livraison de connaissances "sans jeton" pour les grands modèles de langage (LLM) en injectant directement des informations dans le cache KV. Cette technique vise à améliorer les performances des LLM et à réduire les coûts d'inférence en intégrant efficacement des connaissances externes sans consommer de jetons de contexte.

Knowledge Injection machine learning AI large language models KV cache

Lire l'original ↗