RESEARCH27

Knowledge Packs: Zero-Token Knowledge Delivery via KV Cache Injection

arXiv CS.CL·7 de abril de 2026

"Knowledge Packs" propone un método de entrega de conocimiento de "token cero" para grandes modelos de lenguaje (LLMs) mediante la inyección directa de información en la caché KV. Esta técnica busca mejorar el rendimiento de los LLM y reducir los costos de inferencia al integrar eficientemente el conocimiento externo sin consumir tokens de contexto.

Knowledge Injection machine learning AI large language models KV cache

Leer original ↗