RESEARCH27
Knowledge Packs: Zero-Token Knowledge Delivery via KV Cache Injection
arXiv CS.CL·7 de abril de 2026
"Knowledge Packs" propone un método de entrega de conocimiento de "token cero" para grandes modelos de lenguaje (LLMs) mediante la inyección directa de información en la caché KV. Esta técnica busca mejorar el rendimiento de los LLM y reducir los costos de inferencia al integrar eficientemente el conocimiento externo sin consumir tokens de contexto.
Leer original ↗