RESEARCH27
Latent Cache Flow: Model-to-Model Communication Without Text
arXiv CS.LG·25 de mayo de 2026
Se introduce Latent Cache Flow (LCF) como un nuevo método para la comunicación eficiente de modelo a modelo, abordando la latencia y la pérdida de información en la comunicación de agentes LLM basada en texto. LCF traduce y comprime conjuntamente claves y valores, reduciendo significativamente el tamaño del adaptador y transmitiendo un resumen de nueva información para contextos diferentes.
Leer original ↗