heapsort
RESEARCH27

Latent Cache Flow: Model-to-Model Communication Without Text

arXiv CS.LG·25 de mayo de 2026

Se introduce Latent Cache Flow (LCF) como un nuevo método para la comunicación eficiente de modelo a modelo, abordando la latencia y la pérdida de información en la comunicación de agentes LLM basada en texto. LCF traduce y comprime conjuntamente claves y valores, reduciendo significativamente el tamaño del adaptador y transmitiendo un resumen de nueva información para contextos diferentes.

Leer original