RESEARCH27

Latent Cache Flow: Model-to-Model Communication Without Text

arXiv CS.LG·25 mai 2026

Latent Cache Flow (LCF) est présenté comme une nouvelle méthode pour une communication efficace de modèle à modèle, résolvant la latence et la perte d'informations de la communication textuelle des agents LLM. LCF traduit et compresse conjointement les clés et les valeurs, réduisant considérablement la taille de l'adaptateur et transmettant un résumé des nouvelles informations pour des contextes différents.

research machine learning AI Communication LLM

Lire l'original ↗