RESEARCH27

Toward Reliable Design of LLM-Enabled Agentic Workflows: Optimizing Latency-Reliability-Cost Tradeoffs

arXiv CS.AI·26 mai 2026

Cet article analyse les compromis fondamentaux entre la latence, la fiabilité et le coût dans les workflows agentiques basés sur les LLM. Il présente des modèles de performance et étudie la conception de workflows séquentiels, avec des résultats sur l'allocation de jetons et la fiabilité optimale.

Token allocation Agentic Workflows LLM-enabled agents Latency-Reliability-Cost Tradeoffs Performance models

Lire l'original ↗