RESEARCH27

Toward Reliable Design of LLM-Enabled Agentic Workflows: Optimizing Latency-Reliability-Cost Tradeoffs

arXiv CS.AI·26. Mai 2026

Dieses Papier analysiert die grundlegenden Kompromisse zwischen Latenz, Zuverlässigkeit und Kosten in LLM-gestützten Agenten-Workflows. Es führt Leistungsmodelle ein und untersucht das Design sequenzieller Workflows, wobei Ergebnisse zur Token-Zuweisung und optimalen Zuverlässigkeit vorgestellt werden.

Token allocation Agentic Workflows LLM-enabled agents Latency-Reliability-Cost Tradeoffs Performance models

Original lesen ↗