RESEARCH27
Toward Reliable Design of LLM-Enabled Agentic Workflows: Optimizing Latency-Reliability-Cost Tradeoffs
arXiv CS.AI·26. Mai 2026
Dieses Papier analysiert die grundlegenden Kompromisse zwischen Latenz, Zuverlässigkeit und Kosten in LLM-gestützten Agenten-Workflows. Es führt Leistungsmodelle ein und untersucht das Design sequenzieller Workflows, wobei Ergebnisse zur Token-Zuweisung und optimalen Zuverlässigkeit vorgestellt werden.
Token allocationAgentic WorkflowsLLM-enabled agentsLatency-Reliability-Cost TradeoffsPerformance models
Original lesen ↗