RESEARCH27

Toward Reliable Design of LLM-Enabled Agentic Workflows: Optimizing Latency-Reliability-Cost Tradeoffs

arXiv CS.AI·26 de maio de 2026

Este artigo analisa os compromissos fundamentais entre latência, confiabilidade e custo em fluxos de trabalho agentivos habilitados por LLMs. Ele introduz modelos de desempenho e estuda o design de fluxos de trabalho sequenciais, com resultados sobre alocação de tokens e confiabilidade ótima.

Token allocation Agentic Workflows LLM-enabled agents Latency-Reliability-Cost Tradeoffs Performance models

Ler original ↗