RESEARCH27
Toward Reliable Design of LLM-Enabled Agentic Workflows: Optimizing Latency-Reliability-Cost Tradeoffs
arXiv CS.AI·26 de maio de 2026
Este artigo analisa os compromissos fundamentais entre latência, confiabilidade e custo em fluxos de trabalho agentivos habilitados por LLMs. Ele introduz modelos de desempenho e estuda o design de fluxos de trabalho sequenciais, com resultados sobre alocação de tokens e confiabilidade ótima.
Token allocationAgentic WorkflowsLLM-enabled agentsLatency-Reliability-Cost TradeoffsPerformance models
Ler original ↗