RESEARCHarXiv CS.AI·14d atrás
Toward Reliable Design of LLM-Enabled Agentic Workflows: Optimizing Latency-Reliability-Cost Tradeoffs
Este artigo analisa os compromissos fundamentais entre latência, confiabilidade e custo em fluxos de trabalho agentivos habilitados por LLMs. Ele introduz modelos de desempenho e estuda o design de fluxos de trabalho sequenciais, com resultados sobre alocação de tokens e confiabilidade ótima.
27