← heapsort-ai

Token allocation

1 items

RESEARCHarXiv CS.AI·14d atrás

Toward Reliable Design of LLM-Enabled Agentic Workflows: Optimizing Latency-Reliability-Cost Tradeoffs

Este artigo analisa os compromissos fundamentais entre latência, confiabilidade e custo em fluxos de trabalho agentivos habilitados por LLMs. Ele introduz modelos de desempenho e estuda o design de fluxos de trabalho sequenciais, com resultados sobre alocação de tokens e confiabilidade ótima.

27