RESEARCHarXiv CS.AI·hace 14d
Toward Reliable Design of LLM-Enabled Agentic Workflows: Optimizing Latency-Reliability-Cost Tradeoffs
Este artículo analiza las compensaciones fundamentales entre latencia, fiabilidad y costo en flujos de trabajo agentivos habilitados por LLM. Introduce modelos de rendimiento y estudia el diseño de flujos de trabajo secuenciales, con resultados sobre asignación de tokens y fiabilidad óptima.
27