RESEARCHDEV.to AI·18d atrás
Distilled Agentic Workflow Runs at 100x Lower Inference Cost
Um novo artigo da @dair_ai demonstra que um fluxo de trabalho agêntico completo pode ser destilado em pesos de modelo, resultando em um custo de inferência aproximadamente 100 vezes menor. Este avanço aponta para uma potencial mudança na forma como os agentes de IA autônomos são implantados em escala.
27