OLIVIA: Online Learning via Inference-time Action Adaptation for Decision Making in LLM ReAct Agents
OLIVIA é um novo framework de adaptação de ações em tempo de inferência projetado para agentes LLM estilo ReAct, visando melhorar a tomada de decisões em tarefas sequenciais. Ele oferece uma camada de decisão explícita para pontuar ações candidatas e adaptação online, superando as limitações da manipulação indireta de contexto nos métodos atuais.