OLIVIA: Online Learning via Inference-time Action Adaptation for Decision Making in LLM ReAct Agents
OLIVIA es un nuevo framework de adaptación de acciones en tiempo de inferencia diseñado para agentes LLM estilo ReAct, con el objetivo de mejorar la toma de decisiones en tareas secuenciales. Ofrece una capa de decisión explícita para puntuar acciones candidatas y adaptación en línea, abordando las limitaciones de la manipulación indirecta del contexto en los métodos actuales.