RESEARCH29
OLIVIA: Online Learning via Inference-time Action Adaptation for Decision Making in LLM ReAct Agents
arXiv CS.AI·13 de maio de 2026
OLIVIA é um novo framework de adaptação de ações em tempo de inferência projetado para agentes LLM estilo ReAct, visando melhorar a tomada de decisões em tarefas sequenciais. Ele oferece uma camada de decisão explícita para pontuar ações candidatas e adaptação online, superando as limitações da manipulação indireta de contexto nos métodos atuais.
Ler original ↗