heapsort
RESEARCH29

OLIVIA: Online Learning via Inference-time Action Adaptation for Decision Making in LLM ReAct Agents

arXiv CS.AI·13 de maio de 2026

OLIVIA é um novo framework de adaptação de ações em tempo de inferência projetado para agentes LLM estilo ReAct, visando melhorar a tomada de decisões em tarefas sequenciais. Ele oferece uma camada de decisão explícita para pontuar ações candidatas e adaptação online, superando as limitações da manipulação indireta de contexto nos métodos atuais.

Ler original