RESEARCH29

OLIVIA: Online Learning via Inference-time Action Adaptation for Decision Making in LLM ReAct Agents

arXiv CS.AI·13 mai 2026

OLIVIA est un nouveau framework d'adaptation d'actions en temps d'inférence conçu pour les agents LLM de type ReAct, visant à améliorer la prise de décision dans les tâches séquentielles. Il offre une couche de décision explicite pour évaluer les actions candidates et une adaptation en ligne, comblant les lacunes des méthodes actuelles de manipulation indirecte du contexte.

AI models Decision Making LLM Agents ReAct online learning

Lire l'original ↗