OLIVIA: Online Learning via Inference-time Action Adaptation for Decision Making in LLM ReAct Agents
OLIVIA ist ein neuartiges Framework zur Aktionsanpassung zur Inferenzzeit, das für ReAct-ähnliche LLM-Agenten entwickelt wurde, um die Entscheidungsfindung bei sequenziellen Aufgaben zu verbessern. Es bietet eine explizite Entscheidungsschicht zur Bewertung von Kandidatenaktionen und Online-Anpassung, wodurch die Einschränkungen indirekter Kontextmanipulation in aktuellen Methoden behoben werden.