← heapsort-ai

online learning

5 items

RESEARCHarXiv CS.AI·vor 27T

OLIVIA: Online Learning via Inference-time Action Adaptation for Decision Making in LLM ReAct Agents

OLIVIA ist ein neuartiges Framework zur Aktionsanpassung zur Inferenzzeit, das für ReAct-ähnliche LLM-Agenten entwickelt wurde, um die Entscheidungsfindung bei sequenziellen Aufgaben zu verbessern. Es bietet eine explizite Entscheidungsschicht zur Bewertung von Kandidatenaktionen und Online-Anpassung, wodurch die Einschränkungen indirekter Kontextmanipulation in aktuellen Methoden behoben werden.

29
RESEARCHarXiv CS.LG·vor 6T

Human-in-the-Loop Contextual Bandits for Short-Term Rental Dynamic Pricing: Structural Equivalence of Historical Warm-Up and Approval-Gated Live Learning

Dieses Papier stellt das Human-in-the-Loop Gated Bandit (HITL-GB) Framework für die dynamische Preisgestaltung in kurzfristigen Mietmärkten vor. Es zeigt, dass historische Preisdaten strukturell äquivalent zu On-Policy-Warm-up-Daten sind, was die Kaltstartperiode für Online-Banditen-Lernalgorithmen erheblich verkürzt.

27
ARTICLEDEV.to AI·4/13/2026

A Learning Platform That Learns with You

Viele Online-Lernsysteme versagen dabei, wirklich aus dem Verhalten der Studierenden zu lernen, was zu einem Mangel an personalisierter Anleitung führt. Die NeuroLearn (Smart Tutor)-Plattform wurde entwickelt, um ein maßgeschneidertes Lernerlebnis zu bieten, indem sie ein visuelles Dashboard und ein Karteikartensystem integriert, um aktives Abrufen zu fördern und die Wissenserhaltung zu verbessern.

25