← heapsort-ai

online learning

5 items

RESEARCHarXiv CS.AI·27d atrás

OLIVIA: Online Learning via Inference-time Action Adaptation for Decision Making in LLM ReAct Agents

OLIVIA é um novo framework de adaptação de ações em tempo de inferência projetado para agentes LLM estilo ReAct, visando melhorar a tomada de decisões em tarefas sequenciais. Ele oferece uma camada de decisão explícita para pontuar ações candidatas e adaptação online, superando as limitações da manipulação indireta de contexto nos métodos atuais.

29
RESEARCHarXiv CS.LG·6d atrás

Human-in-the-Loop Contextual Bandits for Short-Term Rental Dynamic Pricing: Structural Equivalence of Historical Warm-Up and Approval-Gated Live Learning

Este artigo apresenta o framework Human-in-the-Loop Gated Bandit (HITL-GB) para precificação dinâmica em mercados de aluguel de curto prazo. Ele mostra que dados históricos de precificação podem ser estruturalmente equivalentes a dados de aquecimento on-policy, diminuindo significativamente o período de "cold-start" para aprendizado online de bandits.

27
ARTICLEDEV.to AI·13/04/2026

A Learning Platform That Learns with You

Muitos sistemas de aprendizagem online falham em aprender com o comportamento do aluno, resultando na falta de orientação personalizada. A plataforma NeuroLearn (Smart Tutor) foi desenvolvida para oferecer uma experiência de aprendizado customizada, utilizando um painel visual e um sistema de Flashcards para promover o recall ativo e melhorar a retenção do conhecimento.

25