← heapsort-ai

online learning

5 items

RESEARCHarXiv CS.AI·il y a 27j

OLIVIA: Online Learning via Inference-time Action Adaptation for Decision Making in LLM ReAct Agents

OLIVIA est un nouveau framework d'adaptation d'actions en temps d'inférence conçu pour les agents LLM de type ReAct, visant à améliorer la prise de décision dans les tâches séquentielles. Il offre une couche de décision explicite pour évaluer les actions candidates et une adaptation en ligne, comblant les lacunes des méthodes actuelles de manipulation indirecte du contexte.

29
RESEARCHarXiv CS.LG·il y a 6j

Human-in-the-Loop Contextual Bandits for Short-Term Rental Dynamic Pricing: Structural Equivalence of Historical Warm-Up and Approval-Gated Live Learning

Cet article présente le cadre Human-in-the-Loop Gated Bandit (HITL-GB) pour la tarification dynamique sur les marchés de la location à court terme. Il montre que les données historiques de tarification sont structurellement équivalentes aux données de préchauffage en ligne, réduisant considérablement la période de démarrage à froid pour l'apprentissage par bandits en ligne.

27
ARTICLEDEV.to AI·13/04/2026

A Learning Platform That Learns with You

De nombreux systèmes d'apprentissage en ligne ne parviennent pas à apprendre du comportement des étudiants, entraînant un manque de conseils personnalisés. La plateforme NeuroLearn (Smart Tutor) a été développée pour offrir une expérience d'apprentissage personnalisée, intégrant un tableau de bord visuel et un système de Flashcards pour favoriser le rappel actif et améliorer la rétention des connaissances.

25
NEWSDEV.to AI·02/05/2026

National Cyber Security Institute (NCSI) - Global Cybersecurity Training

Le National Cyber Security Institute (NCSI) propose des cours en ligne accrédités internationalement pour se spécialiser en Cybersécurité, Renseignement sur les Menaces et Analyse de Malware. Les programmes offrent un accès à vie, des mises à jour gratuites et un soutien expert pour faire progresser les carrières avec des certifications reconnues par l'industrie.

16