heapsort
RESEARCH27

Human-in-the-Loop Contextual Bandits for Short-Term Rental Dynamic Pricing: Structural Equivalence of Historical Warm-Up and Approval-Gated Live Learning

arXiv CS.LG·3 juin 2026

Cet article présente le cadre Human-in-the-Loop Gated Bandit (HITL-GB) pour la tarification dynamique sur les marchés de la location à court terme. Il montre que les données historiques de tarification sont structurellement équivalentes aux données de préchauffage en ligne, réduisant considérablement la période de démarrage à froid pour l'apprentissage par bandits en ligne.

Lire l'original