← heapsort-ai

contextual bandits

1 items

RESEARCHarXiv CS.LG·hace 6d

Human-in-the-Loop Contextual Bandits for Short-Term Rental Dynamic Pricing: Structural Equivalence of Historical Warm-Up and Approval-Gated Live Learning

Este artículo introduce el framework Human-in-the-Loop Gated Bandit (HITL-GB) para la fijación de precios dinámica en mercados de alquiler a corto plazo. Demuestra que los datos históricos de precios son estructuralmente equivalentes a los datos de calentamiento en política, reduciendo drásticamente el período de arranque en frío para el aprendizaje de bandidos en línea.

27