RESEARCH27
BehaviorBench: Modeling Real-World User Decisions from Behavioral Traces
arXiv CS.AI·3 de junio de 2026
Este artículo presenta BehaviorBench, un nuevo benchmark para evaluar el modelado de decisiones personalizadas a partir de rastros de comportamiento del mundo real. Reconstruye historiales de decisiones a nivel de cartera a partir de registros públicos de mercados de predicción y datos en cadena, organizando tareas de predicción de creencias y predicción de transacciones.
Leer original ↗