RESEARCH27
SalesSim: Benchmarking and Aligning Multimodal Language Models as Retail User Simulators
arXiv CS.CL·12 de mayo de 2026
SalesSim es un marco y banco de pruebas para evaluar Modelos de Lenguaje Grandes Multimodales (MLLMs) como simuladores realistas de usuarios minoristas en conversaciones en línea. Mide la consistencia entre las acciones del simulador y las especificaciones de la persona, identificando brechas de comportamiento en los modelos de vanguardia.
Leer original ↗