heapsort
RESEARCH27

SalesSim: Benchmarking and Aligning Multimodal Language Models as Retail User Simulators

arXiv CS.CL·12 de mayo de 2026

SalesSim es un marco y banco de pruebas para evaluar Modelos de Lenguaje Grandes Multimodales (MLLMs) como simuladores realistas de usuarios minoristas en conversaciones en línea. Mide la consistencia entre las acciones del simulador y las especificaciones de la persona, identificando brechas de comportamiento en los modelos de vanguardia.

Leer original