← heapsort-ai

Multimodal Language Models

1 items

RESEARCHarXiv CS.CL·hace 28d

SalesSim: Benchmarking and Aligning Multimodal Language Models as Retail User Simulators

SalesSim es un marco y banco de pruebas para evaluar Modelos de Lenguaje Grandes Multimodales (MLLMs) como simuladores realistas de usuarios minoristas en conversaciones en línea. Mide la consistencia entre las acciones del simulador y las especificaciones de la persona, identificando brechas de comportamiento en los modelos de vanguardia.

27