heapsort
RESEARCH27

SalesSim: Benchmarking and Aligning Multimodal Language Models as Retail User Simulators

arXiv CS.CL·12 de maio de 2026

SalesSim é uma estrutura e plataforma de teste para avaliar a capacidade de Modelos de Linguagem Grandes Multimodais (MLLMs) em simular o comportamento realista de clientes em conversas de varejo online. Ele mede a consistência entre as ações do simulador e as especificações da persona, revelando lacunas comportamentais em modelos de ponta.

Ler original