RESEARCH27
SalesSim: Benchmarking and Aligning Multimodal Language Models as Retail User Simulators
arXiv CS.CL·12 de maio de 2026
SalesSim é uma estrutura e plataforma de teste para avaliar a capacidade de Modelos de Linguagem Grandes Multimodais (MLLMs) em simular o comportamento realista de clientes em conversas de varejo online. Ele mede a consistência entre as ações do simulador e as especificações da persona, revelando lacunas comportamentais em modelos de ponta.
Ler original ↗