RESEARCHarXiv CS.CL·29d atrás
SalesSim: Benchmarking and Aligning Multimodal Language Models as Retail User Simulators
SalesSim é uma estrutura e plataforma de teste para avaliar a capacidade de Modelos de Linguagem Grandes Multimodais (MLLMs) em simular o comportamento realista de clientes em conversas de varejo online. Ele mede a consistência entre as ações do simulador e as especificações da persona, revelando lacunas comportamentais em modelos de ponta.
27