RESEARCHarXiv CS.CL·vor 28T
SalesSim: Benchmarking and Aligning Multimodal Language Models as Retail User Simulators
SalesSim ist ein Framework und Testbett zur Bewertung der Fähigkeit multimodaler großer Sprachmodelle (MLLMs), realistische, personengetriebene Kundenverhalten in Online-Einzelhandelsgesprächen zu simulieren. Es misst die Konsistenz zwischen den Aktionen des Simulators und den Personenspezifikationen und deckt Verhaltenslücken in führenden Modellen auf.
27