RESEARCH53
BenSyc: Benchmarking Conversational Sycophancy and Human Alignment in LLMs for Bengali Contexts
arXiv CS.CL·10 juin 2026
Cette recherche introduit BenSyc, le premier benchmark pour étudier la sycophanie conversationnelle dans les grands modèles de langage au sein des contextes sociaux bengalis. Il évalue plus de 15 LLM sur des tâches de classification et de génération de réponses à l'aide d'un ensemble de données validé par des humains provenant de publications Reddit.
Lire l'original ↗