heapsort
RESEARCH53

BenSyc: Benchmarking Conversational Sycophancy and Human Alignment in LLMs for Bengali Contexts

arXiv CS.CL·10 juin 2026

Cette recherche introduit BenSyc, le premier benchmark pour étudier la sycophanie conversationnelle dans les grands modèles de langage au sein des contextes sociaux bengalis. Il évalue plus de 15 LLM sur des tâches de classification et de génération de réponses à l'aide d'un ensemble de données validé par des humains provenant de publications Reddit.

Lire l'original