RESEARCH53
BenSyc: Benchmarking Conversational Sycophancy and Human Alignment in LLMs for Bengali Contexts
arXiv CS.CL·10 de junio de 2026
Esta investigación presenta BenSyc, el primer benchmark para estudiar la adulación conversacional en grandes modelos de lenguaje dentro de contextos sociales bengalíes. Evalúa más de 15 LLM en tareas de clasificación y generación de respuestas utilizando un conjunto de datos validado por humanos derivado de publicaciones de Reddit.
Leer original ↗