RESEARCH53

BenSyc: Benchmarking Conversational Sycophancy and Human Alignment in LLMs for Bengali Contexts

arXiv CS.CL·10 de junio de 2026

Esta investigación presenta BenSyc, el primer benchmark para estudiar la adulación conversacional en grandes modelos de lenguaje dentro de contextos sociales bengalíes. Evalúa más de 15 LLM en tareas de clasificación y generación de respuestas utilizando un conjunto de datos validado por humanos derivado de publicaciones de Reddit.

LLMs sycophancy human alignment benchmarking Conversational AI

Leer original ↗