RESEARCH53

BenSyc: Benchmarking Conversational Sycophancy and Human Alignment in LLMs for Bengali Contexts

arXiv CS.CL·10 de junho de 2026

Esta pesquisa apresenta o BenSyc, o primeiro benchmark para estudar a sicofancia conversacional em grandes modelos de linguagem dentro de contextos sociais bengalis. Ele avalia mais de 15 LLMs em tarefas de classificação e geração de resposta usando um conjunto de dados validado por humanos derivado de postagens do Reddit.

LLMs sycophancy human alignment benchmarking Conversational AI

Ler original ↗