RESEARCH53
BenSyc: Benchmarking Conversational Sycophancy and Human Alignment in LLMs for Bengali Contexts
arXiv CS.CL·10 de junho de 2026
Esta pesquisa apresenta o BenSyc, o primeiro benchmark para estudar a sicofancia conversacional em grandes modelos de linguagem dentro de contextos sociais bengalis. Ele avalia mais de 15 LLMs em tarefas de classificação e geração de resposta usando um conjunto de dados validado por humanos derivado de postagens do Reddit.
Ler original ↗