heapsort
RESEARCH27

Cultural Benchmarking of LLMs in Standard and Dialectal Arabic Dialogues

arXiv CS.CL·4 de maio de 2026

Um novo trabalho aborda a lacuna na avaliação do raciocínio cultural em LLMs, introduzindo o ArabCulture-Dialogue, um conjunto de dados conversacionais culturalmente fundamentado que abrange 13 países de língua árabe. As experiências revelam que os modelos apresentam pior desempenho em tarefas de raciocínio cultural, tradução e geração em configurações dialetais em comparação com o árabe padrão moderno.

Ler original