heapsort
RESEARCH27

Cultural Benchmarking of LLMs in Standard and Dialectal Arabic Dialogues

arXiv CS.CL·4 mai 2026

Une nouvelle recherche comble le manque d'évaluation du raisonnement culturel dans les LLM en introduisant ArabCulture-Dialogue, un ensemble de données conversationnelles culturellement ancré couvrant 13 pays arabophones. Les expériences montrent que les modèles sont moins performants sur les tâches de raisonnement culturel, de traduction et de génération dans des contextes dialectaux par rapport à l'arabe standard moderne.

Lire l'original