RESEARCH27

CL-bench Life: Can Language Models Learn from Real-Life Context?

arXiv CS.CL·1 mai 2026

CL-bench Life est un nouveau benchmark humain conçu pour évaluer si les modèles de langage de pointe peuvent apprendre efficacement des contextes complexes et désordonnés de la vie réelle. Il comprend 405 paires contexte-tâche pour tester la capacité des modèles à raisonner sur des expériences personnelles et sociales.

context-learning language models Benchmarks

Lire l'original ↗