RESEARCH27
CL-bench Life: Can Language Models Learn from Real-Life Context?
arXiv CS.CL·1. Mai 2026
CL-bench Life ist ein neuer, von Menschen kuratierter Benchmark, der bewerten soll, ob aktuelle Sprachmodelle effektiv aus komplexen, unübersichtlichen Alltagskontexten lernen können. Er umfasst 405 Kontext-Aufgaben-Paare, um die Fähigkeit der Modelle zu testen, über persönliche und soziale Erfahrungen zu argumentieren.
Original lesen ↗