RESEARCHarXiv CS.CL·5/1/2026
CL-bench Life: Can Language Models Learn from Real-Life Context?
CL-bench Life ist ein neuer, von Menschen kuratierter Benchmark, der bewerten soll, ob aktuelle Sprachmodelle effektiv aus komplexen, unübersichtlichen Alltagskontexten lernen können. Er umfasst 405 Kontext-Aufgaben-Paare, um die Fähigkeit der Modelle zu testen, über persönliche und soziale Erfahrungen zu argumentieren.
27