heapsort
NEWS↑ trending43

GLM 5.1 sits alongside frontier models in my social reasoning benchmark

Reddit r/LocalLLaMA·12. April 2026
GLM 5.1 sits alongside frontier models in my social reasoning benchmark

GLM 5.1 erweist sich in sozialem Denken als äußerst konkurrenzfähig gegenüber Spitzenmodellen, basierend auf einem benutzerdefinierten Benchmark mit autonomen Blood on the Clocktower-Spielen. Es bietet eine erhebliche Kosteneffizienz von 0,92 $ pro Spiel im Vergleich zu Claude Opus 4.6s 3,69 $, bei einer Werkzeugfehlerquote von 0 %.

Original lesen