heapsort-ai
NEWS↑ trending43

GLM 5.1 sits alongside frontier models in my social reasoning benchmark

Reddit r/LocalLLaMA·12 de abril de 2026

GLM 5.1 mostra-se muito competitivo em raciocínio social contra modelos de fronteira, utilizando um benchmark baseado em jogos de Blood on the Clocktower. O modelo apresenta um custo significativamente menor por jogo ($0.92) em comparação com Claude Opus 4.6 ($3.69), com 0% de taxa de erro de ferramenta.

AI BenchmarkSocial ReasoningBlood on the ClocktowerGLM 5.1LLM
Ler original