← heapsort-ai

GLM 5.1

2 items

NEWS↑ trendingReddit r/LocalLLaMA·12/4/2026

GLM 5.1 sits alongside frontier models in my social reasoning benchmark

GLM 5.1 demuestra ser muy competitivo en razonamiento social frente a modelos de vanguardia, según un benchmark propio basado en juegos de Blood on the Clocktower. El modelo es notablemente más económico, costando $0.92 por partida en comparación con los $3.69 de Claude Opus 4.6, y tiene una tasa de error de herramienta del 0%.

GLM 5.1 sits alongside frontier models in my social reasoning benchmark
43
ARTICLE↑ trendingReddit r/LocalLLaMA·10/4/2026

GLM 5.1 crushes every other model except Opus in agentic benchmark at about 1/3 of the Opus cost

Um teste de benchmark agentic revela que o modelo GLM 5.1 alcança desempenho similar ao Opus por um terço do custo em tarefas agentic, superando outros modelos testados. O autor enfatiza a relevância de testes em ambientes reais como o OpenClaw, classificando o GLM 5.1 como um dos principais modelos para agentes atualmente.

41