heapsort
RESEARCH↑ trending42

Built an political benchmark for LLMs. KIMI K2 can't answer about Taiwan (Obviously). GPT-5.3 refuses 100% of questions when given an opt-out. [P]

Reddit r/MachineLearning·16. April 2026

Ein Forscher entwickelte einen Benchmark, um LLMs anhand von 98 Fragen auf einem 2D-Politkompass abzubilden, und stellte dabei fest, dass die Verweigerung einer Antwort eine politische Haltung ist. Erste Ergebnisse umfassen GPT-5.3, Claude Opus 4.6 und KIMI K2, wobei das Repository vollständig quelloffen ist.

Original lesen