RESEARCH↑ trending42

Built an political benchmark for LLMs. KIMI K2 can't answer about Taiwan (Obviously). GPT-5.3 refuses 100% of questions when given an opt-out. [P]

Reddit r/MachineLearning·16 avril 2026

Un chercheur a créé un benchmark pour cartographier les LLM sur un compas politique 2D avec 98 questions, constatant que le refus de répondre est une position politique. Les premiers résultats incluent GPT-5.3, Claude Opus 4.6 et KIMI K2, et le dépôt est entièrement open-source.

LLMs political-bias Benchmarking AI ethics

Lire l'original ↗