heapsort
RESEARCH27

More Thinking, More Bias: Length-Driven Position Bias in Reasoning Models

arXiv CS.AI·11 de mayo de 2026

Una nueva investigación revela que el sesgo de posición en modelos de razonamiento, como Chain-of-thought, escala con la longitud de la trayectoria de razonamiento. Este efecto se observó en múltiples configuraciones de modelos y benchmarks, sugiriendo que "pensar más" puede exacerbar ciertos sesgos.

Leer original