RESEARCH27
More Thinking, More Bias: Length-Driven Position Bias in Reasoning Models
arXiv CS.AI·11. Mai 2026
Eine neue Forschung zeigt, dass die Positionsverzerrung in Schlussfolgerungsmodellen, wie Chain-of-thought, mit der Länge der Schlussfolgerungstrajektorie skaliert. Dieser Effekt wurde über verschiedene Modellkonfigurationen und Benchmarks hinweg beobachtet, was darauf hindeutet, dass „mehr Nachdenken“ bestimmte Verzerrungen verstärken kann.
Original lesen ↗