heapsort
RESEARCH29

The Readout Shortcut: Positional Number Copying Dominates Arithmetic CoT Readout in Small Language Models

arXiv CS.LG·25. Mai 2026

Diese Forschungsstudie zeigt, dass kleine, anweisungsorientierte Sprachmodelle (LMs), die Chain-of-Thought (CoT) für Arithmetik verwenden, oft eine positionale Abkürzung nutzen, indem sie die Zahl kopieren, die die letzte Position vor dem Antwortbegrenzer einnimmt. Diese Abkürzung dominiert, selbst wenn die Zwischenschritte korrekt sind, was die Antwortgenauigkeit erheblich beeinflusst.

Original lesen