← heapsort-ai

CoT

1 items

RESEARCHarXiv CS.LG·vor 15T

The Readout Shortcut: Positional Number Copying Dominates Arithmetic CoT Readout in Small Language Models

Diese Forschungsstudie zeigt, dass kleine, anweisungsorientierte Sprachmodelle (LMs), die Chain-of-Thought (CoT) für Arithmetik verwenden, oft eine positionale Abkürzung nutzen, indem sie die Zahl kopieren, die die letzte Position vor dem Antwortbegrenzer einnimmt. Diese Abkürzung dominiert, selbst wenn die Zwischenschritte korrekt sind, was die Antwortgenauigkeit erheblich beeinflusst.

29