heapsort
RESEARCH29

The Readout Shortcut: Positional Number Copying Dominates Arithmetic CoT Readout in Small Language Models

arXiv CS.LG·25 de maio de 2026

Este estudo de pesquisa revela que pequenos modelos de linguagem (LMs) ajustados por instrução usando Chain-of-Thought (CoT) para aritmética geralmente empregam um atalho posicional, copiando o último número antes do delimitador da resposta. Esse atalho domina, mesmo que o raciocínio intermediário esteja correto, influenciando significativamente a precisão da resposta.

Ler original