RESEARCHarXiv CS.LG·15d atrás
The Readout Shortcut: Positional Number Copying Dominates Arithmetic CoT Readout in Small Language Models
Este estudo de pesquisa revela que pequenos modelos de linguagem (LMs) ajustados por instrução usando Chain-of-Thought (CoT) para aritmética geralmente empregam um atalho posicional, copiando o último número antes do delimitador da resposta. Esse atalho domina, mesmo que o raciocínio intermediário esteja correto, influenciando significativamente a precisão da resposta.
29