← heapsort-ai

Arithmetic

1 items

RESEARCHarXiv CS.LG·15d atrás

The Readout Shortcut: Positional Number Copying Dominates Arithmetic CoT Readout in Small Language Models

Este estudo de pesquisa revela que pequenos modelos de linguagem (LMs) ajustados por instrução usando Chain-of-Thought (CoT) para aritmética geralmente empregam um atalho posicional, copiando o último número antes do delimitador da resposta. Esse atalho domina, mesmo que o raciocínio intermediário esteja correto, influenciando significativamente a precisão da resposta.

29