heapsort
RESEARCH29

The Readout Shortcut: Positional Number Copying Dominates Arithmetic CoT Readout in Small Language Models

arXiv CS.LG·25 de mayo de 2026

Este estudio de investigación revela que los modelos de lenguaje pequeños (LMs) ajustados por instrucción que utilizan Chain-of-Thought (CoT) para la aritmética a menudo emplean un atajo posicional, copiando el número que ocupa la última posición antes del delimitador de la respuesta. Este atajo domina, incluso si el razonamiento intermedio es correcto, afectando significativamente la precisión de la respuesta.

Leer original