RESEARCH29
The Readout Shortcut: Positional Number Copying Dominates Arithmetic CoT Readout in Small Language Models
arXiv CS.LG·25 de mayo de 2026
Este estudio de investigación revela que los modelos de lenguaje pequeños (LMs) ajustados por instrucción que utilizan Chain-of-Thought (CoT) para la aritmética a menudo emplean un atajo posicional, copiando el número que ocupa la última posición antes del delimitador de la respuesta. Este atajo domina, incluso si el razonamiento intermedio es correcto, afectando significativamente la precisión de la respuesta.
Leer original ↗