heapsort
RESEARCH29

The Readout Shortcut: Positional Number Copying Dominates Arithmetic CoT Readout in Small Language Models

arXiv CS.LG·25 mai 2026

Cette étude de recherche révèle que les petits modèles de langage (LMs) ajustés par instruction utilisant le Chain-of-Thought (CoT) pour l'arithmétique emploient souvent un raccourci positionnel, copiant le dernier nombre avant le délimiteur de réponse. Ce raccourci domine, même si le raisonnement intermédiaire est correct, influençant significativement la précision de la réponse.

Lire l'original