RESEARCH27
The Scaling Properties of Implicit Deductive Reasoning in Transformers
arXiv CS.AI·7 mai 2026
Cet article étudie les propriétés de mise à l'échelle du raisonnement déductif implicite sur les clauses de Horn dans les Transformers à profondeur limitée. Les modèles profonds avec un masque de préfixe bidirectionnel approchent les performances explicites de CoT, bien que CoT reste nécessaire pour l'extrapolation en profondeur.
Lire l'original ↗