RESEARCH↑ trending42
Thinking Deeper, Not Longer: Depth-Recurrent Transformers for Compositional Generalization [R]
Reddit r/MachineLearning·13 avril 2026
Ce contenu discute d'un article de recherche sur les Transformers Récurents en Profondeur, soulignant ses découvertes sur la généralisation compositionnelle et hors distribution. Il explore comment la supervision des étapes intermédiaires peut nuire au raisonnement authentique des modèles d'IA, les rendant excessivement dépendants des heuristiques statistiques, un concept étendu aux modèles fondamentaux et à l'intuition humaine.
Lire l'original ↗