RESEARCH↑ trending42

Thinking Deeper, Not Longer: Depth-Recurrent Transformers for Compositional Generalization [R]

Reddit r/MachineLearning·13 de abril de 2026

Este contenido analiza un artículo de investigación sobre Transformers Recurrentes en Profundidad, destacando sus hallazgos sobre la generalización composicional y fuera de distribución. Explora cómo la supervisión de pasos intermedios puede obstaculizar el razonamiento genuino en los modelos de IA, haciéndolos demasiado dependientes de heurísticas estadísticas, un concepto extendido a los modelos fundacionales y la intuición humana.

OOD Generalization Compositional Generalization AI Reasoning Intermediate Supervision Transformers

Leer original ↗