RESEARCH↑ trending42

Thinking Deeper, Not Longer: Depth-Recurrent Transformers for Compositional Generalization [R]

Reddit r/MachineLearning·13 de abril de 2026

Este conteúdo discute um artigo de pesquisa sobre Transformers Recorrentes em Profundidade, destacando suas descobertas sobre generalização composicional e fora da distribuição. Ele explora como a supervisão de etapas intermediárias pode prejudicar o raciocínio genuíno em modelos de IA, tornando-os excessivamente dependentes de heurísticas estatísticas, um conceito estendido a modelos de base e à intuição humana.

OOD Generalization Compositional Generalization AI Reasoning Intermediate Supervision Transformers

Ler original ↗