heapsort
RESEARCH27

A Self-Attentive Meta-Optimizer with Group-Adaptive Learning Rates and Weight Decay

arXiv CS.LG·7 de maio de 2026

MetaAdamW é um novo otimizador que utiliza um mecanismo de autoatenção para ajustar dinamicamente as taxas de aprendizado e o decaimento de peso por grupo de parâmetros, superando a uniformidade de outros otimizadores. Seu módulo de atenção é treinado por um objetivo de meta-aprendizagem que integra alinhamento de gradiente, diminuição de perda e lacuna de generalização.

Ler original