NEWS↑ trending51
Introducing AutoMuon, a one line drop in for AdamW [P]
Reddit r/MachineLearning·26 de abril de 2026
Foi lançado o AutoMuon, um pacote Python que permite usar o otimizador Muon como substituto do AdamW em pipelines de treinamento PyTorch. Ele automatiza a escolha do otimizador correto para cada parâmetro, combinando Muon para matrizes de peso e AdamW para outros componentes do modelo.
deep learningoptimizerpython packagepytorch
Ler original ↗