ARTICLE↑ trending41
Bulding my own Diffusion Language Model from scratch was easier than I thought [P]
Reddit r/MachineLearning·21 de abril de 2026
O autor construiu um modelo de linguagem de difusão do zero para entender conceitos complexos, sem o auxílio de código gerado por IA. Ele treinou o modelo de 7.5M parâmetros no pequeno dataset Shakespeare e compartilhou o código no GitHub.
Ler original ↗