ARTICLE↑ trending41
Bulding my own Diffusion Language Model from scratch was easier than I thought [P]
Reddit r/MachineLearning·21 avril 2026
L'auteur a construit un modèle de langage de diffusion à partir de zéro pour mieux comprendre des concepts complexes, sans l'aide de code généré par l'IA. Il a entraîné le modèle de 7,5M de paramètres sur le petit jeu de données de Shakespeare et a partagé le code sur GitHub.
Lire l'original ↗