ARTICLE↑ trending42
Nanochat vs Llama for training from scratch? [P]
Reddit r/MachineLearning·24 avril 2026
L'utilisateur entraîne un modèle d'IA à partir de zéro et demande conseil sur la meilleure architecture, envisageant de passer de Nanochat (qui manque de compatibilité Transformers) à l'architecture Llama. L'objectif est un projet open source avec un nouvel ensemble de données plus grand, malgré les avantages de Nanochat.
Lire l'original ↗