ARTICLE↑ trending42
Nanochat vs Llama for training from scratch? [P]
Reddit r/MachineLearning·24 de abril de 2026
El usuario está entrenando un modelo de IA desde cero y busca consejo sobre la mejor arquitectura, considerando cambiar de Nanochat (que carece de compatibilidad con Transformers) a la arquitectura Llama. El objetivo es un proyecto de código abierto con un conjunto de datos nuevo y más grande, a pesar de las ventajas de Nanochat.
Leer original ↗