ARTICLE↑ trending42
Used over a million tokens in three separate sessions to test Qwen 3.6 35b (new Multi-token Prediction version)
Reddit r/LocalLLaMA·15 mai 2026
L'auteur a testé le modèle Qwen 3.6 35b MTP localement, constatant une augmentation de vitesse de 1,5x. Il a exploré l'utilisation d'une grande fenêtre de contexte, atteignant 300k tokens avec un potentiel plus élevé.
Lire l'original ↗