ARTICLE↑ trending42

Used over a million tokens in three separate sessions to test Qwen 3.6 35b (new Multi-token Prediction version)

Reddit r/LocalLLaMA·15 mai 2026

L'auteur a testé le modèle Qwen 3.6 35b MTP localement, constatant une augmentation de vitesse de 1,5x. Il a exploré l'utilisation d'une grande fenêtre de contexte, atteignant 300k tokens avec un potentiel plus élevé.

LLMs Benchmarking Local AI Qwen performance

Lire l'original ↗