← heapsort-ai

Qwen3.6

4 items

ARTICLE↑ trendingReddit r/LocalLLaMA·07/05/2026

why llama.cpp can’t combine speculative decode methods?

Un utilisateur se demande pourquoi les méthodes de décodage spéculatif comme MTP et N-gram ne peuvent pas être combinées simultanément dans llama.cpp, notant que N-gram apporte des améliorations significatives pour le codage agentique. Il cherche à savoir s'il s'agit d'une limitation fondamentale ou d'implémentation, et découvre que d'autres ont posé la même question.

43
NEWS↑ trendingReddit r/LocalLLaMA·07/05/2026

Qwen3.6 27B uncensored heretic v2 Native MTP Preserved is Out Now With KLD 0.0021, 6/100 Refusals and the Full 15 MTPs Preserved and Retained, Available in Safetensors, GGUFs and NVFP4s formats.

Le modèle linguistique Qwen3.6 27B uncensored heretic v2 Native MTP Preserved est désormais disponible, affichant un KLD de 0.0021 et seulement 6 refus sur 100. Il est proposé en plusieurs formats tels que Safetensors, GGUFs et NVFP4s, avec les 15 MTPs entièrement préservées et retenues.

42
ARTICLE↑ trendingReddit r/LocalLLaMA·il y a 25j

Need a second pair of eyes, this Qwen3.6 27B quant recipe consistently thinks less and is correct

L'auteur examine pourquoi une recette spécifique de quantification Qwen3.6 27B INT8 Autoround surpasse les autres, observant que le modèle "réfléchit" moins mais fournit de meilleurs résultats lors des benchmarks. Il a ensuite reproduit cette performance avec une nouvelle quantification GGUF, notant que les deux obtiennent constamment des réponses plus rapidement que l'UD Q8 K XL.

42
ARTICLE↑ trendingReddit r/LocalLLaMA·il y a 19j

Qwen3.6 35Ba3 has changed my workflows and even how I use my computer

L'auteur explique comment le modèle d'IA Qwen3.6 35Ba3 a profondément remodelé ses flux de travail de développement et son utilisation de l'ordinateur, lui permettant d'automatiser des tâches complexes et d'interagir avec le système d'exploitation en langage naturel. Cette transformation lui permet de déléguer des tâches comme le devops, la création de contenu et les tests de code à l'IA, soulignant un changement significatif de productivité.

42