Qwen3.6

4 items

ARTICLE↑ trendingReddit r/LocalLLaMA·07/05/2026

why llama.cpp can’t combine speculative decode methods?

Um usuário está investigando por que métodos de decodificação especulativa como MTP e N-grama não podem ser combinados simultaneamente em llama.cpp, observando que o N-grama oferece melhorias significativas para codificação. Ele busca entender se é uma limitação fundamental ou de implementação, descobrindo que outros já fizeram a mesma pergunta.

Optimization LLMs llama.cpp Qwen3.6

NEWS↑ trendingReddit r/LocalLLaMA·07/05/2026

Qwen3.6 27B uncensored heretic v2 Native MTP Preserved is Out Now With KLD 0.0021, 6/100 Refusals and the Full 15 MTPs Preserved and Retained, Available in Safetensors, GGUFs and NVFP4s formats.

O modelo de linguagem Qwen3.6 27B uncensored heretic v2 Native MTP Preserved foi lançado, apresentando um KLD de 0.0021 e apenas 6 recusas em 100. Ele está disponível em múltiplos formatos como Safetensors, GGUFs e NVFP4s, com todas as 15 MTPs preservadas e retidas.

uncensored AI Hugging Face Qwen3.6 model release

ARTICLE↑ trendingReddit r/LocalLLaMA·25d atrás

Need a second pair of eyes, this Qwen3.6 27B quant recipe consistently thinks less and is correct

O autor investiga por que uma receita específica de quantização Qwen3.6 27B INT8 Autoround supera outras, observando que o modelo "pensa" menos, mas oferece melhores resultados em benchmarks. Ele então replicou esse desempenho com uma nova quantização GGUF, notando que ambas consistentemente chegam às respostas mais rapidamente do que o UD Q8 K XL.

AI models Qwen3.6 Performance optimization quantization

ARTICLE↑ trendingReddit r/LocalLLaMA·19d atrás

Qwen3.6 35Ba3 has changed my workflows and even how I use my computer

O autor descreve como o modelo de IA Qwen3.6 35Ba3 transformou profundamente seus fluxos de trabalho de desenvolvimento e o uso do computador, permitindo a automação de tarefas complexas e a interação com o sistema operacional por linguagem natural. Essa mudança permite delegar tarefas como devops, criação de conteúdo e testes de código à IA, evidenciando um aumento significativo na produtividade.

Qwen3.6 natural language processing AI workflow automation