ARTICLE↑ trending43

PSA: Qwen3.6 ships with preserve_thinking. Make sure you have it on.

Reddit r/LocalLLaMA·16 de abril de 2026

O Qwen 3.6 agora inclui uma nova flag `preserve_thinking` que resolve o problema de invalidação do cache KV ao manter o contexto de raciocínio do modelo. Esta funcionalidade é particularmente benéfica para cenários de agentes, melhorando a consistência das decisões e otimizando o consumo de tokens e a utilização do cache KV.

large language models model optimization Qwen AI agents

Ler original ↗