ARTICLE↑ trending43
PSA: Qwen3.6 ships with preserve_thinking. Make sure you have it on.
Reddit r/LocalLLaMA·16 de abril de 2026

Qwen 3.6 ahora incluye una nueva bandera `preserve_thinking` que soluciona el problema de invalidación de la caché KV al mantener el contexto de razonamiento completo del modelo. Esta funcionalidad es especialmente beneficiosa para escenarios de agentes, mejorando la consistencia de las decisiones y optimizando el consumo de tokens y la utilización de la caché KV.
Leer original ↗