ARTICLE↑ trending43
PSA: Qwen3.6 ships with preserve_thinking. Make sure you have it on.
Reddit r/LocalLLaMA·16. April 2026

Qwen 3.6 wird jetzt mit einem neuen `preserve_thinking`-Flag ausgeliefert, das das Problem der KV-Cache-Invalidierung durch Beibehaltung des vollständigen Argumentationskontexts des Modells behebt. Diese Funktion ist besonders vorteilhaft für Agenten-Szenarien, da sie die Entscheidungskonsistenz verbessert und den Token-Verbrauch sowie die KV-Cache-Nutzung optimiert.
Original lesen ↗