heapsort
RESEARCH↑ trending44

Qwen3.6-35B-A3B-Uncensored-Wasserstein-GGUF

Reddit r/LocalLLaMA·18 de abril de 2026

Um usuário identificou e corrigiu um problema significativo de desvio de tensor nas camadas `ssm_conv1d` de modelos Qwen3.6-35B GGUF quantizados, sugerindo a métrica de Wasserstein como superior à Kullback Leibler para detectar instabilidade numérica. A correção, que visa especificamente as camadas de transição de estado recorrente responsáveis pela memória de longo contexto, está agora disponível em um modelo compartilhado.

Ler original