RESEARCH↑ trending44
Qwen3.6-35B-A3B-Uncensored-Wasserstein-GGUF
Reddit r/LocalLLaMA·18 de abril de 2026
Um usuário identificou e corrigiu um problema significativo de desvio de tensor nas camadas `ssm_conv1d` de modelos Qwen3.6-35B GGUF quantizados, sugerindo a métrica de Wasserstein como superior à Kullback Leibler para detectar instabilidade numérica. A correção, que visa especificamente as camadas de transição de estado recorrente responsáveis pela memória de longo contexto, está agora disponível em um modelo compartilhado.
Ler original ↗